استارتاپ LiveKit، که موتور محرک قابلیتهای صوتی پیشرفته OpenAI است، با جذب سرمایهی جدید رسماً به جمع “یونیکورنها” پیوست و ارزش آن از مرز ۱ میلیارد دلار عبور کرد. این اتفاق نشاندهندهی جهش عظیم صنعت به سمت رابطهای کاربری صوتی و تعاملی است.
انفجار در دره سیلیکون؛ صدا، فرمانروای جدید
طبق گزارشهای رسیده به تحریریه سایت خبری هوش روز، شرکت LiveKit موفق شده است در دور تامین سرمایه سری B، مبلغ قابل توجهی را جذب کند که ارزش این کمپانی را به حدود ۱.۱ میلیارد دلار رسانده است. این دور سرمایهگذاری به رهبری Altimeter Capital انجام شد؛ همان سرمایهگذاری که روی غولهایی مثل Snowflake و Meta شرطبندی کرده بود.
اما چرا LiveKit اینقدر مهم است؟ اگر تا به حال از قابلیت “Advanced Voice Mode” در ChatGPT استفاده کردهاید و از سرعت و لحن طبیعی آن شگفتزده شدهاید، باید بدانید که جادوی اصلی در زیرساختهای LiveKit اتفاق میافتد.
تحلیل آرمان فاضلی: چرا LiveKit یک “تغییردهنده بازی” است؟
به عنوان خبرنگار فناوری در HooshRooz که سالهاست روی زیرساختهای ابری تمرکز دارم، معتقدم LiveKit کاری را با “صدا” میکند که Twilio با “پیامک” انجام داد.
نظر شخصی من این است که بزرگترین مشکل هوش مصنوعی صوتی تا قبل از این، “تاخیر” (Latency) بود. شما حرف میزدید، ۳ ثانیه صبر میکردید تا جواب بیاید. این حسِ مکالمه را میکشت. LiveKit با بهینهسازی پروتکلهای WebRTC، این تاخیر را به میلیثانیه رسانده است. حالا ماشینها وسط حرف شما میپرند، مکث میکنند و مثل انسان میشنوند.
جدول: تفاوت LiveKit با سرویسهای سنتی
برای درک بهتر بزرگی کاری که این تیم انجام داده، نگاهی به جدول زیر که در واحد فنی سایت اخبار هوش مصنوعی هوش روز تهیه شده بیندازید:
| ویژگی | سیستمهای قدیمی (Legacy) | سیستم LiveKit (نسل جدید) |
|---|---|---|
| تاخیر (Latency) | ۲ تا ۵ ثانیه (کند و مصنوعی) | زیر ۵۰۰ میلیثانیه (Real-time) |
| تعامل | نوبتی (شما حرف بزنید، بعد ربات) | همزمان (قابلیت قطع کردن حرف همدیگر) |
| زیرساخت | متکی به APIهای جداگانه | پایپلاین یکپارچه صوتی/تصویری |
| کاربرد اصلی | دستیارهای صوتی ساده | ایجنتهای هوشمند، پشتیبانی زنده، بازی |

اتحاد استراتژیک با OpenAI
نکتهای که ارزش LiveKit را دوچندان میکند، شراکت عمیق آنها با OpenAI است. سم آلتمن و تیمش برای اینکه بتوانند مدل GPT-4o را با قابلیت صوتی بلادرنگ عرضه کنند، به زیرساختی نیاز داشتند که زیر بار ترافیک میلیونی کاربران کمر خم نکند. آنها LiveKit را انتخاب کردند.
یک آمار جذاب: طبق دادههای منتشر شده، پلتفرم LiveKit در حال حاضر روزانه میلیونها دقیقه مکالمه صوتی و تصویری را برای توسعهدهندگان سراسر جهان پردازش میکند.
راوس دیسا، مدیرعامل LiveKit میگوید: «ما میخواهیم به هر توسعهدهندهای اجازه دهیم که تجربهای شبیه به فیلم “Her” را برای کاربرانش بسازد، نه فقط غولهای تکنولوژی.»

آیندهای که میشنود و میبیند
در اخبار جدید هوش مصنوعی، ما شاهد یک شیفت پارادایم هستیم. تا دیروز همه به دنبال “چت متنی” بودند، اما امروز “چت صوتی و تصویری” ترند اصلی است. سرمایهگذاران با تزریق پول به LiveKit، در واقع روی آیندهای شرط بستهاند که در آن کیبوردها کمرنگ میشوند و ما با کامپیوترها حرف میزنیم.
این شرکت اعلام کرده که سرمایه جدید را صرف گسترش شبکه جهانی سرورهای خود و توسعه قابلیتهای “هوش مصنوعی چندوجهی” (Multimodal AI) خواهد کرد.
فرصتی برای توسعهدهندگان ایرانی؟
اگر برنامهنویس یا مدیر محصول هستید، ظهور LiveKit خبر مهمی برای شماست. ابزارهای این شرکت اپنسورس (در هسته اصلی) هستند و به شما اجازه میدهند اپلیکیشنهای خود را به قابلیتهای صوتی پیشرفته مجهز کنید.
برای پیگیری لحظهای این تحولات و دریافت تحلیلهای عمیقتر، سایت اخبار هوش مصنوعی هوش روز را دنبال کنید. ما صدای آینده را زودتر از بقیه به گوش شما میرسانیم.
سوالات متداول
با جذب سرمایه جدید، ارزش لایو کیت از مرز ۱ میلیارد دلار گذشت و این شرکت رسماً به جمع یونیکورنهای صنعت هوش مصنوعی پیوست.
لایو کیت تأمینکننده زیرساخت اصلی برای قابلیت «حالت صوتی پیشرفته» (Advanced Voice Mode) در ChatGPT است.
کاهش تاخیر مکالمه به زیر ۵۰۰ میلیثانیه که امکان گفتگوی بلادرنگ، طبیعی و پریدن وسط حرف هوش مصنوعی را فراهم میکند.
این دور سرمایهگذاری (سری B) توسط شرکت معتبر Altimeter Capital رهبری شد که سابقه سرمایهگذاری در متا را نیز دارد.