موتور صوتی OpenAI میلیاردی شد؛ LiveKit به باشگاه یونیکورن‌ها پیوست

یک اسب تک شاخ دیجیتالی ساخته شده از امواج صوتی سبز درخشان که نمایانگر ارزش ۱.۱ میلیارد دلاری LiveKit و فناوری هوش مصنوعی صوتی آن است

فهرست مطالب

استارتاپ LiveKit، که موتور محرک قابلیت‌های صوتی پیشرفته OpenAI است، با جذب سرمایه‌ی جدید رسماً به جمع “یونیکورن‌ها” پیوست و ارزش آن از مرز ۱ میلیارد دلار عبور کرد. این اتفاق نشان‌دهنده‌ی جهش عظیم صنعت به سمت رابط‌های کاربری صوتی و تعاملی است.

 

انفجار در دره سیلیکون؛ صدا، فرمانروای جدید

طبق گزارش‌های رسیده به تحریریه سایت خبری هوش روز، شرکت LiveKit موفق شده است در دور تامین سرمایه سری B، مبلغ قابل توجهی را جذب کند که ارزش این کمپانی را به حدود ۱.۱ میلیارد دلار رسانده است. این دور سرمایه‌گذاری به رهبری Altimeter Capital انجام شد؛ همان سرمایه‌گذاری که روی غول‌هایی مثل Snowflake و Meta شرط‌بندی کرده بود.

اما چرا LiveKit اینقدر مهم است؟ اگر تا به حال از قابلیت “Advanced Voice Mode” در ChatGPT استفاده کرده‌اید و از سرعت و لحن طبیعی آن شگفت‌زده شده‌اید، باید بدانید که جادوی اصلی در زیرساخت‌های LiveKit اتفاق می‌افتد.

 

تحلیل آرمان فاضلی: چرا LiveKit یک “تغییردهنده بازی” است؟

به عنوان خبرنگار فناوری در  HooshRooz  که سال‌هاست روی زیرساخت‌های ابری تمرکز دارم، معتقدم LiveKit کاری را با “صدا” می‌کند که Twilio با “پیامک” انجام داد.

نظر شخصی من این است که بزرگترین مشکل هوش مصنوعی صوتی تا قبل از این، “تاخیر” (Latency) بود. شما حرف می‌زدید، ۳ ثانیه صبر می‌کردید تا جواب بیاید. این حسِ مکالمه را می‌کشت. LiveKit با بهینه‌سازی پروتکل‌های WebRTC، این تاخیر را به میلی‌ثانیه رسانده است. حالا ماشین‌ها وسط حرف شما می‌پرند، مکث می‌کنند و مثل انسان می‌شنوند.

 

جدول: تفاوت LiveKit با سرویس‌های سنتی

 

برای درک بهتر بزرگی کاری که این تیم انجام داده، نگاهی به جدول زیر که در واحد فنی سایت اخبار هوش مصنوعی هوش روز تهیه شده بیندازید:

 

ویژگی سیستم‌های قدیمی (Legacy) سیستم LiveKit (نسل جدید)
تاخیر (Latency) ۲ تا ۵ ثانیه (کند و مصنوعی) زیر ۵۰۰ میلی‌ثانیه (Real-time)
تعامل نوبتی (شما حرف بزنید، بعد ربات) همزمان (قابلیت قطع کردن حرف همدیگر)
زیرساخت متکی به APIهای جداگانه پایپ‌لاین یکپارچه صوتی/تصویری
کاربرد اصلی دستیارهای صوتی ساده ایجنت‌های هوشمند، پشتیبانی زنده، بازی
 
 
زیرساخت موتور صدای هوش مصنوعی آینده‌نگر که ادغام بین LiveKit و OpenAI را نشان می‌دهد

 

اتحاد استراتژیک با OpenAI

نکته‌ای که ارزش LiveKit را دوچندان می‌کند، شراکت عمیق آن‌ها با OpenAI است. سم آلتمن و تیمش برای اینکه بتوانند مدل GPT-4o را با قابلیت صوتی بلادرنگ عرضه کنند، به زیرساختی نیاز داشتند که زیر بار ترافیک میلیونی کاربران کمر خم نکند. آن‌ها LiveKit را انتخاب کردند.

 

یک آمار جذاب: طبق داده‌های منتشر شده، پلتفرم LiveKit در حال حاضر روزانه میلیون‌ها دقیقه مکالمه صوتی و تصویری را برای توسعه‌دهندگان سراسر جهان پردازش می‌کند.

 

راوس دی‌سا، مدیرعامل LiveKit می‌گوید: «ما می‌خواهیم به هر توسعه‌دهنده‌ای اجازه دهیم که تجربه‌ای شبیه به فیلم “Her” را برای کاربرانش بسازد، نه فقط غول‌های تکنولوژی.»

 

تعامل صوتی هوش مصنوعی در لحظه با امواج صوتی با تأخیر کم، که یک تجربه مکالمه شبیه به انسان را ارائه می‌دهد

 

آینده‌ای که می‌شنود و می‌بیند

در اخبار جدید هوش مصنوعی، ما شاهد یک شیفت پارادایم هستیم. تا دیروز همه به دنبال “چت متنی” بودند، اما امروز “چت صوتی و تصویری” ترند اصلی است. سرمایه‌گذاران با تزریق پول به LiveKit، در واقع روی آینده‌ای شرط بسته‌اند که در آن کیبوردها کمرنگ می‌شوند و ما با کامپیوترها حرف می‌زنیم.

این شرکت اعلام کرده که سرمایه جدید را صرف گسترش شبکه جهانی سرورهای خود و توسعه قابلیت‌های “هوش مصنوعی چندوجهی” (Multimodal AI) خواهد کرد.

 

فرصتی برای توسعه‌دهندگان ایرانی؟

اگر برنامه‌نویس یا مدیر محصول هستید، ظهور LiveKit خبر مهمی برای شماست. ابزارهای این شرکت اپن‌سورس (در هسته اصلی) هستند و به شما اجازه می‌دهند اپلیکیشن‌های خود را به قابلیت‌های صوتی پیشرفته مجهز کنید.

برای پیگیری لحظه‌ای این تحولات و دریافت تحلیل‌های عمیق‌تر، سایت اخبار هوش مصنوعی هوش روز را دنبال کنید. ما صدای آینده را زودتر از بقیه به گوش شما می‌رسانیم.

 

 

سوالات متداول

۱. ارزش فعلی استارتاپ LiveKit چقدر است؟

با جذب سرمایه جدید، ارزش لایو کیت از مرز ۱ میلیارد دلار گذشت و این شرکت رسماً به جمع یونیکورن‌های صنعت هوش مصنوعی پیوست.

۲. رابطه LiveKit با شرکت OpenAI چیست؟

لایو کیت تأمین‌کننده زیرساخت اصلی برای قابلیت «حالت صوتی پیشرفته» (Advanced Voice Mode) در ChatGPT است.

۳. مهم‌ترین مزیت فنی LiveKit نسبت به رقبا چیست؟

کاهش تاخیر مکالمه به زیر ۵۰۰ میلی‌ثانیه که امکان گفتگوی بلادرنگ، طبیعی و پریدن وسط حرف هوش مصنوعی را فراهم می‌کند.

۴. سرمایه‌گذار اصلی در دور جدید تأمین مالی چه شرکتی بود؟

این دور سرمایه‌گذاری (سری B) توسط شرکت معتبر Altimeter Capital رهبری شد که سابقه سرمایه‌گذاری در متا را نیز دارد.

تصویر آرمان فاضلی

آرمان فاضلی

آرمان فاضلی خبرنگار و تحلیل‌گر فناوری در رسانه «هوش روز» است. او در حوزه‌ی تحول دیجیتال، هوش مصنوعی، و فناوری‌های نوظهور فعالیت می‌کند و با نگاهی تحلیلی و آینده‌نگر، تازه‌ترین روندهای علمی و فنی را برای مخاطبان به زبان ساده روایت می‌کند. آرمان با تکیه بر تجربه‌ی چندساله در روزنامه‌نگاری فناوری، تلاش می‌کند تا بینش فنی را با روایت دقیق و داده‌محور ترکیب کند تا خوانندگان بتوانند تصویری روشن از تأثیر فناوری بر زندگی، اقتصاد و آینده کسب‌وکارها به دست آورند. مقالات او در «هوش روز» با سبک نگارشی منظم، مستند و مخاطب‌محور شناخته می‌شود و اغلب به‌عنوان مرجع برای فعالان حوزه‌ی فناوری و محققان رسانه‌ای مورد استناد قرار می‌گیرد.

دیدگاهتان را بنویسید

تغییر تمرکز از نوشتن کد به معماری سیستم در آزمون‌های جدید برنامه‌نویسی

تیم فنی شرکت آنتروپیک (Anthropic) مجبور به بازطراحی مداوم آزمون‌های مصاحبه شغلی خود شده است، زیرا مدل هوش مصنوعی کلود

پارادوکس عجیب آنتروپیک: وقتی هوش مصنوعی کلود آزمون‌های استخدامی خالقش را هک می‌کند!

یادگیری تعاملی کودک با هوش مصنوعی و معلم هوشمند مجاز

گروهی از مهندسان و مدیران سابق گوگل با راه‌اندازی یک استارتاپ جدید، اپلیکیشنی مبتنی بر هوش مصنوعی توسعه داده‌اند که

انقلاب آموزشی گوگلی‌ها: اپلیکیشن Sparkli برای نجات کودکان از “دیوار متنی” هوش مصنوعی آمد

استارتاپ AMI Labs و معماری مدل‌های جهانی برای درک فیزیک توسط

پشت پرده استارتاپ مرموز AMI Labs، جمعی از نخبگان جدا شده از آزمایشگاه FAIR شرکت متا و شاگردان ارشد یان

پشت پرده AMI Labs؛ آیا تیم مخفی یان لکان «مدل جهانی» را می‌سازد؟

جایگاه تبلیغاتی ویژه برای کسب و کار شما

جایگاه تبلیغ شما

کسب و کار خود را به هزاران بازدیدکننده هدفمند نمایش دهید.

اطلاعات بیشتر
آخرین نوشته ها

محل تبلیغات شما

جهت همکاری کلیک کنید

فضای ویژه تبلیغات

همین حالا رزرو کنید