سرمایه گذاری OpenAI روی صدا نشاندهنده یک تغییر استراتژیک بزرگ است؛ این شرکت معتقد است آینده تعامل انسان و ماشین از طریق «گفتگو» شکل میگیرد، نه «لمس کردن». در حالی که سیلیکون ولی با گجتهای جدید علیه اعتیاد به نمایشگرها اعلام جنگ کرده، OpenAI در حال ساختن مغز متفکر این آیندهی بدون تصویر است.
خداحافظی با مستطیلهای شیشهای؟
طبق تحلیلهای ما در سایت خبری هوش روز، موج جدیدی در دنیای فناوری به راه افتاده که هدفش «نامرئی کردن تکنولوژی» است. همه ما از خیره شدن به صفحات موبایل خسته شدهایم (Screen Fatigue) و سیلیکون ولی این را خوب میداند. اما استارتآپهای سختافزاری مثل Humane یا Rabbit که سعی کردند گوشی را حذف کنند، شکست خوردند. چرا؟ چون هوش آنها به اندازه کافی سریع و انسانی نبود.
اینجاست که سرمایه گذاری OpenAI روی صدا معنا پیدا میکند. سم آلتمن و تیمش به جای ساختن یک گوشی جدید، روی طبیعیترین روش ارتباطی بشر یعنی «صدا» تمرکز کردهاند. انتشار مدل GPT-4o با قابلیت مکالمهی بدون تأخیر (Real-time)، دقیقاً در همین راستاست.

چرا صدا پادشاه جدید است؟ (تجربه شخصی)
من به عنوان خبرنگار فناوری در هوش روز، مدتی است که از قابلیت مکالمه صوتی پیشرفته ChatGPT استفاده میکنم. نظر شخصی من این است که این تجربه دیگر شبیه دستور دادن به یک ربات نیست؛ حس صحبت با یک همکار باهوش را دارد. قطع و وصل کردن حرف، تغییر لحن و درک احساسات، موانعی بودند که OpenAI آنها را برداشته است.
بر اساس آمارهای منتشر شده، بازار فناوری تشخیص گفتار و صدا تا سال ۲۰۳۰ به ارزشی بالغ بر ۵۰ میلیارد دلار خواهد رسید. این یعنی OpenAI در حال کاشتن بذر در حاصل خیزترین زمین فناوری دهه آینده است.
مقایسه دستیارهای قدیمی با نسل جدید OpenAI
برای اینکه بدانید چرا اخبار هوش مصنوعی امروز تا این حد روی صوت متمرکز شده، جدول زیر را که در تحریریه هوش روز آماده کردهایم ببینید:
| ویژگی | دستیارهای سنتی (Siri/Google Assistant) | هوش مصنوعی صوتی OpenAI (GPT-4o) |
|---|---|---|
| روش پردازش | تبدیل صدا به متن -> پردازش -> تبدیل متن به صدا | پردازش مستقیم صدا به صدا (End-to-End) |
| تأخیر پاسخ | بالا (چند ثانیه مکث) | آنی و بلادرنگ (میانگین ۳۲۰ میلیثانیه) |
| درک احساسات | صفر (کاملاً رباتیک) | بالا (تشخیص لحن، شوخی و نفسنفس زدن) |
| هدف نهایی | اجرای دستورات ساده (آلارم، آبوهوا) | مکالمه عمیق و حل مسئله پیچیده |

همکاریهای استراتژیک: شایعه یا واقعیت؟
نکته مهمی که نباید از قلم انداخت، گزارشهای معتبر درباره همکاری احتمالی OpenAI با «جانی آیو» (طراح افسانهای اپل) است. اگر سرمایه گذاری OpenAI روی صدا را در کنار طراحی سختافزاری جانی آیو بگذاریم، پازل کامل میشود: یک دستگاه هوشمند بدون صفحه نمایش که فقط با صدا کنترل میشود.
آینده شنیدنی است
سیلیکون ولی جنگ علیه نمایشگرها را آغاز کرده، اما ابزار پیروزی در این جنگ، سختافزار نیست؛ بلکه هوش مصنوعی مکالمهگر است. سایت اخبار هوش مصنوعی هوش روز پیشبینی میکند که در سالهای ۲۰۲۵ و ۲۰۲۶، شاهد ادغام عمیق مدلهای OpenAI در خودروها، عینکها و خانههای هوشمند خواهیم بود. جایی که دیگر نیازی نیست سرمان را پایین بیندازیم و به گوشی نگاه کنیم؛ کافیست فقط صحبت کنیم.
سوالات متداول
چون معتقدند آینده تعامل انسان و هوش مصنوعی در گفتگو است، نه نمایشگرها، و میخواهند ارتباطی طبیعی و انسانی بسازند.
آنها به دنبال کاهش اعتیاد به گوشی، حذف صفحات نمایش و حرکت به سمت رایانش محیطی و ابزارهای هوشمند شنیداری هستند.
برخلاف دستیارهای قدیمی، مدل OpenAI پردازش مستقیم صدابهصدا دارد، بلادرنگ پاسخ میدهد و لحن و احساسات را درک میکند.
گزارشهایی از همکاری آنها برای ساخت یک دستگاه سختافزاری هوشمند و بدون نمایشگر با مغز هوش مصنوعی OpenAI وجود دارد.