گوگل با ادغام مدل قدرتمند جمینای (Gemini) در نسخه جدید گوگل ترنسلیت، قابلیت ترجمه همزمان مکالمات از طریق هدفون را امکانپذیر کرد. این بهروزرسانی درک عمیقتری از اصطلاحات محلی و اسلنگها دارد و هماکنون برای کاربران اندروید در مناطق منتخب فعال شده است.
پایان عصر ترجمههای ماشینی؛ سلام به درک انسانی
در دنیای پرشتاب فناوری، سایت خبری هوش روز گزارش میدهد که گوگل یکی از بزرگترین چالشهای بشریت، یعنی مانع زبانی را با کمک مدل هوش مصنوعی جمینای هدف قرار داده است. خبر خامی که به دست ما رسیده نشان میدهد گوگل ترنسلیت دیگر فقط یک دیکشنری هوشمند نیست؛ بلکه به یک مترجم همزمان با درک متنی (Contextual Awareness) تبدیل شده است.
تا پیش از این، ترجمههای گوگل گاهی خشک و بیروح بودند، اما طبق بررسیهای ما در HooshRooz، نسخه جدید دقیقاً مثل یک مترجم انسانی عمل میکند که نهتنها کلمات، بلکه فرهنگ پشت آنها را نیز میفهمد.
ویژگیهای کلیدی آپدیت جدید گوگل ترنسلیت
این بهروزرسانی فقط یک تغییر ظاهری نیست. ادغام جمینای باعث شده تا ترجمهها از حالت “کلمه به کلمه” به حالت “مفهومی” تغییر کنند.
| ویژگی | نسخه کلاسیک (قدیمی) | نسخه مجهز به جمینای (جدید) |
|---|---|---|
| نوع ترجمه | تحتاللفظی و گاهی ماشینی | مفهومی، روان و انسانی |
| درک اصطلاحات (Idioms) | ضعیف (اغلب ترجمه اشتباه) | عالی (تشخیص ضربالمثل و اسلنگ) |
| ترجمه مکالمه | نیاز به فشردن دکمه و نگاه به صفحه | زنده و شنیداری از طریق هدفون |
| تعداد زبانها (فاز اول) | همه زبانها (با کیفیت متغیر) | تمرکز ویژه روی ۲۰ زبان اصلی |
ترجمه در گوش شما!
یکی از جذابترین بخشهای این خبر برای من به عنوان یک خبرنگار فناوری، قابلیت ترجمه شنیداری است. تصور کنید در خیابانهای مکزیکوسیتی یا توکیو قدم میزنید، کسی با شما صحبت میکند و شما ترجمه فارسی یا انگلیسی صحبتهای او را مستقیماً در هدفون خود میشنوید، بدون اینکه نیاز باشد گوشی را جلوی صورت طرف مقابل بگیرید.
طبق تجربه من در تست ابزارهای مشابه، بزرگترین مشکل همیشه تاخیر (Latency) و عدم درک لحن بود. اما جمینای نشان داده که میتواند لحن شوخی یا جدی را تشخیص دهد. گوگل اعلام کرده این قابلیت فعلاً در فاز بتا برای کاربران اندروید در آمریکا، مکزیک و هند فعال است و از ۷۰ زبان پشتیبانی میکند.
چرا این موضوع مهم است؟
بر اساس گزارشهای منتشر شده، مدلهای زبانی بزرگ (LLM) مانند جمینای، خطای ترجمه در زبانهای پیچیده را تا ۴۰ درصد کاهش دادهاند. ساندار پیچای، مدیرعامل گوگل اخیراً اشاره کرده بود که:
«هدف ما این است که هوش مصنوعی را برای همه مفید کنیم و شکستن موانع زبانی، اصلیترین گام در این مسیر است.»
تاثیر بر یادگیری زبان
علاوه بر ترجمه، سایت اخبار هوش مصنوعی هوش روز دریافته است که ابزارهای آموزشی این اپلیکیشن نیز متحول شدهاند. اگر در حال یادگیری زبان هستید، سیستم جدید بازخورد بسیار دقیقتری روی تلفظ و گرامر شما در تمرینهای گفتاری ارائه میدهد. این یعنی گوگل ترنسلیت حالا رقیبی جدی برای اپلیکیشنهایی مثل دولینگو (Duolingo) نیز محسوب میشود.
آینده همینجاست
به نظر میرسد گوگل با این حرکت، استاندارد جدیدی را در اخبار جدید هوش مصنوعی ثبت کرده است. اگرچه فعلاً دسترسی کامل به تمام ویژگیها محدود به مناطق خاصی است، اما انتظار میرود تا پایان سال ۲۰۲۵، این قابلیتها جهانی شوند.
اگر فکر میکنید ترجمه همزمان مکالمات اوج هنرنمایی هوش مصنوعی گوگل است، باید ببینید این مدل در دنیای فیزیکی چه کرده است! گوگل همزمان با این آپدیت نرمافزاری، از مغز متفکر جدید خود برای رباتها نیز رونمایی کرد. برای اینکه بدانید جمینای چگونه کنترل رباتهای فیزیکی را به دست گرفته است، گزارش داغ ما را از دست ندهید:
🔗 انقلاب گوگل در مغز رباتها؛ معرفی مدلهای قدرتمند Gemini Robotics 1.5 و نسخه ER
برای دنبال کردن لحظهای این تحولات و دریافت جدیدترین اخبار هوش مصنوعی امروز، حتماً هوش روز (HooshRooz) را بوکمارک کنید.
منبع: تحلیل اختصاصی تیم فنی هوش روز بر اساس آخرین بیانیه گوگل.
سوالات متداول
نسخه جدید گوگل ترنسلیت با ادغام مدل هوش مصنوعی جمینای (Gemini)، امکان ترجمه زنده و همزمان مکالمات را فراهم کرده است. این نسخه برخلاف مدلهای قدیمی، اصطلاحات عامیانه، ضربالمثلها و ساختار محلی زبانها را کاملاً درک کرده و ترجمهای طبیعی و انسانی ارائه میدهد.
در آپدیت جدید، با اتصال هدفون به گوشی اندرویدی، میتوانید ترجمه مکالمات طرف مقابل را مستقیماً در گوش خود بشنوید. این ویژگی که فعلاً در نسخه بتا عرضه شده، نیاز به نگاه کردن مداوم به صفحه گوشی را حذف کرده و تجربهای شبیه به داشتن یک مترجم شخصی ایجاد میکند.
در فاز اولیه، ترجمه عمیق و باکیفیت جمینای برای حدود ۲۰ زبان از جمله انگلیسی، اسپانیایی، چینی و آلمانی فعال است. با این حال، قابلیت شنیدن ترجمه مکالمات در نسخه بتا از بیش از ۷۰ زبان پشتیبانی میکند و به مرور گسترش مییابد.
بله، طبق بررسیهای هوش روز، بزرگترین مزیت جمینای درک کانتکست (Context) یا بافت کلام است. این هوش مصنوعی میتواند تفاوت بین یک جمله رسمی و یک شوخی یا اصطلاح خیابانی (Slang) را تشخیص دهد و معادل دقیق آن را در زبان مقصد بازگو کند.
قابلیت ترجمه زنده مکالمات فعلاً برای کاربران اندروید در کشورهای ایالات متحده، مکزیک و هند در دسترس است. گوگل اعلام کرده که این ویژگیهای آموزشی و ترجمه به زودی برای مناطق و کشورهای دیگر نیز فعال خواهد شد.