مدل Turbo 2.5 شرکت هوش مصنوعی ElevenLabs رونمایی شد. با استفاده از این مدل، میتوان دستیارهای مکالمهمحور ساخت و آن را در عینکهای هوشمند ادغام کرد.
بهگزارش تکناک، شرکت هوش مصنوعی ElevenLabs مدل Turbo 2.5 را رونمایی کرد. مدل جدید مدلی برای تبدیل متن به گفتار با تأخیر کم است. این مدل از ۳۲ زبان دنیا، ازجمله ویتنامی و مجاری و نروژی پشتیبانی میکند.
با استفاده از مدل Turbo 2.5، توسعهدهندگان میتوانند دستیارهای مکالمهمحور مبتنیبر مدلهای زبانی بزرگ بسازند و آن را در سختافزارهایی مانند عینکهای هوشمند برای خواندن متن ادغام یا از آن برای جانبخشیدن به شخصیتها در بازیهای ویدئویی استفاده کنند.
Turbo 2.5 سرعت زبانهای هندی، فرانسوی، اسپانیایی، ماندارین و ۲۷ زبان دیگر را ۱۵۰ درصد و سرعت انگلیسی را ۲۵ درصد افزایش میدهد. توسعهدهندگان برای شروع استفاده از رابط برنامهنویسی (API) مدل Turbo 2.5 در محصولات و خدمات خود، میتوانند به صفحهی API شرکت ElevenLabs مراجعه کنند و کسبوکارها نیز با تماس با بخش فروش، میتوانند دسترسی حجمی (بهصورت عمده) به آن داشته باشند.
در اوایل این ماه، ElevenLabs رابط کاربری Voice Isolator را برای استفادهی توسعهدهندگان ثالث معرفی کرد. همانطورکه از نام آن پیداست، این ابزار از هوش مصنوعی برای حذف نویز پسزمینه از کلیپهای صوتی استفاده میکند و گفتوگوی واضح را دراختیار شما قرار میدهد.
در نمایشی از قابلیت Voice Isolator، وبسایتی با استفاده از هوش مصنوعی Claude شرکت آنتروپیک ساخته شد که به کاربران امکان میدهد تا لینک یوتیوب را وارد کنند و سپس رابط کاربری Voice Isolator فراخوانده میشود تا نویز پسزمینه را حذف کند. سپس این اپلیکیشن نمایشی صوت را در فایلی روی صفحه قرار میدهد که میتوان مستقیماً از مرورگر به آن گوش داد.
بدیهی است که توسعهدهندگان ثالث به روشهای خلاقانه از این رابط کاربری استفاده خواهند کرد؛ همانطورکه رابط کاربری مدل Turbo 2.5 نیز برای کاربردهای مختلف بهکار گرفته خواهد شد.
نئووین مینویسد که ElevenLabs در روزهای اخیر از همکاریهای متعدد خود با شرکتهای دیگر خبر داده است. یکی از این مشارکتها با AMGI Studios برای خلق شخصیتهای تعاملی است که بهاحتمال زیاد از فناوری تبدیل متن به گفتار و هوش مصنوعی برای ایجاد شخصیتهای مجازی با قابلیت برقراری ارتباط با کاربر استفاده خواهد کرد.
همکاری دیگر این شرکت با Thoughtly صورت گرفته است که قصد دارد از فناوری ElevenLabs برای ایجاد مراکز تماس هوش مصنوعی (AI call centers) بهره ببرد. این مراکز تماس میتوانند ازطریق تبدیل گفتار به متن، درک و پاسخگویی به پرسشهای کاربران را بهصورت خودکار انجام دهند.
همچنین، شرکت هوش مصنوعی ElevenLabs پیشرفتهای جدیدی را در استودئو دوبلاژ و صداگذاری خود معرفی کرده است که نشاندهندهی تلاش این شرکت برای توسعهی راهحلهای جامع در حوزهی تولید و پردازش صدا است.