گوگل، در کنار برنامه های شایعه شده خود برای معرفی بیش از 20 محصول مجهز به هوش مصنوعی در رویداد سالانه I/O خود در سال جاری، به سمت هدف اصلی اش برای ساخت یک مدل زبان هوش مصنوعی با پشتیبانی از 1000 زبان مختلف، پیش می رود.
به گزارش تکناک، گوگل در اعلامیه منتشر شده در روز دوشنبه ، اطلاعات بیشتری در مورد مدل جهانی هوش مصنوعی گفتار خود (USM) به اشتراک گذاشت، و آن را «اولین گام حیاتی» برای تحقق اهدافش توصیف کرد.
نوامبر گذشته، گوگل برنامههای خود برای ایجاد یک مدل زبانی هوش مصنوعی با پشتیبانی از 1000 زبان پر استفاده دنیا را اعلام کرد و در عین حال مدل USM خود را نیز فاش کرد. به گفته گوگل، USM “خانواده ای از پیشرفته ترین مدل های گفتاری” است و براساس 2 میلیارد پارامتر، 12 میلیون ساعت گفتار و 28 میلیارد جمله در بیش از 300 زبان آموزش میبیند.
در حال حاضر از USM در یوتیوب برای تولید closed captions استفاده میشود و از تشخیص خودکار گفتار (ASR) نیز پشتیبانی میکند. این قابلیت به صورت خودکار زبانها، از جمله انگلیسی، ماندارین، آمهری، سبوانو، آسامی و غیره را شناسایی و ترجمه میکند.
در حال حاضر، گوگل می گوید USM از بیش از 100 زبان پشتیبانی می کند و به عنوان “بنیادی” برای ایجاد یک سیستم حتی گسترده تر عمل خواهد کرد. متا نیز در حال توسعه یک ابزار ترجمه هوش مصنوعی مشابه است و هنوز در مراحل اولیه توسعه قرار دارد.
یکی از کاربردهای این فناوری میتواند در عینکهای واقعیت افزوده مانند مفهوم بهنمایش درآمده توسط گوگل در جریان رویداد I/O سال گذشته خود به منظور امکان شناسایی و ارائه ترجمههای لحظهای و نمایش آنها درست در جلوی چشمان کاربر باشد. با این حال، محقق شدن آن هنوز کمی دور از انتظار به نظر می رسد، و با توجه به اشتباه گوگل در مورد زبان عربی در طول ارائه خود در I/O میتوان گفت محقق نشدن ایدهها نیز ممکن است.