مایکروسافت با هدف تقویت هوش مصنوعی چندزبانه، سرمایهگذاری چند میلیون دلاری در دادههای مرتبط با زبانها و فرهنگهای اروپایی آغاز میکند.
به گزارش تکناک، شرکت مایکروسافت دو ابتکار مهم را در پاریس معرفی کرد که هدف آنها حفظ میراث زبانی و فرهنگی اروپا و تقویت جایگاه این قاره در عصر هوش مصنوعی است. این اقدامات در ادامه تعهدات پیشین مایکروسافت در حوزه دیجیتال اروپا صورت میگیرد که شامل گسترش زیرساختهای هوش مصنوعی و رایانش ابری، تقویت حریم خصوصی دادهها، افزایش تابآوری سایبری و ارتقاء رقابتپذیری دیجیتال در سطح قاره میباشد.
اروپا دارای بیش از ۲۰۰ زبان و میراث فرهنگی هزارسالهای است که نقش کلیدی در ارتباط، نوآوری و تجارت ایفا میکند. اما با گسترش سلطه زبان انگلیسی در محتوای فضای آنلاین – که عمدتاً منعکسکننده دیدگاه آمریکایی است – خطر نادیده گرفته شدن فرهنگ و تجارت اروپا در دادههایی که مدلهای زبانی بزرگ (LLMs) با آنها آموزش میبینند، وجود دارد.
Brad Smith، نایبرئیس و رئیس مایکروسافت، در این خصوص اظهار داشت: «هوش مصنوعیای که زبانها، تاریخها و ارزشهای اروپا را درک نکند، نمیتواند به طور کامل به مردم، کسبوکارها یا آیندهاش خدمت کند.»
بررسیها نشان میدهد مدل متنباز Llama 3.1، در مقایسه با زبان انگلیسی، در زبان یونانی بیش از ۱۵ امتیاز و در زبان لتونیایی بیش از ۲۵ امتیاز پایینتر عملکرد دارد. این نابرابری در اغلب ارزیابیهای مدلهای زبانی بزرگ دیده میشود و نشانگر نیاز به تعادل بیشتر در دادههای آموزشی است.
به نقل از نئووین، برای رفع این نابرابری، مایکروسافت تصمیم گرفته است مرکز تخصصی خود را در استراسبورگ فرانسه مستقر کند تا دادههای چندزبانه را بر بستر Microsoft Azure توسعه و گردآوری کند. این پروژه توسط تیمهایی از مرکز نوآوری باز (MOIC) و آزمایشگاه AI for Good انجام خواهد شد. این گروهها با نهادهای فرهنگی، دانشگاهی و شرکتهای فناوری در سراسر اروپا همکاری خواهند کرد تا دادههای آموزشی را برای ده زبان کمتر نمایان اروپایی، از جمله استونیایی، آلزاسی، اسلواکیایی، یونانی و مالتی، فراهم سازند.

مایکروسافت همچنین فراخوانی برای ارائه پیشنهادات منتشر کرده است تا متون دیجیتالی، نسخهبرداریها و سایر منابع مناسب برای توسعه هوش مصنوعی را گردآوری کند. متقاضیان از تاریخ ۱ سپتامبر ۲۰۲۵ میتوانند برای دریافت کمکهزینه شامل اعتبار Azure و پشتیبانی فنی و مهندسی، از طریق وبسایت AI for Good Lab اقدام کنند.
در گامی دیگر، مایکروسافت برنامه Culture AI را در پاییز امسال گسترش خواهد داد تا یک نسخه دیجیتال با وضوح بالا از کلیسای تاریخی نوتردام پاریس تهیه کند. این پروژه در همکاری با وزارت فرهنگ فرانسه و شرکت متخصص در دیجیتالیسازی میراث، Iconem، انجام خواهد شد و هدف آن ثبت دقیق این بنای گوتیک ۸۶۲ ساله است. پیش از این، Culture AI پروژههایی مانند المپیا باستان در یونان، کوه سنتمیشل در فرانسه، کلیسای سنپتر در رم و سواحل پیادهسازی متفقین در نرماندی را به صورت دیجیتال حفظ کرده است.
مایکروسافت با بیش از ۴۰ سال تجربه در بومیسازی، اکنون از بیش از ۹۰ زبان از جمله تمام زبانهای رسمی اتحادیه اروپا و زبانهای منطقهای مانند باسکی، کاتالان، گالیسی، لوکزامبورگی و والنسین در Windows پشتیبانی میکند. همچنین، Microsoft 365 رابطهای Office را به بیش از ۳۰ زبان اروپایی ارائه میدهد.
این شرکت تأکید میکند که این اقدامات ماهیتی حمایتی دارند و هدف از آنها فراهمسازی دادههای باز، ابزارها و تخصص است، نه ارائه داراییهای انحصاری. به گفته مایکروسافت، با ادغام زبانها و داراییهای فرهنگی اروپا در پلتفرمهای هوش مصنوعی و رایانش ابری، میتوان از میراث غنی قاره حفاظت کرد و در عین حال به کسبوکارها و شهروندان اروپایی در عصر دیجیتال قدرت بخشید.