شرکت گوگل روز جمعه از Gemini Embedding، یک مدل جدید و آزمایشی برای پردازش متن، در رابط برنامهنویسی توسعهدهندگان جمنای رونمایی کرد.
به گزارش تکناک، این مدل از فناوری پیشرفته یادگیری عمیق برای درک بهتر معانی متن، بهبود بازیابی اطلاعات و تقویت عملکرد موتورهای جستوجو و سیستمهای هوش مصنوعی استفاده میکند.
تککرانچ مینویسد که مدلهای Embedding ورودیهای متنی مانند کلمات و عبارات را به نمایشهای عددی تبدیل میکنند، که معنای مفهومی متن را حفظ مینمایند. این فناوری در هوش مصنوعی بهویژه در جستوجو، تحلیل اسناد، دستهبندی محتوا و پردازش زبان طبیعی استفاده میشود، چرا که ضمن کاهش هزینهها، دقت و سرعت پردازش را بهبود میبخشد.
گوگل پیشتر مدلهای Embedding دیگری ارائه کرده بود، اما Gemini Embedding نخستین مدلی است که به صورت مستقیم بر پایه جمنای آموزش دیده است. علاوه بر گوگل، شرکتهایی مانند آمازون، Cohere و OpenAI نیز مدلهای مشابهی را در APIهای خود ارائه میدهند.

شرکت گوگل ادعا میکند که Gemini Embedding نسبت به مدل قبلی این شرکت، یعنی text-embedding-004، عملکرد بهتری دارد و در بنچمارکهای مختلف Embedding نتایج رقابتی ارائه میدهد. از جمله برتریهای این مدل میتوان به موارد زیر اشاره کرد:
- درک بهتر زبان و مفاهیم پیچیده: به لطف آموزش مستقیم بر پایه مدلهای جمنای
- پشتیبانی از بیش از ۱۰۰ زبان: دو برابر مدل قبلی text-embedding-004
- توانایی پردازش حجمهای بزرگتر از متن و کد
- کاربرد گسترده در زمینههایی مانند امور مالی، علوم، حقوق و جستوجو
گوگل در یک پست وبلاگی نوشت:
«این مدل که به صورت مستقیم بر پایه جمنای آموزش دیده است، درک عمیقی از زبان و زمینههای پیچیده دارد و میتواند در طیف وسیعی از کاربردها مورد استفاده قرار گیرد.»
مدل Gemini Embedding همچنان در مرحله آزمایشی قرار دارد و با ظرفیت محدودی در دسترس است. گوگل اعلام کرده که در حال کار روی یک نسخه پایدار و عمومی از این مدل است، که طی ماههای آینده عرضه خواهد شد.
«[ما] در حال کار روی یک نسخه پایدار و در دسترس عمومی هستیم که طی ماههای آینده منتشر خواهد شد.»
با توجه به پیشرفتهای اخیر در مدلهای پردازش زبان، Gemini Embedding میتواند نقش مهمی در بهبود عملکرد ابزارهای هوش مصنوعی ایفا کند و جایگاه گوگل را در رقابت با دیگر شرکتهای فناوری تقویت نماید.