ساندار پیچای، مدیرعامل گوگل، از عرضه مدل جدید هوش مصنوعی این شرکت با نام “Gemini” خبر داد. این مدل نوآورانه، که نخستین بار در کنفرانس توسعهدهندگان I/O توسط پیچای معرفی شد، اکنون برای استفاده عمومی منتشر شده است.
به گزارش تکناک ،دمیس هاسابیس، مدیرعامل DeepMind گوگل، نیز تأکید کرده است که Gemini به عنوان یک گام بزرگ در عرصه هوش مصنوعی، توانایی دارد که بر کلیه محصولات و خدمات گوگل تأثیر مثبت و گستردهای بگذارد. این اقدام نه تنها نشاندهنده پیشرفتهای فناوری گوگل است، بلکه آیندهای روشن در زمینه استفاده از هوش مصنوعی را نوید میدهد.
Gemini تنها یک مدل هوش مصنوعی نیست، بلکه دارای نسخههای مختلفی است. نسخه سبکتر آن، Gemini Nano نام دارد که قرار است به صورت بومی و آفلاین روی دستگاههای اندرویدی اجرا شود. نسخه قدرتمندتر آن، Gemini Pro، قرار است به زودی موتور اصلی بسیاری از خدمات هوش مصنوعی گوگل شود و همچنین پشتوانهای برای Bard خواهد بود. علاوه بر این، نسخهای حتی قدرتمندتر با نام Gemini Ultra وجود دارد که برای مراکز داده و کاربردهای شرکتی طراحی شده است.
گوگل در حال حاضر مدل را به چند روش راهاندازی میکند: Bard اکنون توسط Gemini Pro پشتیبانی میشود و کاربران Pixel 8 Pro به لطف Gemini Nano چند ویژگی جدید دریافت خواهند کرد. (Gemini Ultra سال آینده عرضه میشود.) توسعهدهندگان و مشتریان شرکتی از ۱۳ دسامبر به Gemini Pro از طریق Google Generative AI Studio یا Vertex AI در Google Cloud دسترسی خواهند داشت. Gemini فعلاً فقط به زبان انگلیسی در دسترس است، با زبانهای دیگر که به زودی عرضه میشوند.
اما پیچای تأکید میکند که این مدل نهایتاً در موتور جستجوی گوگل، محصولات تبلیغاتی، مرورگر کروم و دیگر محصولات در سراسر جهان ادغام خواهد شد، نشاندهنده آیندهای است که زودتر از انتظار فرا رسیده است.
حدود یک سال و یک هفته پیش، OpenAI با راهاندازی ChatGPT، یک جهش بزرگ در حوزه هوش مصنوعی ایجاد کرد، که سریعاً به یکی از بزرگترین موفقیتها در این زمینه تبدیل شد. در مقابل، گوگل، که یک دهه خود را به عنوان یک سازمان متکی بر هوش مصنوعی معرفی کرده و بسیاری از فناوریهای اساسی در پشت پرده پیشرفت فعلی AI را پیادهسازی کرده بود، به نظر میرسد توسط موفقیت ChatGPT و سرعت نفوذ OpenAI در صنعت، به طور ناخواسته غافلگیر شده بود. اما حالا، گوگل آماده است تا پاسخ دهد.
دمیس هاسابیس از گوگل اظهار داشت برای بررسی مقایسه بین GPT-4 از OpenAI و Gemini از گوگل، تجزیه و تحلیل دقیقی از این دو سیستم در کنار هم انجام شده است. گوگل ۳۲ بنچمارک معتبر را برای مقایسه این دو مدل اجرا کرده است، که شامل آزمایشهای گستردهای از فهم زبان چند وظیفهای تا مقایسه تواناییهای تولید کد پایتون است.
هاسابیس میگوید که گوگل در ۳۰ مورد از ۳۲ مورد بنچمارک پیشرو است. این برتری بیشتر ناشی از توانایی Gemini در فهم و تعامل با ویدئو و صوت است، که از ابتدا بخشی از طرح این مدل بوده است. در حالی که OpenAI با DALL-E و Whisper روی مدلهای جداگانه برای تصاویر و صدا تمرکز کرده است، گوگل از ابتدا یک مدل چندحسی را ساخته است. هاسابیس تأکید میکند که گوگل همیشه به سیستمهای فوقالعاده عمومی علاقهمند بوده است و به ویژه به این موضوع که چگونه میتواند تمام این حالتها را ترکیب کند تا دادهها را از انواع مختلف ورودیها و حسها جمعآوری کند و سپس پاسخهایی با همان اندازه تنوع ارائه دهد.
در حال حاضر، سادهترین مدلهای Gemini گوگل بر متن متمرکز هستند، اما مدلهای قدرتمندتری مانند Gemini Ultra قادر به کار با تصاویر، ویدئو و صوت هستند. دمیس هاسابیس از گوگل بیان میکند که این پیشرفتها فراتر خواهند رفت. او اشاره میکند که در آینده، Gemini قادر خواهد بود با حواس بیشتری همچون عمل، لمس و حتی برخی جنبههای مربوط به رباتیک کار کند. هاسابیس تأکید میکند که با افزایش اطلاعات، Gemini هوشمندتر خواهد شد و دقت و واقعبینی بیشتری با درک بهتری از جهان اطراف خواهد داشت. با این حال، او همچنین اذعان میکند که این مدلها همچنان دارای توهمات، تعصبات و محدودیتهای دیگر هستند.
به گفته هاسابیس، بنچمارکها تنها بخشی از معادله هستند و آزمون واقعی تواناییهای Gemini از طریق کاربران روزمره که قصد دارند از آن برای ایدهپردازی، جستجوی اطلاعات، نوشتن کد و موارد دیگر استفاده کنند، مشخص خواهد شد. به خصوص، برنامهنویسی یک حوزه کلیدی برای Gemini به شمار میرود؛ ، گوگل مدعی است سیستم تولید کد جدید به نام AlphaCode 2 نسبت به ۸۵ درصد از شرکتکنندگان در مسابقات برنامهنویسی بهتر عمل میکند.
گوگل همچنین تأکید میکند که Gemini یک مدل بسیار کارآمد است. این مدل با استفاده از واحدهای پردازش تنسور (TPU) خود گوگل آموزش دیده است، که هم سریعتر و هم ارزانتر از مدلهای قبلی مانند PaLM است. همزمان با معرفی مدل جدید، گوگل نسخه جدیدی از سیستم TPU خود، TPU v5p را راهاندازی میکند که یک سیستم رایانهای طراحی شده برای استفاده در مراکز داده برای آموزش و اجرای مدلهای مقیاس بزرگ است.
با بررسی گفتگوهایی که با ساندار پیچای و دمیس هاسابیس انجام شده، مشخص است که آنها راهاندازی مدل Gemini را نه تنها به عنوان آغاز یک پروژه بزرگ بلکه به عنوان یک تغییر عمده در استراتژی گوگل در نظر میگیرند. Gemini نشاندهنده یک تکامل در تلاشهای گوگل در زمینه هوش مصنوعی است، مدلی که سالها در دست ساخت بوده و احتمالاً باید قبل از ظهور ChatGPT و تسلط OpenAI بر دنیا آماده میشد.
پس از رونمایی ChatGPT، گوگل به نوعی وضعیت “هشدار قرمز” اعلام کرد و از آن زمان به نظر میرسد که در تلاش برای جبران تأخیر خود بوده است. با این حال، شرکت همچنان متعهد به اصل “جسورانه و مسئولانه” خود است. هاسابیس و پیچای تأکید میکنند که آنها قصد ندارند ، زمانی که به رؤیای هوش مصنوعی عمومی (AGI) نزدیک میشویم فقط برای پیشی گرفتن از رقبا شتابزده عمل کنند. هاسابیس با اشاره به اینکه نزدیک شدن به AGI دنیای متفاوتی را به وجود میآورد، تأکید میکند که باید با احتیاط و خوشبینی به این مقوله نزدیک شد.
گوگل به اهمیت ایمنی و مسئولیتپذیری در توسعه مدل Gemini تأکید کرده است. این شرکت اقدامات گستردهای برای تضمین امنیت این سیستم انجام داده است، که شامل هم آزمایشهای داخلی و هم خارجی و همچنین استفاده از تیمهای قرمز برای شناسایی نقاط ضعف احتمالی است. ساندار پیچای بر اهمیت حفاظت از دادهها و اطمینان از قابلیت اعتماد محصولات تأکید میکند، که این مسئله بهویژه برای محصولاتی که درآمد اصلی خود را از طریق شرکتها کسب میکنند، مهم است.
دمیس هاسابیس اذعان میکند که یکی از چالشها در راهاندازی یک سیستم هوش مصنوعی پیشرفته، احتمال وجود مشکلات و نقاط ضعف ناشناخته است. او تأکید میکند که انتشار و استفاده واقعی از سیستم میتواند به شناسایی و یادگیری از این مشکلات کمک کند. به همین دلیل، گوگل روند انتشار نسخه Ultra را به آرامی و به صورت کنترل شده انجام میدهد، که به گونهای شبیه به یک بتای کنترل شده با “منطقه آزمایش ایمنتر” برای مدل است.
برای سالها، ساندار پیچای و دیگر مدیران گوگل به بیان دیدگاههای خود در مورد تأثیر هوش مصنوعی بر جهان پرداختهاند. پیچای خود بارها تأکید کرده که هوش مصنوعی تأثیری عمیقتر از آتش یا برق بر بشریت خواهد داشت، که نشاندهنده بلندپروازیهای گوگل در این زمینه است. در حالی که نسل اول مدل Gemini ممکن است به تنهایی دنیا را دگرگون نکند، اما میتواند گام مهمی برای گوگل در رقابت با OpenAI و سایر بازیگران بزرگ در زمینه هوش مصنوعی تولیدکننده باشد.
در بهترین حالت، Gemini میتواند به گوگل کمک کند تا به سطح برابری با OpenAI در زمینه هوش مصنوعی مولد برسد. در بدترین حالت، ممکن است Bard، محصول دیگر گوگل در این زمینه، نتواند با ChatGPT رقابت کند و به عنوان یک محصول متوسط باقی بماند. با این حال، پیچای، هاسابیس و دیگر اعضای تیم گوگل به نظر میرسد که معتقدند این تنها آغاز یک دوره جدید و بزرگ در فناوری هوش مصنوعی است. همانطور که وب گوگل را به یک غول فناوری تبدیل کرد، Gemini نیز پتانسیل دارد تا تأثیری حتی بزرگتر داشته باشد، نه تنها برای گوگل بلکه برای کل صنعت هوش مصنوعی.