گوگل هوش مصنوعی Gemini را راه اندازی کرد

ساندار پیچای، مدیرعامل گوگل، از عرضه مدل جدید هوش مصنوعی این شرکت با نام “Gemini” خبر داد. این مدل نوآورانه، که نخستین بار در کنفرانس توسعه‌دهندگان I/O توسط پیچای معرفی شد، اکنون برای استفاده عمومی منتشر شده است.

به گزارش تک‌ناک ،دمیس هاسابیس، مدیرعامل DeepMind گوگل، نیز تأکید کرده است که Gemini به عنوان یک گام بزرگ در عرصه هوش مصنوعی، توانایی دارد که بر کلیه محصولات و خدمات گوگل تأثیر مثبت و گسترده‌ای بگذارد. این اقدام نه تنها نشان‌دهنده پیشرفت‌های فناوری گوگل است، بلکه آینده‌ای روشن در زمینه استفاده از هوش مصنوعی را نوید می‌دهد.

Gemini تنها یک مدل هوش مصنوعی نیست، بلکه دارای نسخه‌های مختلفی است. نسخه سبک‌تر آن، Gemini Nano نام دارد که قرار است به صورت بومی و آفلاین روی دستگاه‌های اندرویدی اجرا شود. نسخه قدرتمندتر آن، Gemini Pro، قرار است به زودی موتور اصلی بسیاری از خدمات هوش مصنوعی گوگل شود و همچنین پشتوانه‌ای برای Bard خواهد بود. علاوه بر این، نسخه‌ای حتی قدرتمندتر با نام Gemini Ultra وجود دارد که برای مراکز داده و کاربردهای شرکتی طراحی شده است.

گوگل در حال حاضر مدل را به چند روش راه‌اندازی می‌کند: Bard اکنون توسط Gemini Pro پشتیبانی می‌شود و کاربران Pixel 8 Pro به لطف Gemini Nano چند ویژگی جدید دریافت خواهند کرد. (Gemini Ultra سال آینده عرضه می‌شود.) توسعه‌دهندگان و مشتریان شرکتی از ۱۳ دسامبر به Gemini Pro از طریق Google Generative AI Studio یا Vertex AI در Google Cloud دسترسی خواهند داشت. Gemini فعلاً فقط به زبان انگلیسی در دسترس است، با زبان‌های دیگر که به زودی عرضه می‌شوند.

اما پیچای تأکید می‌کند که این مدل نهایتاً در موتور جستجوی گوگل، محصولات تبلیغاتی، مرورگر کروم و دیگر محصولات در سراسر جهان ادغام خواهد شد، نشان‌دهنده آینده‌ای است که زودتر از انتظار فرا رسیده است.

حدود یک سال و یک هفته پیش، OpenAI با راه‌اندازی ChatGPT، یک جهش بزرگ در حوزه هوش مصنوعی ایجاد کرد، که سریعاً به یکی از بزرگ‌ترین موفقیت‌ها در این زمینه تبدیل شد. در مقابل، گوگل، که یک دهه خود را به عنوان یک سازمان متکی بر هوش مصنوعی معرفی کرده و بسیاری از فناوری‌های اساسی در پشت پرده پیشرفت فعلی AI را پیاده‌سازی کرده بود، به نظر می‌رسد توسط موفقیت ChatGPT و سرعت نفوذ OpenAI در صنعت، به طور ناخواسته غافلگیر شده بود. اما حالا، گوگل آماده است تا پاسخ دهد.

دمیس هاسابیس از گوگل اظهار داشت برای بررسی مقایسه بین GPT-4 از OpenAI و Gemini از گوگل،  تجزیه و تحلیل دقیقی از این دو سیستم در کنار هم انجام شده است. گوگل ۳۲ بنچمارک معتبر را برای مقایسه این دو مدل اجرا کرده است، که شامل آزمایش‌های گسترده‌ای از فهم زبان چند وظیفه‌ای تا مقایسه توانایی‌های تولید کد پایتون است.

هاسابیس می‌گوید که گوگل در ۳۰ مورد از ۳۲ مورد بنچمارک پیشرو است. این برتری بیشتر ناشی از توانایی Gemini در فهم و تعامل با ویدئو و صوت است، که از ابتدا بخشی از طرح این مدل بوده است. در حالی که OpenAI با DALL-E و Whisper روی مدل‌های جداگانه برای تصاویر و صدا تمرکز کرده است، گوگل از ابتدا یک مدل چندحسی را ساخته است. هاسابیس تأکید می‌کند که گوگل همیشه به سیستم‌های فوق‌العاده عمومی علاقه‌مند بوده است و به ویژه به این موضوع که چگونه می‌تواند تمام این حالت‌ها را ترکیب کند تا داده‌ها را از انواع مختلف ورودی‌ها و حس‌ها جمع‌آوری کند و سپس پاسخ‌هایی با همان اندازه تنوع ارائه دهد.

در حال حاضر، ساده‌ترین مدل‌های Gemini گوگل بر متن متمرکز هستند، اما مدل‌های قدرتمندتری مانند Gemini Ultra قادر به کار با تصاویر، ویدئو و صوت هستند. دمیس هاسابیس از گوگل بیان می‌کند که این پیشرفت‌ها فراتر خواهند رفت. او اشاره می‌کند که در آینده، Gemini قادر خواهد بود با حواس بیشتری همچون عمل، لمس و حتی برخی جنبه‌های مربوط به رباتیک کار کند. هاسابیس تأکید می‌کند که با افزایش اطلاعات، Gemini هوشمندتر خواهد شد و دقت و واقع‌بینی بیشتری با درک بهتری از جهان اطراف خواهد داشت. با این حال، او همچنین اذعان می‌کند که این مدل‌ها همچنان دارای توهمات، تعصبات و محدودیت‌های دیگر هستند.

به گفته هاسابیس، بنچمارک‌ها تنها بخشی از معادله هستند و آزمون واقعی توانایی‌های Gemini از طریق کاربران روزمره که قصد دارند از آن برای ایده‌پردازی، جستجوی اطلاعات، نوشتن کد و موارد دیگر استفاده کنند، مشخص خواهد شد. به خصوص، برنامه‌نویسی یک حوزه کلیدی برای Gemini به شمار می‌رود؛ ، گوگل مدعی است  سیستم تولید کد جدید به نام AlphaCode 2 نسبت به ۸۵ درصد از شرکت‌کنندگان در مسابقات برنامه‌نویسی بهتر عمل می‌کند.

گوگل همچنین تأکید می‌کند که Gemini یک مدل بسیار کارآمد است. این مدل با استفاده از واحدهای پردازش تنسور (TPU) خود گوگل آموزش دیده است، که هم سریع‌تر و هم ارزان‌تر از مدل‌های قبلی مانند PaLM است. همزمان با معرفی مدل جدید، گوگل نسخه جدیدی از سیستم TPU خود، TPU v5p را راه‌اندازی می‌کند که یک سیستم رایانه‌ای طراحی شده برای استفاده در مراکز داده برای آموزش و اجرای مدل‌های مقیاس بزرگ است.

با بررسی گفتگوهایی که با ساندار پیچای و دمیس هاسابیس انجام شده، مشخص است که آنها راه‌اندازی مدل Gemini را نه تنها به عنوان آغاز یک پروژه بزرگ بلکه به عنوان یک تغییر عمده در استراتژی گوگل در نظر می‌گیرند. Gemini نشان‌دهنده یک تکامل در تلاش‌های گوگل در زمینه هوش مصنوعی است، مدلی که سال‌ها در دست ساخت بوده و احتمالاً باید قبل از ظهور ChatGPT و تسلط OpenAI بر دنیا آماده می‌شد.

پس از رونمایی ChatGPT، گوگل به نوعی وضعیت “هشدار قرمز” اعلام کرد و از آن زمان به نظر می‌رسد که در تلاش برای جبران تأخیر خود بوده است. با این حال، شرکت همچنان متعهد به اصل “جسورانه و مسئولانه” خود است. هاسابیس و پیچای تأکید می‌کنند که آنها قصد ندارند ، زمانی که به رؤیای هوش مصنوعی عمومی (AGI) نزدیک می‌شویم فقط برای پیشی گرفتن از رقبا شتابزده عمل کنند. هاسابیس با اشاره به اینکه نزدیک شدن به AGI دنیای متفاوتی را به وجود می‌آورد، تأکید می‌کند که باید با احتیاط و خوش‌بینی به این مقوله نزدیک شد.

گوگل به اهمیت ایمنی و مسئولیت‌پذیری در توسعه مدل Gemini تأکید کرده است. این شرکت اقدامات گسترده‌ای برای تضمین امنیت این سیستم انجام داده است، که شامل هم آزمایش‌های داخلی و هم خارجی و همچنین استفاده از تیم‌های قرمز برای شناسایی نقاط ضعف احتمالی است. ساندار پیچای بر اهمیت حفاظت از داده‌ها و اطمینان از قابلیت اعتماد محصولات تأکید می‌کند، که این مسئله به‌ویژه برای محصولاتی که درآمد اصلی خود را از طریق شرکت‌ها کسب می‌کنند، مهم است.

دمیس هاسابیس اذعان می‌کند که یکی از چالش‌ها در راه‌اندازی یک سیستم هوش مصنوعی پیشرفته، احتمال وجود مشکلات و نقاط ضعف ناشناخته است. او تأکید می‌کند که انتشار و استفاده واقعی از سیستم می‌تواند به شناسایی و یادگیری از این مشکلات کمک کند. به همین دلیل، گوگل روند انتشار نسخه Ultra را به آرامی و به صورت کنترل شده انجام می‌دهد، که به گونه‌ای شبیه به یک بتای کنترل شده با “منطقه آزمایش ایمن‌تر” برای مدل است.

برای سال‌ها، ساندار پیچای و دیگر مدیران گوگل به بیان دیدگاه‌های خود در مورد تأثیر هوش مصنوعی بر جهان پرداخته‌اند. پیچای خود بارها تأکید کرده که هوش مصنوعی تأثیری عمیق‌تر از آتش یا برق بر بشریت خواهد داشت، که نشان‌دهنده بلندپروازی‌های گوگل در این زمینه است. در حالی که نسل اول مدل Gemini ممکن است به تنهایی دنیا را دگرگون نکند، اما می‌تواند گام مهمی برای گوگل در رقابت با OpenAI و سایر بازیگران بزرگ در زمینه هوش مصنوعی تولیدکننده باشد.

در بهترین حالت، Gemini می‌تواند به گوگل کمک کند تا به سطح برابری با OpenAI در زمینه هوش مصنوعی مولد برسد. در بدترین حالت، ممکن است Bard، محصول دیگر گوگل در این زمینه، نتواند با ChatGPT رقابت کند و به عنوان یک محصول متوسط باقی بماند. با این حال، پیچای، هاسابیس و دیگر اعضای تیم گوگل به نظر می‌رسد که معتقدند این تنها آغاز یک دوره جدید و بزرگ در فناوری هوش مصنوعی است. همانطور که وب گوگل را به یک غول فناوری تبدیل کرد، Gemini نیز پتانسیل دارد تا تأثیری حتی بزرگتر داشته باشد، نه تنها برای گوگل بلکه برای کل صنعت هوش مصنوعی.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.