گوگل نوع جدیدی از هوش مصنوعی را معرفی می کند

برخی اخبار تایید نشده از برنامه بزرگ گوگل در زمینه معرفی نوع جدیدی از هوش مصنوعی در پاییز امسال خبر می دهند.

به گزارش تکناک، هنگامی که ChatGPT در سال 2022 به طور گسترده در دسترس قرار گرفت، گوگل یک “کد قرمز” داخلی را اعلام کرد.

از آن زمان به بعد، گوگل چندین حرکت انجام داده است تا اعلام کند که هنوز هم تمرکز خود را بر روی هوش‎‌مصنوعی دارد. با توجه به راه‌اندازی ربات چت خود با نام بارد که در ابتدای امسال صورت گرفت، این شرکت همچنان در حال یکپارچه‌سازی فناوری یادگیری ماشین در محصولات خود است.

حالا، یک گزارش جدید نشان می‌دهد که بزرگترین محصول متمرکز بر هوش‎‌مصنوعی توسط گوگل در پاییز امسال راه‌اندازی خواهد شد، که تحت رهبری مدیران تیم Google Brain و DeepMind انجام خواهد شد.

یک منبع ناشناس مرتبط با محصول که به نام Gemini شناخته می‌شود اخیراً جزئیات جدیدی درباره برنامه‌های گوگل ارائه داده است، همانطور که در The Information گزارش شده است. گوگل قصد ندارد فقط با محصولاتی مانند ChatGPT رقابت کند، بلکه قصد دارد با Gemini از رقبای خود پیشی بگیرد.

این منبع مشخص می‌کند که تمرکز بر ترکیب قابلیت‌های متنی مدل‌های زبان بزرگ (LLMs) و تولید تصویر هوش‎‌مصنوعی است تا یک محصول چندکاره ایجاد شود. این بدان معناست که به جای تولید فقط متن، مانند ChatGPT، جیمنی قادر خواهد بود تصاویر زمینه‌ای ایجاد کند اما گزارش می‌گوید که گوگل در حال بررسی افزودن ویژگی‌های دیگر نیز است. به عنوان مثال، در نهایت ممکن است بتوانید از Gemini برای تجزیه نمودار جریان استفاده کنید یا با استفاده از صدای خود نرم‌افزار را کنترل کنید.

با توجه به قابلیت‌های گسترده آن، گوگل احتمالاً به جیمنی روی خواهد آورد تا به عنوان موتوری برای مجموعه‌ محصولات خود از جمله برنامه‌های کسب‌وکار مانند Google Docs عمل کند. منبع اضافه می‌کند که توسعه‌دهندگان باید برای دسترسی به Gemini از طریق واحد اجاره سرور Google Cloud هزینه پرداخت کنند. هنگامی که گوگل تا پایان سال Gemini را به توسعه‌دهندگان برنامه‌ها ارائه می‌دهد، اطلاعات بیشتری در دسترس قرار خواهد گرفت، اما احتمالاً قبل از آن شرکت از محصولات مبتنی بر Gemini استفاده خواهد کرد.

منبع ذکر کرده است که چندین عضو سابق تیم Google Brain و DeepMind در حال حاضر در حوزه جیمنی فعالیت می‌کنند شامل پل بارهام، پژوهشگر ارشد گوگل، و تام هنیگان از DeepMind است که در زمینه زیرساخت Gemini تمرکز دارد. اما احتمالاً مهم‌ترین عضو تیم، سرگئی برین، بنیانگذار گوگل است. در پایان سال 2022، گزارش شده بود که برین شروع به حضور بیشتر در دفاتر گوگل کرده است. فرض می‌شد که برین در حال تمرکز بر فرایند استخدامی مرتبط با Gemini است، پس از اینکه گوگل در پایان سال 2022 پژوهشگران خود را به OpenAI از دست داد. حالا، منبع ادعا می‌کند که او نقش کلیدی در ارزیابی و آموزش مدل‌های Gemini ایفا می‌کند.

مشابه سایر مدل‌های یادگیری ماشین، جیمنی از ستون‌های متنی و تصاویر برای تحلیل الگوها و ارائه پاسخ به سوالات خاص استفاده می‌کند. بر اساس گزارش منبع، گوگل از ترنسکریپت ویدیوهای یوتتیوب برای آموزش Gemini استفاده کرده است. با این حال، وکلای شرکت به دقت به موارد استفاده شده در طول آموزش نظارت می‌کنند تا از نقض داده‌های محفوظ حق تکثیر پیروی شود.