برخی اخبار تایید نشده از برنامه بزرگ گوگل در زمینه معرفی نوع جدیدی از هوش مصنوعی در پاییز امسال خبر می دهند.
به گزارش تکناک، هنگامی که ChatGPT در سال 2022 به طور گسترده در دسترس قرار گرفت، گوگل یک “کد قرمز” داخلی را اعلام کرد.
از آن زمان به بعد، گوگل چندین حرکت انجام داده است تا اعلام کند که هنوز هم تمرکز خود را بر روی هوشمصنوعی دارد. با توجه به راهاندازی ربات چت خود با نام بارد که در ابتدای امسال صورت گرفت، این شرکت همچنان در حال یکپارچهسازی فناوری یادگیری ماشین در محصولات خود است.
حالا، یک گزارش جدید نشان میدهد که بزرگترین محصول متمرکز بر هوشمصنوعی توسط گوگل در پاییز امسال راهاندازی خواهد شد، که تحت رهبری مدیران تیم Google Brain و DeepMind انجام خواهد شد.
یک منبع ناشناس مرتبط با محصول که به نام Gemini شناخته میشود اخیراً جزئیات جدیدی درباره برنامههای گوگل ارائه داده است، همانطور که در The Information گزارش شده است. گوگل قصد ندارد فقط با محصولاتی مانند ChatGPT رقابت کند، بلکه قصد دارد با Gemini از رقبای خود پیشی بگیرد.
این منبع مشخص میکند که تمرکز بر ترکیب قابلیتهای متنی مدلهای زبان بزرگ (LLMs) و تولید تصویر هوشمصنوعی است تا یک محصول چندکاره ایجاد شود. این بدان معناست که به جای تولید فقط متن، مانند ChatGPT، جیمنی قادر خواهد بود تصاویر زمینهای ایجاد کند اما گزارش میگوید که گوگل در حال بررسی افزودن ویژگیهای دیگر نیز است. به عنوان مثال، در نهایت ممکن است بتوانید از Gemini برای تجزیه نمودار جریان استفاده کنید یا با استفاده از صدای خود نرمافزار را کنترل کنید.
با توجه به قابلیتهای گسترده آن، گوگل احتمالاً به جیمنی روی خواهد آورد تا به عنوان موتوری برای مجموعه محصولات خود از جمله برنامههای کسبوکار مانند Google Docs عمل کند. منبع اضافه میکند که توسعهدهندگان باید برای دسترسی به Gemini از طریق واحد اجاره سرور Google Cloud هزینه پرداخت کنند. هنگامی که گوگل تا پایان سال Gemini را به توسعهدهندگان برنامهها ارائه میدهد، اطلاعات بیشتری در دسترس قرار خواهد گرفت، اما احتمالاً قبل از آن شرکت از محصولات مبتنی بر Gemini استفاده خواهد کرد.
منبع ذکر کرده است که چندین عضو سابق تیم Google Brain و DeepMind در حال حاضر در حوزه جیمنی فعالیت میکنند شامل پل بارهام، پژوهشگر ارشد گوگل، و تام هنیگان از DeepMind است که در زمینه زیرساخت Gemini تمرکز دارد. اما احتمالاً مهمترین عضو تیم، سرگئی برین، بنیانگذار گوگل است. در پایان سال 2022، گزارش شده بود که برین شروع به حضور بیشتر در دفاتر گوگل کرده است. فرض میشد که برین در حال تمرکز بر فرایند استخدامی مرتبط با Gemini است، پس از اینکه گوگل در پایان سال 2022 پژوهشگران خود را به OpenAI از دست داد. حالا، منبع ادعا میکند که او نقش کلیدی در ارزیابی و آموزش مدلهای Gemini ایفا میکند.
مشابه سایر مدلهای یادگیری ماشین، جیمنی از ستونهای متنی و تصاویر برای تحلیل الگوها و ارائه پاسخ به سوالات خاص استفاده میکند. بر اساس گزارش منبع، گوگل از ترنسکریپت ویدیوهای یوتتیوب برای آموزش Gemini استفاده کرده است. با این حال، وکلای شرکت به دقت به موارد استفاده شده در طول آموزش نظارت میکنند تا از نقض دادههای محفوظ حق تکثیر پیروی شود.