گوگل با استفاده از Google-Extended به صاحبان وب سایت ها راهی جدید برای کنترل دادههای آموزش مدلهای هوش مصنوعی و “تاثیر وبسایتهایشان بر بهبود بارد و Vertex AI generative APIs” ارائه میدهد.
به گزارش تکناک، مدلهای زبان بزرگ (LLMs) بر اساس حجم عظیمی از داده، ماننده محتوای وب، آموزش میبینند. گوگل در ماه ژوئیه، برای ایجاد یک robots.txt مدرن برای هوشمصنوعی ، فراخوان داده بود.
گوگل در این مورد می گوید:مدیر وبسایت با استفاده از Google-Extended برای کنترل دسترسی به محتوا در یک وبسایت میتواند تصمیم بگیرد که آیا سایت او به مدلهای هوشمصنوعی کمک کند تا در طول زمان دقیقتر و کارآمدتر شوند یا خیر.
Google-Extended، که بخشی از robots.txt است، به طور خاص برای آموزش Bard و Vertex AI (که به عنوان یکی از خدمات فضای ابری گوگل به اشخاص شخص ثالث ارائه میشود) و همچنین “نسلهای آینده از مدلهایی که این محصولات را تغذیه میکنند” اعمال میشود.
Google-Extended یک پروژه تحقیقاتی است که توسط Google AI در حال توسعه است. این پروژه بر روی توسعه زیرساختها و ابزارهایی برای تسهیل توسعه و استفاده از مدلهای زبانی بزرگ (LLMs) تمرکز دارد.
LLMs مدلهای یادگیری ماشینی هستند که میتوانند متن تولید کنند، زبانها را ترجمه کنند، انواع مختلف محتوای خلاقانه بنویسند و به سؤالات شما به روشی آموزنده پاسخ دهند. آنها در حال حاضر در بسیاری از محصولات گوگل استفاده میشوند، از جمله Google Search، Google Assistant و Google Translate.
Google-Extended بر روی توسعه زیرساختهایی برای تسهیل توسعه و استفاده از LLMs تمرکز دارد. این زیرساختها شامل موارد زیر است:
- یک پلتفرم محاسباتی مقیاسپذیر برای آموزش و اجرا LLMs
- یک مجموعه داده بزرگ از متن و کد برای آموزش LLMs
- ابزارهای برای ارزیابی و بهبود LLMs
Google-Extended همچنین بر روی توسعه ابزارهایی برای تسهیل استفاده از LLMs توسط توسعهدهندگان شخص ثالث تمرکز دارد. این ابزارها شامل موارد زیر است:
- یک API برای دسترسی به LLMs
- یک کتابخانه برای توسعه برنامههایی که از LLMs استفاده میکنند
- یک مستندات آموزشی برای توسعهدهندگان
گوگل اعلام میکند که شنیده است که انتشاردهندگان وب “خواهان انتخاب و کنترل بیشتر بر نحوه استفاده از محتوای آنها برای موارد استفاده از هوش مصنوعی مولد هستند”. این شرکت این را “یک گام مهم در ارائه شفافیت و کنترلی دانست که ما باور داریم که تمام ارائهدهندگان مدلهای هوش مصنوعی باید در اختیارمدیران سایتها قرار دهند”.
گوگل میگوید : ما به برقراری تعامل با جوامع وب و هوش مصنوعی برای بررسی رویکردهای دیگر خواندنی توسط ماشین برای انتخاب و کنترل برای انتشاردهندگان وب متعهد هستیم.