گام بلند متا برای شکست ChatGPT

متا اعلام کرده است که مدل زبان بزرگ خود به نام LLaMA 2 را به صورت متن باز منتشر می کند و آن را برای استفاده تجاری و تحقیقاتی به صورت رایگان در دسترس قرار می دهد.

به گزارش تکناک، این کار برای رقابت با GPT-4 شرکت OpenAI که ابزارهایی مانند ChatGPT و Microsoft Bing را تأمین می کند، صورت می گیرد.

متا این حرکت را به عنوان بخشی از رویداد Inspire شرکت مایکروسافت اعلام کرده است و به حمایت آن از Azure و Windows و همکاری رو به رشد بین دو شرکت اشاره کرده است. در همین حین، مایکروسافت جزئیات بیشتری در مورد ابزارهای هوش مصنوعی موجود در پلتفرم 360 خود و هزینه های آنها اعلام کرده است.

همچنین، کوالکام نیز اعلام کرده است که در همکاری با متا، از سال 2024 به بعد در راستای ارائه برنامه های کاربردی هوش مصنوعی بدون وابستگی به خدمات ابری، مدل LLaMa را در لپ تاپ ها، تلفن همراه ها و هدست ها به کار می برد.

در بیانیه مطبوعاتی متا، تصمیم برای بازگشایی LLaMA به عنوان یک راه برای دسترسی کسب و کارها، شرکت های نوپا و پژوهشگران به ابزارهای بیشتر هوش مصنوعی، که به عنوان یک جامعه آزمایشی عمل می کند، توضیح داده شده است.

به گفته متا، LLaMA 2 با داده های 40 درصد بیشتری نسبت به LLaMA 1 آموزش داده شده است، که شامل اطلاعات منابع داده آنلاین عمومی می باشد. همچنین، می گوید که در مقایسه با مدل های زبان بزرگ دیگر مانند Falcon و MPT، در آزمون های استدلال، کدنویسی، مهارت و آزمون های دانش بهبود یافته است.

در بازگشایی LLaMA، متا گفته است که می‌خواهد ایمنی و شفافیت را بهبود بخشد. شرکت اعلام کرده است که مدل LLaMA 2 “red-teamed” شده است، یعنی برای ایمنی آزمایش شده است، با تولید الگوهای مخرب برای تسهیل بهینه‌سازی مدل. همچنین، متا بازگشایی روش و ابزار ارزیابی و بهینه‌سازی مدل‌ها را نیز فاش کرده است. مدل LLaMa 2 در قالب متن باز از طریق پلتفرم Azure شرکت مایکروسافت در دسترس قرار خواهد گرفت. متا نیز گفته است که LLaMA از طریق AWS، Hugging Face و سایر سرویس‌های ارائه دهنده، موجود خواهد بود.

متا در یک بیانیه گفت: ما باور داریم که رویکرد باز، رویکرد صحیحی برای توسعه مدل‌های هوش مصنوعی امروزی است، به ویژه در فضای تولیدی که فناوری در آن به سرعت پیشرفت می کند. باز کردن دسترسی به مدل های هوش مصنوعی امروزی به معنای این است که نسلی از توسعه دهندگان و پژوهشگران می توانند آنها را آزمایش کرده و به عنوان یک جامعه مشکلات را شناسایی و به سرعت حل کنند.

متا ابتدا مدل LLaMA خود را در فوریه معرفی کرده بود، اما چند روز بعد، در سایت 4chan لو رفت. اکنون که بیشتر افراد دسترسی به LLaMA 2 دارند، احتمالاً ابزارهای جدیدی با استفاده از این مدل ساخته خواهند شد. متا می گوید که بیش از 100،000 درخواست برای استفاده از مدل اول خود از سوی پژوهشگران دریافت کرده است، اما مدل متن باز LLaMA 2 احتمالاً یک دسترسی بزرگتر خواهد داشت.