متا مدل کوچک‌تر هوش مصنوعی Llama را راه‌اندازی می‌کند

متا ممکن است قبل از مدل بزرگ‌تر، مدل کوچک‌تر هوش مصنوعی Llama را منتشر کند. این مدل‌ها قبل از راه‌اندازی مدل اصلی در سال جاری عرضه خواهند شد.

به‌گزارش تک‌ناک، شرکت متا قصد دارد نسخه‌های کوچک‌تر مدل زبان بزرگ Llama خود را منتشر کند؛ زیرا شرکت‌ها به‌دنبال ارائه مدل‌های هوش مصنوعی مقرون‌به‌صرفه‌تر برای عموم هستند.

طبق گزارش The Information، این شرکت می‌خواهد قبل از عرضه مدل اصلی در تابستان، دو نسخه کوچک از Llama 3 را در ماه جاری عرضه کند. ورج می‌نویسد که این اقدام بر روند رو‌به‌رشد توسعه‌دهندگان هوش مصنوعی در افزودن گزینه‌های مدل هوش مصنوعی سبک‌ تأکید می‌کند.

پیش‌ازاین و در فوریه سال گذشته، متا نسخه کوچک‌تری از مدل Llama 2 خود موسوم به Llama 2 7B را معرفی کرده بود. گوگل نیز در فوریه سال گذشته، خانواده مدل‌های Gemma را رونمایی کرد و شرکت فرانسوی هوش مصنوعی Mistral نیز Mistral 7B را دارد.

این مدل‌ها معمولاً نمی‌توانند رشته‌های طولانی دستورالعمل‌های کاربر را مدیریت کنند؛ اما سریع‌تر و انعطاف‌پذیرتر و ارزان‌تر از مدل‌های معمولی اجرا می‌شوند. با‌این‌حال، این‌ها همچنان مدل‌های هوش مصنوعی قدرتمندی هستند که فایل‌های PDF و مکالمات و نوشتن کد را می‌توانند خلاصه کنند.

مدل‌های بزرگ‌تر معمولاً برای کارهای پیچیده‌تر مانند تولید عکس یا کارهای نیازمند اجرای چندین دستور استفاده می‌شوند. ازآنجاکه مدل‌های کوچک فقط با تعداد کمتری از پارامترها (داده‌هایی که یاد می‌گیرند) کار می‌کنند، به قدرت پردازش کمتری احتیاج دارند و در‌نتیجه، مقرون‌به‌صرفه‌تر هستند.

مدل‌های سبک‌ تمایل دارند کاربرانی را جذب کنند که لزوماً نمی‌خواهند از وسعت مدل زبان بزرگ برای برنامه‌های کاربردی خود استفاده کنند. مدل‌های کوچک‌تر اغلب می‌توانند در پروژه‌های خاصی مانند کمک به کد یا در دستگاه‌هایی مانند تلفن یا لپ‌تاپ مستقر شوند که نمی‌توانند از مصرف برق مدل هوش مصنوعی بزرگ‌تر پشتیبانی کنند.

طبق گزارش‌ها، متا Llama 3 را در جولای ۲۰۲۴ دردسترس قرار خواهد داد. ممکن است این مدل بتواند به سؤالات بحث‌برانگیزی جواب دهد که Llama 2 ازپس پاسخ‌گویی به آن‌ها برنمی‌آمد.