متا ممکن است قبل از مدل بزرگتر، مدل کوچکتر هوش مصنوعی Llama را منتشر کند. این مدلها قبل از راهاندازی مدل اصلی در سال جاری عرضه خواهند شد.
بهگزارش تکناک، شرکت متا قصد دارد نسخههای کوچکتر مدل زبان بزرگ Llama خود را منتشر کند؛ زیرا شرکتها بهدنبال ارائه مدلهای هوش مصنوعی مقرونبهصرفهتر برای عموم هستند.
طبق گزارش The Information، این شرکت میخواهد قبل از عرضه مدل اصلی در تابستان، دو نسخه کوچک از Llama 3 را در ماه جاری عرضه کند. ورج مینویسد که این اقدام بر روند روبهرشد توسعهدهندگان هوش مصنوعی در افزودن گزینههای مدل هوش مصنوعی سبک تأکید میکند.
پیشازاین و در فوریه سال گذشته، متا نسخه کوچکتری از مدل Llama 2 خود موسوم به Llama 2 7B را معرفی کرده بود. گوگل نیز در فوریه سال گذشته، خانواده مدلهای Gemma را رونمایی کرد و شرکت فرانسوی هوش مصنوعی Mistral نیز Mistral 7B را دارد.
این مدلها معمولاً نمیتوانند رشتههای طولانی دستورالعملهای کاربر را مدیریت کنند؛ اما سریعتر و انعطافپذیرتر و ارزانتر از مدلهای معمولی اجرا میشوند. بااینحال، اینها همچنان مدلهای هوش مصنوعی قدرتمندی هستند که فایلهای PDF و مکالمات و نوشتن کد را میتوانند خلاصه کنند.
مدلهای بزرگتر معمولاً برای کارهای پیچیدهتر مانند تولید عکس یا کارهای نیازمند اجرای چندین دستور استفاده میشوند. ازآنجاکه مدلهای کوچک فقط با تعداد کمتری از پارامترها (دادههایی که یاد میگیرند) کار میکنند، به قدرت پردازش کمتری احتیاج دارند و درنتیجه، مقرونبهصرفهتر هستند.
مدلهای سبک تمایل دارند کاربرانی را جذب کنند که لزوماً نمیخواهند از وسعت مدل زبان بزرگ برای برنامههای کاربردی خود استفاده کنند. مدلهای کوچکتر اغلب میتوانند در پروژههای خاصی مانند کمک به کد یا در دستگاههایی مانند تلفن یا لپتاپ مستقر شوند که نمیتوانند از مصرف برق مدل هوش مصنوعی بزرگتر پشتیبانی کنند.
طبق گزارشها، متا Llama 3 را در جولای ۲۰۲۴ دردسترس قرار خواهد داد. ممکن است این مدل بتواند به سؤالات بحثبرانگیزی جواب دهد که Llama 2 ازپس پاسخگویی به آنها برنمیآمد.