شرکت Hugging Face مدلهای هوش مصنوعی جدیدش را با کاهش چشمگیر اندازه در عین حفظ دقت و کارایی و مناسب برای اجرا روی دستگاههایی با منابع محدود رونمایی کرد.
به گزارش تکناک، استارتاپ Hugging Face مدلهای هوش مصنوعی جدیدی به نام SmolVLM-256M و SmolVLM-500M معرفی کرده است که ادعا میشود کوچکترین مدلهای هوش مصنوعی در نوع خود هستند. این مدلها قابلیت تحلیل تصاویر و ویدئوهای کوتاه و متون را دارند و بهگونهای طراحی شدهاند که بتوانند روی دستگاههایی با محدودیت سختافزاری، مانند لپتاپهایی با کمتر از یک گیگابایت رم، بهخوبی عمل کنند.
تککرانچ مینویسد که مدلهای جدید SmolVLM-256M و SmolVLM-500M بهترتیب ۲۵۶ میلیون و ۵۰۰ میلیون پارامتر دارند. این پارامترها تعیینکننده تواناییهای مدل در حل مسائل پیچیده، ازجمله عملکرد آنها در آزمونهای ریاضی و وظایف مشابه محسوب میشوند. هر دو مدل میتوانند وظایفی مانند توصیف تصاویر یا کلیپهای ویدئویی، پاسخ به پرسشهای مرتبط با فایلهای PDF و تحلیل متنها و نمودارهای اسکنشده را انجام دهند.
این مدلها با استفاده از مجموعهدادههای The Cauldron و Docmatix توسعه یافتهاند. The Cauldron شامل ۵۰ مجموعه داده باکیفیت از تصاویر و متون است و Docmatix نیز مجموعهای از اسکن فایلها همراه با توضیحات دقیق را دربر دارد. هر دو مجموعه را تیم M4 در Hugging Face تهیه کرده است که در توسعه فناوریهای هوش مصنوعی چندوجهی تخصص دارد.
طبق اعلام تیم Hugging Face، مدلهای جدید توانستهاند در آزمونهایی مانند AI2D که توانایی تحلیل نمودارهای علمی سطح مدرسه را ارزیابی میکند، عملکرد بهتری از مدل بسیار بزرگتر Idefics 80B از خود نشان دهند. این مدلها اکنون تحت لایسنس Apache 2.0 برای استفاده بدون محدودیت در دسترس هستند و کاربران میتوانند آنها را از وبسایت Hugging Face دانلود کنند.
هرچند مدلهای کوچک مانند SmolVLM-256M و SmolVLM-500M بهدلیل هزینه کم و انعطافپذیری زیاد جذاب هستند، ممکن است در مقایسه با مدلهای بزرگتر دچار کاستیهایی شوند. پژوهشی که مؤسسههای دیپمایند گوگل و Mila در کبک انجام دادهاند، نشان میدهد مدلهای کوچکتر در وظایف استدلال پیچیده عملکرد ضعیفتری دارند. دلیل این امر ممکن است به توانایی محدود این مدلها در تشخیص الگوهای سطحی دادهها و اعمال آنها در زمینههای جدید مرتبط باشد.
شرکت Hugging Face با معرفی مدلهای کوچک و کارآمد خود نشان داده است که میتوان هوش مصنوعی را برای استفاده روی دستگاههای محدود نیز بهینه کرد. این پیشرفت میتواند گامی مؤثر در کاهش هزینههای پردازش دادهها و گسترش کاربردهای هوش مصنوعی در زمینههای مختلف باشد.