شرکت Stability AI که قبلا با استفاده از هوش مصنوعی ژنراتور تصویری Stable Diffusion را ارائه کرده بود، به تازگی یک مدل زبانی جدید با نام StableLM را با منبع باز منتشر کرد.
به گزارش تکناک، این شرکت با انتشار یک پست در روز چهارشنبه اعلام کرده است که مدلهای زبانی برای استفاده و تطبیق توسعه دهندگان در GitHub در دسترس قرار گرفته است.
مدل زبانی StableLM، مانند رقیبش ChatGPT، برای تولید با کارآیی بالای متن و کد طراحی شده است. این مدل بر روی نسخه بزرگتری از مجموعه داده منبع باز به نام Pile آموزش دیده است که شامل اطلاعاتی از منابع مختلف از جمله ویکیپدیا، Stack Exchange و PubMed است. شرکت Stability AI گفته است که مدلهای StableLM در حال حاضر با 3 تا 7 میلیارد پارامتر در دسترس هستند ولی در آینده مدلهایی با 15 تا 65 میلیارد پارامترهم عرضه خواهد شد.
ربات StableLM با توسعه مدلهای زبان با منبع باز توسط شرکت Stability AI در همکاری با نهاد غیرانتفاعی EleutherAI، ایجاد شد. هدف این شرکت در ساخت این ربات، دسترسی آسانتر به ابزارهای هوش مصنوعی، همانند Stable Diffusion، بوده است. این شرکت، ابزار هوش مصنوعی متن به تصویر خود را به چندین روش مانند نسخه demo عمومی، نسخه beta نرمافزار و دانلود کامل مدل، در اختیار توسعه دهندگان قرار داده است تا با استفاده از این ابزار، ترکیبهای مختلفی را برای ایجاد نوآوریهای جدید بسازند.
ممکن است در آینده، اتفاق مشابهی بین ربات StableLM و مدل زبان منبع باز LLaMa شرکت Meta که خبر آن در ماه گذشته در اینترنت منتشر شده، شاهد باشیم.
به اعتقاد برخی از کاربران انتشار Stable Diffusion نقاط ضعف و قوتی دارد و احتمالاً با تولید متن هوش مصنوعی، دینامیک مشابهی را مجدداً خواهیم دید.
شما میتوانید نسخه demo مدل زبانی StableLM که بهینهسازی شده است را بر روی سایت Hugging Face امتحان کنید. در یک تلاش برای پرسیدن اینکه چطور یک ساندویچ با کره بادام زمین تهیه کنیم، این ربات یک دستور پیچیده و کمی بدون معنی ارائه داد. همچنین، مدل پیشنهاد داد که به کارت تسلیت یک “طراحی جالب” اضافه شود.
شرکت Stability AI اظهار داشته که استفاده از مجموعه دادههایی در مدلهای زبان، باید به رهبری مدلهای پایه به توزیعهای متنی امنتر کمک کند، اما این شرکت هشدار می دهد که تمامی انحرافات و ایرادات با بهینهسازی قابل کاهش نیستند.