IBM نسخه‌های متن‌باز هوش مصنوعی Granite 3.0 را رونمایی کرد

IBM نسل سوم مدل‌های زبانی بزرگ هوش مصنوعی Granite 3.0 را منتشر کرد. این مدل‌ها به‌صورت متن‌باز در‌اختیار محیط‌های سازمانی قرار گرفته‌اند.

به‌گزارش تک‌ناک، IBM نسخه‌های جدید مدل‌های زبان بزرگ خود با نام Granite 3.0 را رونمایی کرد. این اقدام در راستای گسترش کسب‌وکار هوش مصنوعی سازمانی این شرکت و با هدف تسریع در رشد بخش هوش مصنوعی تولیدی IBM انجام شده است.

به‌گفته مقام‌های IBM، کسب‌وکار مربوط به هوش مصنوعی مولد این شرکت در‌حال‌حاضر به بیش از ۲ میلیارد دلار رسیده است و این شرکت با عرضه نسل سوم Granite به‌دنبال افزایش مقیاس و نفوذ بیشتر در بازار هوش مصنوعی سازمانی است. نسل جدید مدل‌های Granite با تمرکز بر هوش مصنوعی متن‌باز واقعی طراحی شده است و قابلیت بهینه‌سازی و تنظیم برای استفاده‌های سازمانی ازطریق فناوری InstructLab را دارند.

01
از 04
معرفی مدل‌های جدید Granite 3.0

ونچربیت می‌نویسد که مدل‌های هوش مصنوعی Granite 3.0 شامل گزینه‌های عمومی با ۲ میلیارد و ۸ میلیارد پارامتر هستند. همچنین، مدل‌های Mixture-of-Experts (MoE) با عناوینی مانند Granite 3.0 3B A800M Instruct ،‌Granite 3.0 1B A400M Instruct ،‌Granite 3.0 3B A800M Base و Granite 3.0 1B A400M Base ارائه شده‌اند.

علاوه‌بر‌این، IBM گروهی از مدل‌های محافظتی و ایمنی بهینه‌سازی‌شده با عنوان Granite Guardian 3.0 را با ۸ و ۲ میلیارد پارامتر عرضه کرده است. تمامی این مدل‌های جدید از‌طریق سرویس watsonX IBM و نیز پلتفرم‌های Amazon Bedrock و Amazon Sagemaker و Hugging Face در‌دسترس خواهند بود.

02
از 04
پیشرفت‌های Granite 3.0 برای هوش مصنوعی سازمانی

نسل جدید مدل‌های Granite 3.0 با هدف پشتیبانی از کاربردهای مختلف سازمانی از‌جمله خدمات مشتری، اتوماسیون فناوری اطلاعات، برون‌سپاری فرایندهای کسب‌وکار (BPO)، توسعه برنامه‌ها و امنیت سایبری طراحی شده‌اند. این مدل‌ها را تیم متمرکز مدل‌سازی داده‌های IBM توسعه داده که مسئول جمع‌آوری و مدیریت داده‌های آموزشی است.

03
از 04
بهبود کیفیت داده‌ها و نوآوری‌های معماری در Granite 3.0

داریو گیل، معاون ارشد و مدیر بخش تحقیقات IBM، درباره فرایند آموزش مدل‌های هوش مصنوعی Granite 3.0 توضیح داد که آن‌ها بر‌اساس ۱۲ تریلیون توکن داده شامل داده‌های زبانی در چندین زبان و داده‌های کد آموزش داده شده‌اند. او تأکید کرد که تفاوت مهم این نسل با نسل‌های قبلی در کیفیت داده‌ها و نوآوری‌های معماری استفاده‌شده در فرایند آموزش بوده است. طبق اظهارات گیل، مدل‌های Granite در آزمایش‌های مختلف عملکرد رضایت‌بخشی از خود نشان داده‌اند و از مدل‌های پیشرفته‌ای مانند مدل‌های گوگل و آنتروپیک پیشی گرفته‌اند.

04
از 04
تمرکز بر ایمنی و اعتماد در Granite 3.0

IBM علاوه‌بر عملکرد، تمرکز ویژه‌ای بر ایمنی و اعتماد کاربران می‌کند و مدل‌های پیشرفته‌ای با عنوان Guardian توسعه داده است که به جلوگیری از دست‌کاری مدل‌های اصلی و تولید محتوای مضر کمک می‌کنند. این مدل‌ها در اندازه‌ها و دسته‌بندی‌های مختلف عرضه می‌شوند تا ازنظر هزینه‌های استنتاجی نیز مقرون‌به‌صرفه باشند.

یکی از تفاوت‌های اصلی Granite 3.0، تصمیم IBM برای انتشار این مدل‌ها تحت مجوز متن‌باز Apache 2.0 است که Open Source Initiative (OSI) نیز آن‌ها را تأیید کرده است. این اقدام انعطاف‌پذیری بیشتری به شرکای تجاری IBM می‌بخشد و به آن‌ها اجازه می‌دهد که برندها و مالکیت‌های فکری خود را بر‌اساس این مدل‌ها توسعه دهند. به‌گفته گیل، این تصمیم به ایجاد اکوسیستم قوی از راه‌حل‌ها و برنامه‌های کاربردی مبتنی بر فناوری Granite کمک خواهد کرد.

IBM به آینده‌ای فراتر از هوش مصنوعی مولد می‌اندیشد و در حال بررسی مفهومی به نام محاسبات تولیدی است. این مفهوم به توانایی برنامه‌نویسی کامپیوترها با استفاده از ارائه مثال‌ها یا درخواست‌ها به‌جای نوشتن دستورالعمل‌های دقیق اشاره می‌کند. به‌گفته داریو گیل، این پارادایمی اساسی برای آی‌بی‌ام است. وی افزود: «ما تازه در حال لمس این احساس هستیم که با تعامل با مدل‌های زبان بزرگ (LLMs) به وجود آمده است.» او همچنین اشاره کرد که IBM به‌شدت در این زمینه سرمایه‌گذاری خواهد کرد تا نسل بعدی مدل‌ها و چهارچوب‌های هوشمند را پیاده‌سازی کند.