IBM نسل سوم مدلهای زبانی بزرگ هوش مصنوعی Granite 3.0 را منتشر کرد. این مدلها بهصورت متنباز دراختیار محیطهای سازمانی قرار گرفتهاند.
بهگزارش تکناک، IBM نسخههای جدید مدلهای زبان بزرگ خود با نام Granite 3.0 را رونمایی کرد. این اقدام در راستای گسترش کسبوکار هوش مصنوعی سازمانی این شرکت و با هدف تسریع در رشد بخش هوش مصنوعی تولیدی IBM انجام شده است.
بهگفته مقامهای IBM، کسبوکار مربوط به هوش مصنوعی مولد این شرکت درحالحاضر به بیش از ۲ میلیارد دلار رسیده است و این شرکت با عرضه نسل سوم Granite بهدنبال افزایش مقیاس و نفوذ بیشتر در بازار هوش مصنوعی سازمانی است. نسل جدید مدلهای Granite با تمرکز بر هوش مصنوعی متنباز واقعی طراحی شده است و قابلیت بهینهسازی و تنظیم برای استفادههای سازمانی ازطریق فناوری InstructLab را دارند.
فهرست مطالب
معرفی مدلهای جدید Granite 3.0
ونچربیت مینویسد که مدلهای هوش مصنوعی Granite 3.0 شامل گزینههای عمومی با ۲ میلیارد و ۸ میلیارد پارامتر هستند. همچنین، مدلهای Mixture-of-Experts (MoE) با عناوینی مانند Granite 3.0 3B A800M Instruct ،Granite 3.0 1B A400M Instruct ،Granite 3.0 3B A800M Base و Granite 3.0 1B A400M Base ارائه شدهاند.
علاوهبراین، IBM گروهی از مدلهای محافظتی و ایمنی بهینهسازیشده با عنوان Granite Guardian 3.0 را با ۸ و ۲ میلیارد پارامتر عرضه کرده است. تمامی این مدلهای جدید ازطریق سرویس watsonX IBM و نیز پلتفرمهای Amazon Bedrock و Amazon Sagemaker و Hugging Face دردسترس خواهند بود.
پیشرفتهای Granite 3.0 برای هوش مصنوعی سازمانی
نسل جدید مدلهای Granite 3.0 با هدف پشتیبانی از کاربردهای مختلف سازمانی ازجمله خدمات مشتری، اتوماسیون فناوری اطلاعات، برونسپاری فرایندهای کسبوکار (BPO)، توسعه برنامهها و امنیت سایبری طراحی شدهاند. این مدلها را تیم متمرکز مدلسازی دادههای IBM توسعه داده که مسئول جمعآوری و مدیریت دادههای آموزشی است.
بهبود کیفیت دادهها و نوآوریهای معماری در Granite 3.0
داریو گیل، معاون ارشد و مدیر بخش تحقیقات IBM، درباره فرایند آموزش مدلهای هوش مصنوعی Granite 3.0 توضیح داد که آنها براساس ۱۲ تریلیون توکن داده شامل دادههای زبانی در چندین زبان و دادههای کد آموزش داده شدهاند. او تأکید کرد که تفاوت مهم این نسل با نسلهای قبلی در کیفیت دادهها و نوآوریهای معماری استفادهشده در فرایند آموزش بوده است. طبق اظهارات گیل، مدلهای Granite در آزمایشهای مختلف عملکرد رضایتبخشی از خود نشان دادهاند و از مدلهای پیشرفتهای مانند مدلهای گوگل و آنتروپیک پیشی گرفتهاند.
تمرکز بر ایمنی و اعتماد در Granite 3.0
IBM علاوهبر عملکرد، تمرکز ویژهای بر ایمنی و اعتماد کاربران میکند و مدلهای پیشرفتهای با عنوان Guardian توسعه داده است که به جلوگیری از دستکاری مدلهای اصلی و تولید محتوای مضر کمک میکنند. این مدلها در اندازهها و دستهبندیهای مختلف عرضه میشوند تا ازنظر هزینههای استنتاجی نیز مقرونبهصرفه باشند.
یکی از تفاوتهای اصلی Granite 3.0، تصمیم IBM برای انتشار این مدلها تحت مجوز متنباز Apache 2.0 است که Open Source Initiative (OSI) نیز آنها را تأیید کرده است. این اقدام انعطافپذیری بیشتری به شرکای تجاری IBM میبخشد و به آنها اجازه میدهد که برندها و مالکیتهای فکری خود را براساس این مدلها توسعه دهند. بهگفته گیل، این تصمیم به ایجاد اکوسیستم قوی از راهحلها و برنامههای کاربردی مبتنی بر فناوری Granite کمک خواهد کرد.
IBM به آیندهای فراتر از هوش مصنوعی مولد میاندیشد و در حال بررسی مفهومی به نام محاسبات تولیدی است. این مفهوم به توانایی برنامهنویسی کامپیوترها با استفاده از ارائه مثالها یا درخواستها بهجای نوشتن دستورالعملهای دقیق اشاره میکند. بهگفته داریو گیل، این پارادایمی اساسی برای آیبیام است. وی افزود: «ما تازه در حال لمس این احساس هستیم که با تعامل با مدلهای زبان بزرگ (LLMs) به وجود آمده است.» او همچنین اشاره کرد که IBM بهشدت در این زمینه سرمایهگذاری خواهد کرد تا نسل بعدی مدلها و چهارچوبهای هوشمند را پیادهسازی کند.