مدل GLM-5؛ هوش مصنوعی متن‌باز جدید با قیمت پایین و عملکرد رکوردشکن

استارتاپ هوش مصنوعی چینی Zhupai که با نام z.ai نیز شناخته می‌شود، این هفته با یک مدل زبانی بزرگ و پیشرفته به نام GLM-5 بازگشته است.

به‌گزارش سرویس هوش مصنوعی تک‌ناک، این مدل جدیدترین نسخه از سری GLM است و همچنان تحت مجوز MIT عرضه می‌شود؛ موضوعی که آن را برای استقرار در محیط‌های سازمانی بسیار مناسب می‌کند.

GLM-5 در یکی از مهم‌ترین دستاوردهای خود، در شاخص مستقل Artificial Analysis Intelligence Index v4.0 کمترین نرخ «توهم» (Hallucination) را ثبت کرده است. این مدل در شاخص AA-Omniscience امتیاز -1 کسب کرده که نسبت به نسل قبلی خود بهبود ۳۵ واحدی محسوب می‌شود.

این عملکرد باعث شده مدل GLM-5 در زمینه «قابلیت اطمینان دانشی» از رقبای آمریکایی مانند گوگل، OpenAI و آنتروپیک پیشی بگیرد؛ زیرا بهتر تشخیص می‌دهد چه زمانی باید از پاسخ دادن خودداری کند تا از ارائه اطلاعات نادرست جلوگیری شود.

بیشتر بخوانید: هزینه واقعی ارائه خدمات هوش مصنوعی در حال افزایش است

فراتر از توانایی‌های استدلالی، مدل GLM-5 برای کارهای دانشی کاربردی طراحی شده است. این مدل دارای قابلیت Agent Mode بومی است که به آن اجازه می‌دهد دستورات خام یا منابع ورودی را به اسناد حرفه‌ای مانند فایل‌های .docx، .pdf و .xlsx تبدیل کند.

این مدل می‌تواند گزارش‌های مالی دقیق، پیشنهادهای اسپانسری برای مدارس یا صفحات گسترده پیچیده تولید کند و خروجی‌هایی ارائه دهد که به‌طور مستقیم در جریان کاری سازمان‌ها قابل استفاده هستند. همچنین مدل GLM-5 با قیمت بسیار رقابتی عرضه شده است؛ حدود ۰.۸۰ دلار به ازای هر میلیون توکن ورودی و ۲.۵۶ دلار برای هر میلیون توکن خروجی.

01
از 05
مقیاس‌پذیری برای بهره‌وری

در قلب GLM-5 یک جهش بزرگ در تعداد پارامترها قرار دارد. این مدل از ۳۵۵ میلیارد پارامتر در GLM-4.5 به ۷۴۴ میلیارد پارامتر رسیده است و در معماری «ترکیب متخصصان» (MoE)، حدود ۴۰ میلیارد پارامتر به‌ازای هر توکن فعال می‌شود.

این رشد با افزایش داده‌های پیش‌آموزشی به ۲۸.۵ تریلیون توکن همراه بوده است. برای حل ناکارآمدی‌های آموزشی در این مقیاس، شرکت Z.ai زیرساخت جدیدی به نام «slime» توسعه داده است که یک چارچوب نوین یادگیری تقویتی ناهمگام (Asynchronous RL) محسوب می‌شود. در روش‌های سنتی RL معمولا گلوگاه‌های طولانی در پردازش ایجاد می‌شود؛ اما Slime این وابستگی زمانی را می‌شکند و اجازه می‌دهد مسیرهای یادگیری به‌صورت مستقل تولید شوند، که این موضوع چرخه تکرار و بهبود را برای رفتارهای پیچیده عامل‌محور تسریع می‌کند.

حتما بخوانید: هوش مصنوعی GPT-5.6 بزودی عرضه می‌شود

با استفاده از بهینه‌سازی‌هایی مانند Active Partial Rollouts (APRIL)، این سیستم گلوگاه‌های تولید داده را که معمولا بیش از ۹۰ درصد زمان آموزش RL را مصرف می‌کنند کاهش می‌دهد و سرعت آموزش را به‌طور قابل توجهی افزایش می‌دهد. معماری این چارچوب بر یک سیستم سه‌بخشی استوار است: ماژول آموزش با کارایی بالا مبتنی بر Megatron-LM، ماژول تولید داده با استفاده از SGLang و روترهای اختصاصی برای توان عملیاتی بالا، و یک Data Buffer مرکزی برای مدیریت ورودی‌ها و ذخیره مسیرهای اجرا.

با پشتیبانی از محیط‌های قابل‌اعتبارسنجی و حلقه‌های بازخورد چندمرحله‌ای، Slime زیرساختی مقیاس‌پذیر برای حرکت از مدل‌های گفت‌وگومحور به سمت سیستم‌های مهندسی پیچیده و بلندمدت فراهم می‌کند. برای ساده‌سازی استقرار، GLM-5 از DeepSeek Sparse Attention (DSA) استفاده می‌کند که ظرفیت کانتکست ۲۰۰ هزار توکن را حفظ کرده و در عین حال هزینه‌ها را به‌شدت کاهش می‌دهد.

02
از 05
کار دانشی انتها به انتها

Z.ai مدل GLM-5 را به‌عنوان یک ابزار اداری برای عصر AGI معرفی می‌کند. برخلاف مدل‌های قبلی که بیشتر خروجی‌های کوتاه تولید می‌کردند، GLM-5 برای تولید اسناد آماده استفاده طراحی شده است. این مدل می‌تواند به‌صورت خودکار دستورات را به فایل‌های ساختاریافته مانند .docx، .pdf و .xlsx تبدیل کند. در عمل، این یعنی مدل می‌تواند اهداف سطح بالا را به زیرکارهای اجرایی تقسیم کند و در قالب «مهندسی عامل‌محور» عمل کند؛ جایی که انسان معیارهای کیفیت را تعیین می‌کند و هوش مصنوعی اجرای کامل را بر عهده می‌گیرد.

03
از 05
عملکرد و بنچمارک‌ها

بر اساس ارزیابی‌های منتشرشده توسط Artificial Analysis، GLM-5 اکنون به‌عنوان قدرتمندترین مدل متن‌باز جهان شناخته می‌شود و حتی از مدل جدید Kimi K2.5 شرکت Moonshot نیز پیشی گرفته که نشانه‌ای از نزدیک شدن شرکت‌های هوش مصنوعی چین به رقبای غربی با منابع بسیار گسترده‌تر محسوب می‌شود. طبق داده‌های منتشرشده توسط z.ai، این مدل در چند بنچمارک کلیدی در سطح state-of-the-art قرار دارد:

SWE-bench Verified: امتیاز 77.8، بالاتر از Gemini 3 Pro با 76.2 و نزدیک به Claude Opus 4.6 با 80.9
Vending Bench 2: در شبیه‌سازی مدیریت یک کسب‌وکار، GLM-5 در میان مدل‌های متن‌باز رتبه اول را کسب کرده و به موجودی نهایی 4,432.12 دلار رسیده است

04
از 05
فراتر از عملکرد؛ رقابت قیمتی GLM-5

مدل GLM-5 علاوه بر عملکرد بالا، با قیمت‌گذاری تهاجمی بازار را تحت فشار قرار داده است. این مدل که از ۱۱ فوریه ۲۰۲۶ در OpenRouter عرضه شده، با قیمت حدود ۰.۸۰ تا ۱ دلار برای هر میلیون توکن ورودی و ۲.۵۶ تا ۳.۲۰ دلار برای هر میلیون توکن خروجی ارائه می‌شود. این قیمت در مقایسه با سایر مدل‌های بزرگ در محدوده متوسط قرار می‌گیرد، اما با توجه به عملکرد سطح بالای آن در بنچمارک‌ها، از دید بسیاری یک گزینه بسیار مقرون‌به‌صرفه محسوب می‌شود.

این نرخ‌ها حدود ۶ برابر ارزان‌تر در ورودی و نزدیک به ۱۰ برابر ارزان‌تر در خروجی نسبت به Claude Opus 4.6 (۵ دلار / ۲۵ دلار) هستند. این عرضه همچنین شایعاتی را تقویت کرده که نشان می‌دهد Zhipu AI پشت مدل مخفی Pony Alpha بوده؛ مدلی که پیش‌تر در بنچمارک‌های برنامه‌نویسی در OpenRouter عملکرد بسیار قدرتمندی نشان داده بود.

خبر پیشنهادی: سامسونگ از برنامه سازمانی «گذار هوش مصنوعی» خود رونمایی کرد

با این حال، همه کاربران اولیه نسبت به این مدل دیدگاه کاملا مثبت ندارند و معتقدند عملکرد بالا تمام ماجرا را توضیح نمی‌دهد. لوکاس پترسون، هم‌بنیان‌گذار استارتاپ Andon Labs، در شبکه X نوشت: «پس از ساعت‌ها بررسی traceهای GLM-5: مدلی فوق‌العاده قدرتمند، اما با آگاهی موقعیتی بسیار پایین‌تر. اهداف را با تاکتیک‌های تهاجمی دنبال می‌کند اما موقعیت خود را درک نمی‌کند یا از تجربه استفاده نمی‌کند.

این نگران‌کننده است.» او به مفهوم «Paperclip Maximizer» اشاره کرد؛ سناریویی فرضی که نخستین‌بار توسط فیلسوف آکسفورد نیک بوستروم در سال ۲۰۰۳ مطرح شد و در آن یک هوش مصنوعی با دنبال کردن یک هدف ساده (مثل تولید حداکثر گیره کاغذ) به‌تدریج تمام منابع جهان را در خدمت آن هدف قرار می‌دهد و در نهایت به یک فاجعه وجودی منجر می‌شود.

05
از 05
آیا شرکت‌ها باید مدل GLM-5 را بپذیرند؟

سازمان‌هایی که به دنبال خروج از وابستگی به فروشندگان بسته هستند، در مدل GLM-5 به دلیل مجوز MIT و دسترسی متن‌باز، یک مزیت راهبردی مهم خواهند یافت. برخلاف مدل‌های بسته، این سیستم امکان استقرار کامل در زیرساخت‌های داخلی را فراهم می‌کند. با این حال، پذیرش آن بدون چالش نیست. مقیاس عظیم مدل (۷۴۴ میلیارد پارامتر) نیازمند زیرساخت سخت‌افزاری گسترده‌ای است که برای شرکت‌های کوچک بدون دسترسی به کلاسترهای GPU ابری یا داخلی چندان قابل دسترس نیست. مدیران امنیتی نیز باید پیامدهای ژئوپلیتیکی استفاده از یک مدل توسعه‌یافته در چین را در نظر بگیرند؛ به‌ویژه در صنایع حساس که الزامات سختگیرانه‌ای درباره محل ذخیره‌سازی داده و سرچشمه آن وجود دارد.

علاوه بر این، حرکت به سمت عامل‌های خودمختار هوش مصنوعی، ریسک‌های جدیدی در حوزه حاکمیت و کنترل ایجاد می‌کند. زمانی که مدل‌ها از حالت گفت‌وگو به اجرای وظایف واقعی در فایل‌ها و اپلیکیشن‌ها منتقل می‌شوند، در صورت نبود چارچوب‌های کنترل دسترسی و نظارت انسانی، احتمال خطاهای خودکار به‌طور قابل توجهی افزایش می‌یابد. در نهایت، مدل GLM-5 برای سازمان‌هایی مناسب است که از ابزارهای ساده دستیار هوشمند عبور کرده و به‌دنبال ساخت یک محیط کاری کاملا خودمختار هستند.

این مدل برای مهندسانی طراحی شده که نیاز به بازسازی سیستم‌های پیچیده یا ایجاد پایپ‌لاین‌های خودترمیم‌شونده دارند. در حالی که آزمایشگاه‌های غربی بر عمق استدلال و فرآیند تفکر تمرکز دارند، رویکرد Z.ai بر اجرا و مقیاس‌پذیری متمرکز است. در نتیجه، سازمان‌هایی که امروز GLM-5 را اتخاذ می‌کنند، یک مدل ارزان‌تر خریداری نمی‌کنند؛ بلکه روی آینده‌ای سرمایه‌گذاری می‌کنند که در آن ارزشمندترین هوش مصنوعی، سیستمی است که کار را بدون تکرار درخواست به پایان می‌رساند.