فهرست مطالب
استارتاپ هوش مصنوعی چینی Zhupai که با نام z.ai نیز شناخته میشود، این هفته با یک مدل زبانی بزرگ و پیشرفته به نام GLM-5 بازگشته است.
بهگزارش سرویس هوش مصنوعی تکناک، این مدل جدیدترین نسخه از سری GLM است و همچنان تحت مجوز MIT عرضه میشود؛ موضوعی که آن را برای استقرار در محیطهای سازمانی بسیار مناسب میکند.
GLM-5 در یکی از مهمترین دستاوردهای خود، در شاخص مستقل Artificial Analysis Intelligence Index v4.0 کمترین نرخ «توهم» (Hallucination) را ثبت کرده است. این مدل در شاخص AA-Omniscience امتیاز -1 کسب کرده که نسبت به نسل قبلی خود بهبود ۳۵ واحدی محسوب میشود.
این عملکرد باعث شده مدل GLM-5 در زمینه «قابلیت اطمینان دانشی» از رقبای آمریکایی مانند گوگل، OpenAI و آنتروپیک پیشی بگیرد؛ زیرا بهتر تشخیص میدهد چه زمانی باید از پاسخ دادن خودداری کند تا از ارائه اطلاعات نادرست جلوگیری شود.
بیشتر بخوانید: هزینه واقعی ارائه خدمات هوش مصنوعی در حال افزایش است
فراتر از تواناییهای استدلالی، مدل GLM-5 برای کارهای دانشی کاربردی طراحی شده است. این مدل دارای قابلیت Agent Mode بومی است که به آن اجازه میدهد دستورات خام یا منابع ورودی را به اسناد حرفهای مانند فایلهای .docx، .pdf و .xlsx تبدیل کند.
این مدل میتواند گزارشهای مالی دقیق، پیشنهادهای اسپانسری برای مدارس یا صفحات گسترده پیچیده تولید کند و خروجیهایی ارائه دهد که بهطور مستقیم در جریان کاری سازمانها قابل استفاده هستند. همچنین مدل GLM-5 با قیمت بسیار رقابتی عرضه شده است؛ حدود ۰.۸۰ دلار به ازای هر میلیون توکن ورودی و ۲.۵۶ دلار برای هر میلیون توکن خروجی.
01
از 05مقیاسپذیری برای بهرهوری
در قلب GLM-5 یک جهش بزرگ در تعداد پارامترها قرار دارد. این مدل از ۳۵۵ میلیارد پارامتر در GLM-4.5 به ۷۴۴ میلیارد پارامتر رسیده است و در معماری «ترکیب متخصصان» (MoE)، حدود ۴۰ میلیارد پارامتر بهازای هر توکن فعال میشود.
این رشد با افزایش دادههای پیشآموزشی به ۲۸.۵ تریلیون توکن همراه بوده است. برای حل ناکارآمدیهای آموزشی در این مقیاس، شرکت Z.ai زیرساخت جدیدی به نام «slime» توسعه داده است که یک چارچوب نوین یادگیری تقویتی ناهمگام (Asynchronous RL) محسوب میشود. در روشهای سنتی RL معمولا گلوگاههای طولانی در پردازش ایجاد میشود؛ اما Slime این وابستگی زمانی را میشکند و اجازه میدهد مسیرهای یادگیری بهصورت مستقل تولید شوند، که این موضوع چرخه تکرار و بهبود را برای رفتارهای پیچیده عاملمحور تسریع میکند.

حتما بخوانید: هوش مصنوعی GPT-5.6 بزودی عرضه میشود
با استفاده از بهینهسازیهایی مانند Active Partial Rollouts (APRIL)، این سیستم گلوگاههای تولید داده را که معمولا بیش از ۹۰ درصد زمان آموزش RL را مصرف میکنند کاهش میدهد و سرعت آموزش را بهطور قابل توجهی افزایش میدهد. معماری این چارچوب بر یک سیستم سهبخشی استوار است: ماژول آموزش با کارایی بالا مبتنی بر Megatron-LM، ماژول تولید داده با استفاده از SGLang و روترهای اختصاصی برای توان عملیاتی بالا، و یک Data Buffer مرکزی برای مدیریت ورودیها و ذخیره مسیرهای اجرا.
با پشتیبانی از محیطهای قابلاعتبارسنجی و حلقههای بازخورد چندمرحلهای، Slime زیرساختی مقیاسپذیر برای حرکت از مدلهای گفتوگومحور به سمت سیستمهای مهندسی پیچیده و بلندمدت فراهم میکند. برای سادهسازی استقرار، GLM-5 از DeepSeek Sparse Attention (DSA) استفاده میکند که ظرفیت کانتکست ۲۰۰ هزار توکن را حفظ کرده و در عین حال هزینهها را بهشدت کاهش میدهد.
02
از 05کار دانشی انتها به انتها
Z.ai مدل GLM-5 را بهعنوان یک ابزار اداری برای عصر AGI معرفی میکند. برخلاف مدلهای قبلی که بیشتر خروجیهای کوتاه تولید میکردند، GLM-5 برای تولید اسناد آماده استفاده طراحی شده است. این مدل میتواند بهصورت خودکار دستورات را به فایلهای ساختاریافته مانند .docx، .pdf و .xlsx تبدیل کند. در عمل، این یعنی مدل میتواند اهداف سطح بالا را به زیرکارهای اجرایی تقسیم کند و در قالب «مهندسی عاملمحور» عمل کند؛ جایی که انسان معیارهای کیفیت را تعیین میکند و هوش مصنوعی اجرای کامل را بر عهده میگیرد.
03
از 05عملکرد و بنچمارکها
بر اساس ارزیابیهای منتشرشده توسط Artificial Analysis، GLM-5 اکنون بهعنوان قدرتمندترین مدل متنباز جهان شناخته میشود و حتی از مدل جدید Kimi K2.5 شرکت Moonshot نیز پیشی گرفته که نشانهای از نزدیک شدن شرکتهای هوش مصنوعی چین به رقبای غربی با منابع بسیار گستردهتر محسوب میشود. طبق دادههای منتشرشده توسط z.ai، این مدل در چند بنچمارک کلیدی در سطح state-of-the-art قرار دارد:
- SWE-bench Verified: امتیاز 77.8، بالاتر از Gemini 3 Pro با 76.2 و نزدیک به Claude Opus 4.6 با 80.9
- Vending Bench 2: در شبیهسازی مدیریت یک کسبوکار، GLM-5 در میان مدلهای متنباز رتبه اول را کسب کرده و به موجودی نهایی 4,432.12 دلار رسیده است
04
از 05فراتر از عملکرد؛ رقابت قیمتی GLM-5
مدل GLM-5 علاوه بر عملکرد بالا، با قیمتگذاری تهاجمی بازار را تحت فشار قرار داده است. این مدل که از ۱۱ فوریه ۲۰۲۶ در OpenRouter عرضه شده، با قیمت حدود ۰.۸۰ تا ۱ دلار برای هر میلیون توکن ورودی و ۲.۵۶ تا ۳.۲۰ دلار برای هر میلیون توکن خروجی ارائه میشود. این قیمت در مقایسه با سایر مدلهای بزرگ در محدوده متوسط قرار میگیرد، اما با توجه به عملکرد سطح بالای آن در بنچمارکها، از دید بسیاری یک گزینه بسیار مقرونبهصرفه محسوب میشود.
این نرخها حدود ۶ برابر ارزانتر در ورودی و نزدیک به ۱۰ برابر ارزانتر در خروجی نسبت به Claude Opus 4.6 (۵ دلار / ۲۵ دلار) هستند. این عرضه همچنین شایعاتی را تقویت کرده که نشان میدهد Zhipu AI پشت مدل مخفی Pony Alpha بوده؛ مدلی که پیشتر در بنچمارکهای برنامهنویسی در OpenRouter عملکرد بسیار قدرتمندی نشان داده بود.

خبر پیشنهادی: سامسونگ از برنامه سازمانی «گذار هوش مصنوعی» خود رونمایی کرد
با این حال، همه کاربران اولیه نسبت به این مدل دیدگاه کاملا مثبت ندارند و معتقدند عملکرد بالا تمام ماجرا را توضیح نمیدهد. لوکاس پترسون، همبنیانگذار استارتاپ Andon Labs، در شبکه X نوشت: «پس از ساعتها بررسی traceهای GLM-5: مدلی فوقالعاده قدرتمند، اما با آگاهی موقعیتی بسیار پایینتر. اهداف را با تاکتیکهای تهاجمی دنبال میکند اما موقعیت خود را درک نمیکند یا از تجربه استفاده نمیکند.
این نگرانکننده است.» او به مفهوم «Paperclip Maximizer» اشاره کرد؛ سناریویی فرضی که نخستینبار توسط فیلسوف آکسفورد نیک بوستروم در سال ۲۰۰۳ مطرح شد و در آن یک هوش مصنوعی با دنبال کردن یک هدف ساده (مثل تولید حداکثر گیره کاغذ) بهتدریج تمام منابع جهان را در خدمت آن هدف قرار میدهد و در نهایت به یک فاجعه وجودی منجر میشود.
05
از 05آیا شرکتها باید مدل GLM-5 را بپذیرند؟
سازمانهایی که به دنبال خروج از وابستگی به فروشندگان بسته هستند، در مدل GLM-5 به دلیل مجوز MIT و دسترسی متنباز، یک مزیت راهبردی مهم خواهند یافت. برخلاف مدلهای بسته، این سیستم امکان استقرار کامل در زیرساختهای داخلی را فراهم میکند. با این حال، پذیرش آن بدون چالش نیست. مقیاس عظیم مدل (۷۴۴ میلیارد پارامتر) نیازمند زیرساخت سختافزاری گستردهای است که برای شرکتهای کوچک بدون دسترسی به کلاسترهای GPU ابری یا داخلی چندان قابل دسترس نیست. مدیران امنیتی نیز باید پیامدهای ژئوپلیتیکی استفاده از یک مدل توسعهیافته در چین را در نظر بگیرند؛ بهویژه در صنایع حساس که الزامات سختگیرانهای درباره محل ذخیرهسازی داده و سرچشمه آن وجود دارد.
علاوه بر این، حرکت به سمت عاملهای خودمختار هوش مصنوعی، ریسکهای جدیدی در حوزه حاکمیت و کنترل ایجاد میکند. زمانی که مدلها از حالت گفتوگو به اجرای وظایف واقعی در فایلها و اپلیکیشنها منتقل میشوند، در صورت نبود چارچوبهای کنترل دسترسی و نظارت انسانی، احتمال خطاهای خودکار بهطور قابل توجهی افزایش مییابد. در نهایت، مدل GLM-5 برای سازمانهایی مناسب است که از ابزارهای ساده دستیار هوشمند عبور کرده و بهدنبال ساخت یک محیط کاری کاملا خودمختار هستند.
این مدل برای مهندسانی طراحی شده که نیاز به بازسازی سیستمهای پیچیده یا ایجاد پایپلاینهای خودترمیمشونده دارند. در حالی که آزمایشگاههای غربی بر عمق استدلال و فرآیند تفکر تمرکز دارند، رویکرد Z.ai بر اجرا و مقیاسپذیری متمرکز است. در نتیجه، سازمانهایی که امروز GLM-5 را اتخاذ میکنند، یک مدل ارزانتر خریداری نمیکنند؛ بلکه روی آیندهای سرمایهگذاری میکنند که در آن ارزشمندترین هوش مصنوعی، سیستمی است که کار را بدون تکرار درخواست به پایان میرساند.

















