استارتآپ تراشهسازی تالاس با ابداع سختافزارهای اختصاصی که مدلهای هوش مصنوعی را به صورت مستقیم در دل سیلیکون تعبیه میکنند، به نرخ تولید توکن ۱۰ برابر سریعتر دست یافته است.
به گزارش سرویس سخت افزار تکناک، به نظر میرسد تالاس موفق شده است در اجرای مدل Llama 8B متا، به راهکاری قطعی برای چالش تأخیر و عملکرد در مدلهای زبانی بزرگ دست یابد و همزمان هزینههای تولید را تا ۲۰ برابر کاهش دهد.
در فضای کنونی محاسبات هوش مصنوعی، نرخ تأخیر به محدودیت بزرگی برای تأمینکنندگان تبدیل شده است، چرا که در محیطهای مبتنی بر عامل، مزیت رقابتی اصلی در نرخ توکن بر ثانیه و سرعت تکمیل وظایف نهفته است. یکی از راهکارهای صنعت برای عبور از این چالش، ادغام حافظه SRAM در محصولات است که شرکتهایی نظیر Cerebras و Groq پیشگام آن بودهاند، اما استارتآپ تالاس مسیر متفاوتی را برگزیده و با چرخش از محاسبات چندمنظوره، به سمت طراحی تراشههای ASIC برای مدلهای زبانی بزرگ حرکت کرده است.
این شرکت که ۲.۵ سال پیش تأسیس شد، پلتفرمی توسعه داده است که هر مدل هوش مصنوعی را به سیلیکون سفارشی تبدیل میکند. تالاس میتواند هر مدل جدید را تنها ظرف دو ماه به مرحله پیادهسازی سختافزاری برساند. این مدلهای سختافزاری در مقایسه با نمونههای نرمافزاری، به شکلی چشمگیر سریعتر، ارزانتر و کممصرفتر هستند.

به گفته تالاس، رویکرد این شرکت بر دو اصل تخصصیسازی بارهای کاری هوش مصنوعی در سطح سختافزار و ادغام حافظه با محاسبات استوار است. تخصصیسازی به معنای نقشهبرداری شبکههای عصبی روی خود سیلیکون برای بهینهسازی زیرساخت هر مدل است. هدف دوم نیز غلبه بر دیوارهای حافظه و کاهش سربار ارتباطات دادهای در سیستمهای عمومی است.
در این راهکار، تمامی محاسبات با چگالی در سطح DRAM انجام میشود تا ارتباطات داخلی سریعتر تضمین گردد. همین موضوع کلید حل مشکل تأخیر در مدلهای زبانی بزرگ توسط تالاس است. برخلاف رقبا، این فناوری نیازی به سیستمهای خنککننده پیشرفته یا حافظههای HBM ندارد و تمام نوآوری در مهندسی خود سیلیکون نهفته است. تالاس نخستین محصول خود را با نام HC1 که میزبان مدل Llama 3.1 8B متا است، معرفی کرده که نتایج آن شوکهکننده توصیف شده است.
بر اساس گزارش wccftech، تالاس به نرخ توکنی ۱۰ برابر بیشتر از زیرساختهای ردهبالای فعلی و هزینهای ۲۰ برابر کمتر دست یافته است. با وجود این، تراشه HC1 با لیتوگرافی ۶ نانومتری TSMC و ابعاد ۸۱۵ میلیمتر مربع، مشابه تراشه H100 انویدیا است. در حالی که HC1 میزبان یک مدل ۸ میلیارد پارامتری است، مدلهای پیشروی امروزی به یک تریلیون پارامتر رسیدهاند، که این موضوع تالاس را ملزم به بازنگری در استراتژی مقیاسپذیری خود میکند.

تنها راه ارتقای عملکرد، استفاده از رویکرد خوشهای است؛ تالاس اعلام کرده که این روش را با مدل DeepSeek R1 آزمایش کرده و در یک پیکربندی ۳۰ تراشهای، به سرعت ۱۲,۰۰۰ توکن بر ثانیه برای هر کاربر دست یافته است. اکنون چالش اصلی در پذیرش بازار و مدل تجاری نهفته است، چرا که در این رویکرد، سختافزار مختص یک مدل خاص میباشد و امکان تغییر وزنهای مدل وجود ندارد. با وجود این، با توجه به جهش خیرهکننده سرعت، این یک قمار ارزشمند به نظر میرسد.

















