• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل هوش مصنوعی کوچک سامسونگ عملکردی هم‌تراز با Gemini و o3-mini دارد

مدل هوش مصنوعی کوچک سامسونگ عملکردی هم‌تراز با Gemini و o3-mini دارد

سید محمد برازنده نوشته شده توسط سید محمد برازنده
پنجشنبه 17 مهر 1404 - 12:35
در اخبار هوش مصنوعی, فناوری
مدل هوش مصنوعی کوچک سامسونگ عملکردی هم‌تراز با Gemini و o3-mini دارد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل هوش مصنوعی کوچک سامسونگ به نام Tiny Recursion Model یا TRM، عملکردی هم‌تراز با Gemini و o3-mini دارد.

به گزارش تک‌ناک، پژوهشگر ارشد بخش هوش مصنوعی سامسونگ در کانادا، با معرفی این مدل کوچک و نوآورانه، چالش تازه‌ای برای باور رایج در صنعت هوش مصنوعی ایجاد کرده است؛ باوری که می‌گوید هر چه مدل بزرگ‌تر و پرپارامترتر باشد، عملکرد آن نیز بهتر خواهد بود.

این مدل تنها ۷ میلیون پارامتر دارد، اما توانسته است در برخی از دشوارترین آزمون‌های استدلالی، عملکردی مشابه یا حتی بالاتر از مدل‌های غول‌پیکری مانند: OpenAI o3-mini و Google Gemini 2.5 Pro ارائه دهد. الکسا ژولیکور-مارتینو، پژوهشگر مؤسسه تحقیقات پیشرفته سامسونگ (SAIT) در مونترال، هدف از توسعه این مدل را اثبات این نکته دانست که می‌توان با منابع محدود نیز به هوشی محاسباتی دست یافت که توانایی رقابت با مدل‌های چند تریلیون پارامتری را داشته باشد. او در پستی در شبکه اجتماعی X نوشت: «باور به اینکه تنها مدل‌های عظیم با بودجه‌های میلیون دلاری قادر به حل مسائل پیچیده هستند، اشتباهی بزرگ است. تمرکز بیش از اندازه بر استفاده از مدل‌های زبانی بزرگ، نوآوری را محدود کرده است. باید به جای بهره‌برداری بی‌پایان از مدل‌های آماده، به سراغ خلق روش‌های تازه رفت.»

مدل TRM که مقاله آن با عنوان “Less is More: Recursive Reasoning with Tiny Networks” در وب‌سایت arXiv منتشر شده، بر پایه مفهوم استدلال بازگشتی طراحی شده است؛ مفهومی که به‌جای افزایش لایه‌ها و عمق شبکه، به مدل اجازه می‌دهد چندین بار روی پاسخ خود بازاندیشی کند تا نتیجه نهایی را بهبود دهد. ژولیکور-مارتینو در ساخت TRM از مدل Hierarchical Reasoning Model (HRM) الهام گرفته است، اما برخلاف HRM که از دو شبکه همکار با فرکانس‌های متفاوت استفاده می‌کرد، ساختار جدید تنها از یک شبکه ساده دو‌لایه بهره می‌برد. در این روش، مدل، ورودی را دریافت و پاسخی اولیه تولید می‌کند، سپس با ارزیابی خروجی خود و تصحیح خطاهای احتمالی، در هر چرخه به نتیجه‌ای دقیق‌تر نزدیک می‌شود. این فرایند تکراری تا زمانی ادامه می‌یابد که پاسخ به پایداری برسد.

مدل هوش مصنوعی کوچک سامسونگ نشان داده است که می‌توان با همین روش ساده و کم‌هزینه، عملکردی هم‌تراز یا حتی بالاتر از مدل‌هایی داشت که ده‌هزار برابر پارامتر بیشتر دارند. نتایج آزمایش‌های انجام‌شده روی مجموعه داده‌های شناخته‌شده نشان می‌دهد که دقت TRM در Sudoku-Extreme به ۸۷٫۴ درصد رسیده است، در حالی‌ که مدل HRM تنها به ۵۵ درصد دست یافته بود. در آزمون Maze-Hard نیز دقت ۸۵ درصدی ثبت شده و در دو نسخه از مجموعه آزمون ARC-AGI، به ترتیب ۴۵ و ۸ درصد دقت کسب کرده است. این نتایج در حالی به دست آمده است که TRM تنها از ۰٫۰۱ درصد پارامترهای مدل‌هایی مانند Gemini 2.5 Pro یا DeepSeek R1 بهره می‌برد.

راز موفقیت TRM در طراحی مینیمالیستی آن نهفته است. ژولیکور-مارتینو در مصاحبه‌ای اشاره کرده است که هرچه مدل را پیچیده‌تر و پرلایه‌تر کرده، دقت و توانایی تعمیم آن کاهش یافته است. مدل‌های بزرگ به‌ سرعت دچار بیش‌برازش می‌شوند، به‌ویژه وقتی داده‌های آموزشی محدود باشد. در مقابل، ساختار ساده‌ دو‌لایه به همراه نظارت عمیق و بازگشت‌پذیری، تعادلی میان کارایی و دقت ایجاد کرده است. نکته جالب دیگر این است که در برخی وظایف کوچک مانند: حل Sudoku، حذف مکانیزم خودتوجهی و جایگزینی آن با پرسپترون چند‌لایه باعث بهبود عملکرد شده است، در حالی‌ که برای وظایف پیچیده‌تر و شبکه‌ای بزرگ‌تر مثل ARC-AGI، استفاده از self-attention همچنان ضروری بوده است. این یافته‌ها نشان می‌دهد که معماری بهینه‌ مدل باید متناسب با ساختار داده‌ها باشد و صرفاً بر اساس افزایش ظرفیت نباشد.

از منظر فلسفی، مدل هوش مصنوعی کوچک سامسونگ پاسخی به گرایش غالب “scale is all you need” در صنعت هوش مصنوعی است، که اعتقاد دارد بزرگ‌تر شدن همیشه بهتر است. اما این پژوهش نشان داده است که مقیاس بی‌نهایت لزوماً مسیر پیشرفت نیست و گاهی تفکر بازگشتی می‌تواند جایگزین عمق و اندازه شود. در واقع، TRM با تکیه بر تکرار و بازنگری داخلی، همان تأثیری را ایجاد می‌کند که مدل‌های بزرگ از طریق زنجیره‌های طولانی استدلال، با صرف حافظه و انرژی به‌مراتب کمتر به آن می‌رسند.

معرفی مدل هوش مصنوعی کوچک سامسونگ با عملکردی هم‌تراز Gemini و o3-mini

کد منبع TRM به‌ صورت عمومی و با مجوز MIT در پلتفرم GitHub منتشر شده است، به این معنا که هر فرد یا شرکت می‌تواند از آن برای مقاصد تحقیقاتی یا تجاری استفاده کند. این مخزن شامل اسکریپت‌های کامل آموزش و ارزیابی سازنده‌های داده برای مجموعه‌های Sudoku، Maze و ARC-AGI و تنظیمات مرجع برای بازتولید نتایج است. بر اساس توضیحات ارائه‌شده، آموزش مدل برای مجموعه Sudoku تنها به یک کارت گرافیک NVIDIA L40S نیاز دارد، در حالی‌ که برای مجموعه‌های پیچیده‌تر مانند ARC-AGI از چند GPU مدل H100 استفاده شده است. نکته مهم این است که هرچند TRM کوچک است، اما همچنان به تکرارهای متعدد در حین آموزش نیاز دارد و از تکنیک‌های تقویتی مانند تغییر رنگ، چرخش و تبدیل‌های هندسی داده‌ها برای افزایش تنوع بهره می‌برد.

انتشار عمومی مدل هوش مصنوعی کوچک سامسونگ واکنش‌های گسترده‌ای را در میان جامعه علمی به دنبال داشته است. بسیاری از پژوهشگران آن را شاهدی بر توانایی مدل‌های کوچک در رقابت با غول‌های محاسباتی دانسته‌اند. برخی در شبکه X از این مدل به‌ عنوان «ده‌هزار برابر کوچک‌تر اما باهوش‌تر» یاد کرده‌اند. در مقابل، گروهی دیگر معتقد هستند که دامنه‌ کاربرد TRM محدود است و این مدل تنها در وظایف شبکه‌ای و ساختارمند مانند پازل‌ها، عملکرد چشمگیری دارد، اما در حوزه‌های بازتر مانند درک زبان طبیعی یا تولید متن، مزیتی ندارد. یکی از محققان با نام یونمین چا اشاره کرده است که اگرچه TRM کوچک است، اما تکرارهای بازگشتی آن عملاً زمان اجرا و هزینه محاسباتی را افزایش می‌دهد، بنابراین صرفه‌جویی واقعی در منابع چندان زیاد نیست. در همین حال، پژوهشگر دیگری به نام سباستین راسچکا گفته است که TRM را باید به‌ عنوان ساده‌سازی موفقی از HRM دید و به عنوان گامی به‌سوی هوش عمومی مصنوعی ندانست. به گفته او، این مدل اساساً در دو گام کار می‌کند: ابتدا حالت درونی استدلال را به‌روزرسانی می‌کند و سپس پاسخ را اصلاح می‌نماید.

با وجود این، حتی منتقدان نیز بر یک نکته توافق دارند: پیام اصلی TRM روشن است. برای رسیدن به پیشرفت در استدلال ماشینی، همیشه نیازی به افزایش بی‌پایان اندازه مدل‌ها نیست. در واقع، طراحی دقیق چرخه‌های استدلال و بازخورد داخلی می‌تواند کارایی مشابهی با مدل‌های چند تریلیون پارامتری ایجاد کند. از این منظر، TRM می‌تواند الهام‌بخش نسل جدیدی از پژوهش‌ها در زمینه مدل‌های کوچک اما هوشمند باشد.

ژولیکور-مارتینو در پایان پژوهش خود به مسیرهای آینده اشاره کرده است. او قصد دارد نسخه‌هایی از TRM را توسعه دهد که بتوانند به‌جای یک پاسخ قطعی، چند پاسخ محتمل تولید کنند و در وظایف مولد یا زایشی نیز کاربرد داشته باشند. همچنین پژوهش‌های آینده به دنبال کشف قوانین مقیاس‌پذیری در استدلال بازگشتی خواهند بود؛ قوانینی که مشخص می‌کنند اصل «کمتر، بیشتر است» تا چه اندازه در سطوح پیچیده‌تر و داده‌های گسترده‌تر نیز معتبر می‌ماند.

در نهایت، مدل هوش مصنوعی کوچک سامسونگ نه‌تنها ابزاری عملی برای حل مسائل ساختارمند ارائه می‌دهد، بلکه یادآور این حقیقت است که پیشرفت در هوش مصنوعی الزاماً در گروی افزایش قدرت پردازشی نیست. گاهی یک شبکه‌ کوچک، اگر بتواند با دقت و منطق درونی فکر کند، می‌تواند نتایجی به‌دست آورد که حتی بزرگ‌ترین مدل‌ها از آن ناتوان‌ هستند. این دستاورد تازه‌ سامسونگ نشان می‌دهد که مسیر آینده‌ هوش مصنوعی شاید نه در مقیاس، بلکه در کیفیت تفکر نهفته باشد؛ تفکری که با بازگشت، اصلاح و تکرار، خود را کامل‌تر می‌سازد.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

معماری RISC-V
فناوری

سهم ۲۵ درصدی RISC-V سلطه ARM را به چالش کشید

نوشته شده توسط امیرحسین یونس
17 مهر 1404
رخنه امنیتی دیسکورد
شبکه های اجتماعی

دیسکورد ادعای نشت ۲/۱ میلیون سند را رد کرد و از دادن باج سر باز زد

نوشته شده توسط امیرحسین یونس
17 مهر 1404
نویسنده مجارستانی برنده جایزه نوبل ادبیات ۲۰۲۵ شد
پیشنهاد سردبیر

نویسنده مجارستانی برنده جایزه نوبل ادبیات ۲۰۲۵ شد

نوشته شده توسط نرگس چالوک
17 مهر 1404
شرکت OpenAI طرح ارزان ChatGPT Go را به ۱۶ کشور آسیایی گسترش داد
اخبار هوش مصنوعی

شرکت OpenAI طرح ارزان ChatGPT Go را به ۱۶ کشور آسیایی گسترش داد

نوشته شده توسط سید محمد برازنده
17 مهر 1404
یکپارچگی کامل Copilot در OneDrive برای کاربران سازمانی مایکروسافت
اخبار هوش مصنوعی

یکپارچگی کامل Copilot در OneDrive برای کاربران سازمانی مایکروسافت + ویدیو

نوشته شده توسط سید محمد برازنده
17 مهر 1404
خبر بعدی
واتساپ در حال عرضه طراحی جدید Liquid Glass برای برخی کاربران iOS است

واتساپ در حال عرضه طراحی جدید Liquid Glass برای برخی کاربران iOS است

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

چین نخستین دیتاسنتر تجاری زیرآب را راه‌اندازی می‌کند؛ کاهش ۹۰ درصدی مصرف انرژی برای خنک‌سازی

چین نخستین دیتاسنتر تجاری زیرآب را راه‌اندازی می‌کند

11 مهر 1404
اینستاگرام شایعه شنود میکروفون کاربران را رد کرد

اینستاگرام شایعه شنود میکروفون کاربران را رد کرد

10 مهر 1404

داغ‌ترین‌های روز

ریپل

پیش‌بینی قیمت ریپل (XRP) با احتمال ورود ۱۰ میلیارد دلاری سرمایه به ETFها

14 مهر 1404
بهترین ردیاب خودرو ۲۰۲۵

بهترین ردیاب خودرو ۲۰۲۵؛ معرفی ۱۰ مدل برتر بازار

13 مهر 1404 - به‌روزشده در 14 مهر 1404
۵ آلت‌کوین برتر برای خرید در اکتبر ۲۰۲۵

۵ آلت‌کوین برتر برای خرید در اکتبر ۲۰۲۵

14 مهر 1404
معرفی بهترین ساعت هوشمند صفحه گرد ۲۰۲۵

معرفی بهترین ساعت هوشمند صفحه گرد ۲۰۲۵

13 مهر 1404
اروپا از نخستین جنگنده رزمی خودران خود با نام CA-1 Europa رونمایی کرد

اروپا از نخستین جنگنده رزمی خودران خود با نام CA-1 Europa رونمایی کرد

13 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

iPhone Ultra

اپل سال آینده آیفون جدیدی معرفی می‌کند؛ نسخه‌ای به نام اولترا

17 مهر 1404
خودرو برقی التتریکا فراری

جانی آیو التتریکا را طراحی کرد؛ ابرخودرو برقی ۱,۰۰۰ اسب‌بخاری فراری

17 مهر 1404
Galaxy Z Trifold

سامسونگ پتنت گلکسی Z Trifold را ثبت کرد؛ سه باتری با ظرفیت بیش از ۵,۰۰۰ میلی‌آمپرساعت

17 مهر 1404
هدست واقعیت مجازی دکارد ولو

دکارد، هدست واقعیت مجازی جدید ولو، وارد مرحله تولید شد

17 مهر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir