• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل هوش مصنوعی کوچک سامسونگ عملکردی هم‌تراز با Gemini و o3-mini دارد

مدل هوش مصنوعی کوچک سامسونگ عملکردی هم‌تراز با Gemini و o3-mini دارد

سید محمد برازنده نوشته شده توسط سید محمد برازنده
پنجشنبه 17 مهر 1404 - 12:35
در اخبار هوش مصنوعی, فناوری
مدل هوش مصنوعی کوچک سامسونگ عملکردی هم‌تراز با Gemini و o3-mini دارد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل هوش مصنوعی کوچک سامسونگ به نام Tiny Recursion Model یا TRM، عملکردی هم‌تراز با Gemini و o3-mini دارد.

به گزارش تک‌ناک، پژوهشگر ارشد بخش هوش مصنوعی سامسونگ در کانادا، با معرفی این مدل کوچک و نوآورانه، چالش تازه‌ای برای باور رایج در صنعت هوش مصنوعی ایجاد کرده است؛ باوری که می‌گوید هر چه مدل بزرگ‌تر و پرپارامترتر باشد، عملکرد آن نیز بهتر خواهد بود.

این مدل تنها ۷ میلیون پارامتر دارد، اما توانسته است در برخی از دشوارترین آزمون‌های استدلالی، عملکردی مشابه یا حتی بالاتر از مدل‌های غول‌پیکری مانند: OpenAI o3-mini و Google Gemini 2.5 Pro ارائه دهد. الکسا ژولیکور-مارتینو، پژوهشگر مؤسسه تحقیقات پیشرفته سامسونگ (SAIT) در مونترال، هدف از توسعه این مدل را اثبات این نکته دانست که می‌توان با منابع محدود نیز به هوشی محاسباتی دست یافت که توانایی رقابت با مدل‌های چند تریلیون پارامتری را داشته باشد. او در پستی در شبکه اجتماعی X نوشت: «باور به اینکه تنها مدل‌های عظیم با بودجه‌های میلیون دلاری قادر به حل مسائل پیچیده هستند، اشتباهی بزرگ است. تمرکز بیش از اندازه بر استفاده از مدل‌های زبانی بزرگ، نوآوری را محدود کرده است. باید به جای بهره‌برداری بی‌پایان از مدل‌های آماده، به سراغ خلق روش‌های تازه رفت.»

مدل TRM که مقاله آن با عنوان “Less is More: Recursive Reasoning with Tiny Networks” در وب‌سایت arXiv منتشر شده، بر پایه مفهوم استدلال بازگشتی طراحی شده است؛ مفهومی که به‌جای افزایش لایه‌ها و عمق شبکه، به مدل اجازه می‌دهد چندین بار روی پاسخ خود بازاندیشی کند تا نتیجه نهایی را بهبود دهد. ژولیکور-مارتینو در ساخت TRM از مدل Hierarchical Reasoning Model (HRM) الهام گرفته است، اما برخلاف HRM که از دو شبکه همکار با فرکانس‌های متفاوت استفاده می‌کرد، ساختار جدید تنها از یک شبکه ساده دو‌لایه بهره می‌برد. در این روش، مدل، ورودی را دریافت و پاسخی اولیه تولید می‌کند، سپس با ارزیابی خروجی خود و تصحیح خطاهای احتمالی، در هر چرخه به نتیجه‌ای دقیق‌تر نزدیک می‌شود. این فرایند تکراری تا زمانی ادامه می‌یابد که پاسخ به پایداری برسد.

مدل هوش مصنوعی کوچک سامسونگ نشان داده است که می‌توان با همین روش ساده و کم‌هزینه، عملکردی هم‌تراز یا حتی بالاتر از مدل‌هایی داشت که ده‌هزار برابر پارامتر بیشتر دارند. نتایج آزمایش‌های انجام‌شده روی مجموعه داده‌های شناخته‌شده نشان می‌دهد که دقت TRM در Sudoku-Extreme به ۸۷٫۴ درصد رسیده است، در حالی‌ که مدل HRM تنها به ۵۵ درصد دست یافته بود. در آزمون Maze-Hard نیز دقت ۸۵ درصدی ثبت شده و در دو نسخه از مجموعه آزمون ARC-AGI، به ترتیب ۴۵ و ۸ درصد دقت کسب کرده است. این نتایج در حالی به دست آمده است که TRM تنها از ۰٫۰۱ درصد پارامترهای مدل‌هایی مانند Gemini 2.5 Pro یا DeepSeek R1 بهره می‌برد.

راز موفقیت TRM در طراحی مینیمالیستی آن نهفته است. ژولیکور-مارتینو در مصاحبه‌ای اشاره کرده است که هرچه مدل را پیچیده‌تر و پرلایه‌تر کرده، دقت و توانایی تعمیم آن کاهش یافته است. مدل‌های بزرگ به‌ سرعت دچار بیش‌برازش می‌شوند، به‌ویژه وقتی داده‌های آموزشی محدود باشد. در مقابل، ساختار ساده‌ دو‌لایه به همراه نظارت عمیق و بازگشت‌پذیری، تعادلی میان کارایی و دقت ایجاد کرده است. نکته جالب دیگر این است که در برخی وظایف کوچک مانند: حل Sudoku، حذف مکانیزم خودتوجهی و جایگزینی آن با پرسپترون چند‌لایه باعث بهبود عملکرد شده است، در حالی‌ که برای وظایف پیچیده‌تر و شبکه‌ای بزرگ‌تر مثل ARC-AGI، استفاده از self-attention همچنان ضروری بوده است. این یافته‌ها نشان می‌دهد که معماری بهینه‌ مدل باید متناسب با ساختار داده‌ها باشد و صرفاً بر اساس افزایش ظرفیت نباشد.

از منظر فلسفی، مدل هوش مصنوعی کوچک سامسونگ پاسخی به گرایش غالب “scale is all you need” در صنعت هوش مصنوعی است، که اعتقاد دارد بزرگ‌تر شدن همیشه بهتر است. اما این پژوهش نشان داده است که مقیاس بی‌نهایت لزوماً مسیر پیشرفت نیست و گاهی تفکر بازگشتی می‌تواند جایگزین عمق و اندازه شود. در واقع، TRM با تکیه بر تکرار و بازنگری داخلی، همان تأثیری را ایجاد می‌کند که مدل‌های بزرگ از طریق زنجیره‌های طولانی استدلال، با صرف حافظه و انرژی به‌مراتب کمتر به آن می‌رسند.

معرفی مدل هوش مصنوعی کوچک سامسونگ با عملکردی هم‌تراز Gemini و o3-mini

کد منبع TRM به‌ صورت عمومی و با مجوز MIT در پلتفرم GitHub منتشر شده است، به این معنا که هر فرد یا شرکت می‌تواند از آن برای مقاصد تحقیقاتی یا تجاری استفاده کند. این مخزن شامل اسکریپت‌های کامل آموزش و ارزیابی سازنده‌های داده برای مجموعه‌های Sudoku، Maze و ARC-AGI و تنظیمات مرجع برای بازتولید نتایج است. بر اساس توضیحات ارائه‌شده، آموزش مدل برای مجموعه Sudoku تنها به یک کارت گرافیک NVIDIA L40S نیاز دارد، در حالی‌ که برای مجموعه‌های پیچیده‌تر مانند ARC-AGI از چند GPU مدل H100 استفاده شده است. نکته مهم این است که هرچند TRM کوچک است، اما همچنان به تکرارهای متعدد در حین آموزش نیاز دارد و از تکنیک‌های تقویتی مانند تغییر رنگ، چرخش و تبدیل‌های هندسی داده‌ها برای افزایش تنوع بهره می‌برد.

انتشار عمومی مدل هوش مصنوعی کوچک سامسونگ واکنش‌های گسترده‌ای را در میان جامعه علمی به دنبال داشته است. بسیاری از پژوهشگران آن را شاهدی بر توانایی مدل‌های کوچک در رقابت با غول‌های محاسباتی دانسته‌اند. برخی در شبکه X از این مدل به‌ عنوان «ده‌هزار برابر کوچک‌تر اما باهوش‌تر» یاد کرده‌اند. در مقابل، گروهی دیگر معتقد هستند که دامنه‌ کاربرد TRM محدود است و این مدل تنها در وظایف شبکه‌ای و ساختارمند مانند پازل‌ها، عملکرد چشمگیری دارد، اما در حوزه‌های بازتر مانند درک زبان طبیعی یا تولید متن، مزیتی ندارد. یکی از محققان با نام یونمین چا اشاره کرده است که اگرچه TRM کوچک است، اما تکرارهای بازگشتی آن عملاً زمان اجرا و هزینه محاسباتی را افزایش می‌دهد، بنابراین صرفه‌جویی واقعی در منابع چندان زیاد نیست. در همین حال، پژوهشگر دیگری به نام سباستین راسچکا گفته است که TRM را باید به‌ عنوان ساده‌سازی موفقی از HRM دید و به عنوان گامی به‌سوی هوش عمومی مصنوعی ندانست. به گفته او، این مدل اساساً در دو گام کار می‌کند: ابتدا حالت درونی استدلال را به‌روزرسانی می‌کند و سپس پاسخ را اصلاح می‌نماید.

با وجود این، حتی منتقدان نیز بر یک نکته توافق دارند: پیام اصلی TRM روشن است. برای رسیدن به پیشرفت در استدلال ماشینی، همیشه نیازی به افزایش بی‌پایان اندازه مدل‌ها نیست. در واقع، طراحی دقیق چرخه‌های استدلال و بازخورد داخلی می‌تواند کارایی مشابهی با مدل‌های چند تریلیون پارامتری ایجاد کند. از این منظر، TRM می‌تواند الهام‌بخش نسل جدیدی از پژوهش‌ها در زمینه مدل‌های کوچک اما هوشمند باشد.

ژولیکور-مارتینو در پایان پژوهش خود به مسیرهای آینده اشاره کرده است. او قصد دارد نسخه‌هایی از TRM را توسعه دهد که بتوانند به‌جای یک پاسخ قطعی، چند پاسخ محتمل تولید کنند و در وظایف مولد یا زایشی نیز کاربرد داشته باشند. همچنین پژوهش‌های آینده به دنبال کشف قوانین مقیاس‌پذیری در استدلال بازگشتی خواهند بود؛ قوانینی که مشخص می‌کنند اصل «کمتر، بیشتر است» تا چه اندازه در سطوح پیچیده‌تر و داده‌های گسترده‌تر نیز معتبر می‌ماند.

در نهایت، مدل هوش مصنوعی کوچک سامسونگ نه‌تنها ابزاری عملی برای حل مسائل ساختارمند ارائه می‌دهد، بلکه یادآور این حقیقت است که پیشرفت در هوش مصنوعی الزاماً در گروی افزایش قدرت پردازشی نیست. گاهی یک شبکه‌ کوچک، اگر بتواند با دقت و منطق درونی فکر کند، می‌تواند نتایجی به‌دست آورد که حتی بزرگ‌ترین مدل‌ها از آن ناتوان‌ هستند. این دستاورد تازه‌ سامسونگ نشان می‌دهد که مسیر آینده‌ هوش مصنوعی شاید نه در مقیاس، بلکه در کیفیت تفکر نهفته باشد؛ تفکری که با بازگشت، اصلاح و تکرار، خود را کامل‌تر می‌سازد.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

استعفای مقام امنیتی گوگل در اعتراض به پروژه‌های نظامی این شرکت
اخبار هوش مصنوعی

استعفای مقام امنیتی گوگل در اعتراض به پروژه‌های نظامی این شرکت

نوشته شده توسط مانی
25 خرداد 1405
مدیرعامل مایکروسافت خواستار بازنگری اساسی در پذیرش هوش مصنوعی شد
اخبار هوش مصنوعی

مدیرعامل مایکروسافت خواستار بازنگری اساسی در پذیرش هوش مصنوعی شد

نوشته شده توسط مانی
25 خرداد 1405
اپل رقیبی قدرتمند برای دستیارهای هوش مصنوعی می‌ سازد
اخبار هوش مصنوعی

اپل رقیبی قدرتمند برای دستیارهای هوش مصنوعی می‌ سازد

نوشته شده توسط سید محمد برازنده
25 خرداد 1405
کارگران در حال نصب و آماده‌سازی چمن طبیعی در یکی از ورزشگاه‌های میزبان جام جهانی ۲۰۲۶ هستند.
پیشنهاد سردبیر

راز چمن‌های بی‌نقص جام جهانی ۲۰۲۶ چیست؟

نوشته شده توسط نرگس چالوک
25 خرداد 1405
اجرای هوش مصنوعی +Copilot روی کارت‌های گرافیک مجزا ممکن شد
اخبار هوش مصنوعی

اجرای هوش مصنوعی +Copilot روی کارت‌های گرافیک مجزا ممکن شد

نوشته شده توسط سید محمد برازنده
25 خرداد 1405
خبر بعدی
واتساپ در حال عرضه طراحی جدید Liquid Glass برای برخی کاربران iOS است

واتساپ در حال عرضه طراحی جدید Liquid Glass برای برخی کاربران iOS است

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آیا رانندگی با دور موتور پایین واقعاً عمر خودرو را افزایش می‌دهد؟

آیا رانندگی با دور موتور پایین واقعاً عمر خودرو را افزایش می‌دهد؟

6 خرداد 1405

گوگل توپ فوتبال اختصاصی جام جهانی ۲۰۲۶ را عرضه کرد

19 خرداد 1405 - به‌روزشده در 20 خرداد 1405

داغ‌ترین‌های روز

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
انواع تیپ های سورن پلاس

معرفی انواع تیپ های سورن پلاس ؛ کدام مدل خودرو ارزش خرید بالاتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
پهپاد رهگیر Cobra 600 آلمان معرفی شد

پهپاد رهگیر Cobra 600 آلمان معرفی شد + تصویر

23 خرداد 1405 - به‌روزشده در 24 خرداد 1405
نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
بهترین گجت های دانشجویی؛ 35 ابزار کاربردی برای درس، دانشگاه و افزایش بهره_وری (1)

بهترین گجت های دانشجویی؛ ۳۵ ابزار کاربردی برای درس و دانشگاه

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

استعفای مقام امنیتی گوگل در اعتراض به پروژه‌های نظامی این شرکت

استعفای مقام امنیتی گوگل در اعتراض به پروژه‌های نظامی این شرکت

25 خرداد 1405
گرانی بی‌سابقه تراشه‌های حافظه، بازار جهانی موبایل را شوکه کرد

گرانی بی‌سابقه تراشه‌های حافظه، بازار جهانی موبایل را شوکه کرد

25 خرداد 1405
معرفی امکانات کاربردی و هوشمند سامسونگ

۵ قابلیت پنهان گوشی‌های سامسونگ که شما را شگفت‌زده می کند

25 خرداد 1405
جهش بازارهای سهام و سقوط قیمت نفت پس از توافق اولیه ایران و آمریکا

جهش بازارهای سهام و سقوط قیمت نفت پس از توافق اولیه ایران و آمریکا

25 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir