• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل‌های استدلالی هوش مصنوعی به آن هوشمندی تبلیغ‌شده نیستند

مدل‌های استدلالی هوش مصنوعی به آن هوشمندی تبلیغ‌شده نیستند

نرگس چالوک نوشته شده توسط نرگس چالوک
سه شنبه 20 خرداد 1404 - 13:15
در اخبار هوش مصنوعی, فناوری
مدل‌های استدلالی هوش مصنوعی به آن هوشمندی تبلیغ‌شده نیستند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران شرکت اپل اعلام کرده‌اند که مدل‌های استدلالی هوش مصنوعی (Reasoning Models) به اندازه‌ای که تبلیغ می‌شود، «هوشمند» نیستند.

به گزارش تک‌ناک، مدل‌های استدلالی، مانند Claude متعلق به شرکت Anthropic، o3 از OpenAI و R1 از DeepSeek، نسل پیشرفته‌تری از مدل‌های زبانی بزرگ (LLMs) هستند که برای دستیابی به دقت بالاتر، از توان محاسباتی و زمان بیشتری استفاده می‌کنند.

رشد این مدل‌ها باعث شد شرکت‌های بزرگ فناوری مجدد ادعا کنند که ممکن است در آستانه توسعه هوش عمومی مصنوعی (AGI) باشند؛ سیستم‌هایی که از انسان در اغلب وظایف پیشی می‌گیرند. اما مطالعه جدیدی که در تاریخ ۷ ژوئن در وب‌سایت تحقیقاتی اپل منتشر شده، ضربه‌ای جدی به این ادعاها وارد کرده است. پژوهشگران می‌گویند که مدل‌های استدلالی نه‌تنها توانایی استدلال عمومی را نشان نمی‌دهند، بلکه با پیچیده‌تر شدن وظایف، دقت آنها به‌طور کامل فرو می‌ریزد.

محققان اپل در این زمینه گفتند:

«از طریق آزمایش‌های گسترده روی معماهای متنوع، نشان دادیم که مدل‌های پیشرفته استدلالی در برابر پیچیدگی‌های بالا دچار فروپاشی کامل در دقت می‌شوند. همچنین آنها یک محدودیت مقیاسی متناقض از خود نشان می‌دهند: تلاش برای استدلال با افزایش پیچیدگی مسائل تا حدی افزایش می‌یابد، سپس کاهش پیدا می‌کند؛ این موضوع حتی با وجود تخصیص مناسب از توکن‌ها دیده می‌شود.»

مدل‌های استدلالی هوش مصنوعی به آن هوشمندی که تصور می شد نیستند

مدل‌های زبانی بزرگ از طریق جذب حجم انبوهی از داده‌های انسانی آموزش می‌بینند و با استخراج الگوهای آماری از این داده‌ها، به تولید پاسخ می‌پردازند. در مدل‌های استدلالی، از روش «زنجیره‌ فکر» (Chain-of-Thought) برای بهبود دقت استفاده می‌شود؛ یعنی مدل گام‌به‌گام منطق خود را بیان می‌کند تا مانند انسان به نتیجه برسد.

اما این روند، برخلاف تصور، مبتنی بر «درک واقعی» نیست، بلکه صرفاً بر پایه حدس‌های آماری است. همین مسئله باعث می‌شود که این مدل‌ها دچار پدیده‌ای موسوم به «توهم‌زایی» شوند؛ یعنی پاسخ‌های اشتباه، گمراه‌کننده یا حتی خطرناک تولید کنند.

گزارشی فنی از OpenAI نشان می‌دهد که مدل‌های استدلالی هوش مصنوعی نسبت به مدل‌های عمومی، بیشتر مستعد توهم‌زایی هستند. به‌ عنوان مثال، مدل‌های o3 و o4-mini هنگام خلاصه‌سازی اطلاعات درباره‌ افراد، به ترتیب در ۳۳ و ۴۸ درصد مواقع دچار خطا شدند، در حالی‌ که این نرخ در مدل o1 تنها ۱۶ درصد بود. خود OpenAI نیز اذعان دارد که دلیل این مسئله روشن نیست و «نیاز به تحقیقات بیشتر» دارد.

در ادامه مطالعه اپل آمده است: «ما معتقد هستیم که فقدان تحلیل‌های سیستماتیک درباره‌ این پرسش‌ها، به محدودیت‌های الگوهای ارزیابی فعلی بازمی‌گردد. آزمون‌های موجود عمدتاً بر سنجه‌های ریاضی و کدنویسی متمرکز هستند، که علاوه‌ بر آلودگی‌های داده‌ای، امکان کنترل شرایط تجربی را فراهم نمی‌کنند.»

پژوهشگران اپل برای بررسی دقیق‌تر، مجموعه‌ای از مدل‌های عمومی و استدلالی (از جمله o1، o3، Claude 3.7، R1، Gemini) را روی چهار معمای کلاسیک آزمایش کردند، که شامل عبور از رودخانه، پرش مهره‌ها، چیدن بلوک‌ها و برج هانوی بود. سطح پیچیدگی این معماها نیز در سه سطح تنظیم شده بود.

مدل‌های عمومی در سطح پایین، عملکرد بهتری داشتند، چرا که زنجیره‌های استدلالی مدل‌های پیشرفته، هزینه محاسباتی بیشتری داشتند. با افزایش پیچیدگی، مدل‌های استدلالی برای مدتی برتری پیدا کردند، اما در نهایت، در مواجهه با مسائل بسیار پیچیده، عملکرد هر دو گروه «به صفر رسید».

پژوهشگران مشاهده کردند که پس از عبور از یک آستانه مشخص، مدل‌های استدلالی هوش مصنوعی حتی تعداد توکن‌های اختصاص‌داده‌شده را کاهش دادند و زنجیره استدلال را رها کردند؛ حتی در حالتی که پاسخ صحیح در اختیار آنها قرار گرفت. برای مثال، مدل‌ها در معمای برج هانوی توانستند تا ۱۰۰ حرکت درست انجام دهند، اما در معمای عبور از رودخانه، بیش از ۵ حرکت صحیح نداشتند.

نتایج نشان می‌دهد که این مدل‌ها بیشتر به شناسایی الگو متکی هستند. با وجود این، پژوهشگران اپل نیز به محدودیت‌های پژوهش خود اذعان دارند و تأکید کرده‌اند که دامنه معماها، نماینده‌ کامل تمام وظایف ممکن نیست.

شرکت اپل نیز در رقابت هوش مصنوعی از رقبا عقب افتاده است. طبق یک بررسی، سیری، دستیار صوتی اپل، ۲۵ درصد کم‌دقت‌تر از ChatGPT گزارش شده و اپل به جای تمرکز بر مدل‌های عظیم، بر توسعه‌ هوش مصنوعی کارآمد و مبتنی بر پردازش درون‌دستگاهی متمرکز شده است.

برخی این رویکرد را به دیده‌ طعنه نگریسته‌اند. پدروس دومینگوس، استاد بازنشسته دانشگاه واشنگتن، در پستی در X نوشت: «استراتژی جدید و درخشان اپل برای هوش مصنوعی این است که ثابت کند اصلاً وجود ندارد!»

با وجود این، برخی پژوهشگران این مطالعه را به‌ عنوان زنگ هشدار مهمی در برابر ادعاهای اغراق‌آمیز در مورد هوش مصنوعی ارزیابی کرده‌اند. آندری بوروکوف، کارشناس هوش مصنوعی و رهبر پیشین تیم یادگیری ماشین در شرکت گارتنر در X نوشت: «اپل با انتشار مقاله‌ای داوری‌شده نشان داد که مدل‌های زبانی بزرگ، صرفاً شبکه‌های عصبی هستند و تمام محدودیت‌های همین شبکه‌ها را دارند. شاید حالا دوباره به مسیر علم واقعی بازگردیم؛ مدل‌ها را نه مانند یک روان‌شناس بلکه مانند ریاضی‌دان مطالعه کنیم.»

نرگس چالوک

نرگس چالوک

به‌عنوان مترجم وب‌سایت خبری در حوزه فناوری فعالیت می‌کنم و تجربه‌ی خوبی در زمینه‌ی سئو، تولید و انتشار محتوا، نگارش و ویرایش مقالات و گزارش‌های خبری دارم.علاوه بر این، مدرس زبان انگلیسی هستم و سال‌هاست به کودکان و بزرگسالان در محیط‌های حضوری و آنلاین آموزش می‌دهم. همیشه تلاش کرده‌ام شیوه‌های آموزشی متنوع و مؤثر را به‌کار بگیرم و با صبر و انگیزه، یادگیری زبان را برای زبان‌آموزان آسان‌تر کنم.

مطالب مرتبط

آیکون سه بعدی و مینیمال لوگوی پی‌پل (PayPal) با سایه‌پردازی روی پس‌زمینه آبی.
فناوری

ورود غول پرداخت‌های دیجیتال به صنعت بانکداری آمریکا

نوشته شده توسط اسما کلهر
25 آذر 1404
عکس از گوشی آیفون که صفحه چت ChatGPT و تصویر نقاشی شده یک گربه را نشان می‌دهد.
اخبار هوش مصنوعی

نسخه جدید ابزار تولید تصویر ChatGPT Images منتشر شد

نوشته شده توسط اسما کلهر
25 آذر 1404
تجهیزات پست انتقال برق فشار قوی با ترانسفورماتورها و کلیدهای ایزوله در فضای باز، نماد زیرساخت شبکه برق و چالش تأمین انرژی در دوره رشد مصرف مراکز داده و هوش مصنوعی
اخبار هوش مصنوعی

دیتاسنترهای هوش مصنوعی در آمریکا متهم به افزایش قبوض برق شدند

نوشته شده توسط تارخ ترهنده
25 آذر 1404
نوار ابزار قابلیت «Deep Research» در رابط کاربری هوش مصنوعی جمنای.
اخبار هوش مصنوعی

با جمنای داده‌ها را به تصویر و نمودار تبدیل کنید

نوشته شده توسط اسما کلهر
25 آذر 1404
لوگوی انتزاعی و تخت (Flat) مرورگر موزیلا فایرفاکس با رنگ‌های نارنجی و بنفش.
اخبار هوش مصنوعی

قمار موزیلا روی هوش مصنوعی؛ مدیرعامل جدید فایرفاکس به‌دنبال بازتعریف اعتماد در عصر AI

نوشته شده توسط امیرحسین یونس
25 آذر 1404
خبر بعدی
اتریوم از مرز ۲٬۷۰۰ دلار عبور کرد؛ آیا مقصد بعدی ۳٬۰۰۰ دلار خواهد بود؟

اتریوم از مرز ۲٬۷۰۰ دلار عبور کرد؛ آیا مقصد بعدی ۳٬۰۰۰ دلار خواهد بود؟

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

پنج هواپیمای نظامی فوق‌گران‌قیمت که قدرت هوایی مدرن را دگرگون کرده‌اند

13 آذر 1404
دوربین Leica Q3 Monochrom به رنگ سیاه، که با یک هود لنز روی یک سطح قهوه‌ای در کنار مجموعه‌ای از عکس‌های چاپ شده سیاه و سفید قرار گرفته است.

جدیدترین دوربین سیاه و سفید لایکا با قیمت ۷,۸۰۰ دلار عرضه شد

29 آبان 1404

داغ‌ترین‌های روز

شیائومی شروع به انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ کرد

شیائومی انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ HyperOS را آغاز کرد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
بررسی Poco F8 Ultra

بررسی Poco F8 Ultra ؛ بالارده جذاب شیائومی با ووفر داخلی!

23 آذر 1404 - به‌روزشده در 24 آذر 1404
صفحه تماس در گوشی شیائومی با نمایش قابلیت دستیار تماس هوش مصنوعی (AI Call Assistant).

رام تایوان شیائومی؛ انتخاب نخست کاربران حرفه‌ای

22 آذر 1404 - به‌روزشده در 23 آذر 1404
طولانی‌ترین بازی‌های تاریخ؛ معرفی ۱۰ بازی با بیشترین ساعات گیم‌پلی

طولانی‌ترین بازی‌های تاریخ؛ معرفی ۱۰ بازی با بیشترین ساعات گیم‌پلی

23 آذر 1404
راهنمای خرید بهترین لپ‌تاپ‌های لمسی و تاچ اسکرین

راهنمای خرید بهترین لپ‌تاپ‌های لمسی و تاچ اسکرین

23 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

پشت لپ‌تاپ گیمینگ Thunderobot با نشان "ZERO" و نورپردازی RGB در دریچه‌های هوا.

رونمایی از لپ‌تاپ گیمینگ ۱.۶ کیلوگرمی تاندرروبات با قلب تپنده RTX 50

25 آذر 1404
کیس کامپیوتر مشکی Lecoo که روی میز کنار مانیتور و ماوس سفید قرار دارد.

لنوو از کامپیوترهای رومیزی جدید Lecoo Cool 310 رونمایی کرد

25 آذر 1404
آیکون سه بعدی و مینیمال لوگوی پی‌پل (PayPal) با سایه‌پردازی روی پس‌زمینه آبی.

ورود غول پرداخت‌های دیجیتال به صنعت بانکداری آمریکا

25 آذر 1404
عکس از گوشی آیفون که صفحه چت ChatGPT و تصویر نقاشی شده یک گربه را نشان می‌دهد.

نسخه جدید ابزار تولید تصویر ChatGPT Images منتشر شد

25 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir