• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » پاسخ محققان به پژوهش جنجالی اپل: ایراد از ارزیابی است نه هوش مصنوعی

پاسخ محققان به پژوهش جنجالی اپل: ایراد از ارزیابی است نه هوش مصنوعی

سید محمد برازنده نوشته شده توسط سید محمد برازنده
دوشنبه 26 خرداد 1404 - 10:05
در اخبار هوش مصنوعی, فناوری
پاسخ محققان به پژوهش جنجالی اپل: ایراد از ارزیابی است نه هوش مصنوعی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. اهمیت این جدال علمی درباره هوش مصنوعی

محققان در پاسخ به نتایج مقاله پر سر و صدای اپل درباره ناتوانی مدل‌های هوش مصنوعی در حل مسائل پیچیده گفتند که مشکل از نقص‌های ارزیابی است و ارتباطی با هوش مصنوعی ندارد.

به گزارش تک‌ناک، مقاله اخیر اپل با عنوان «توهم تفکر» (The Illusion of Thinking) که به بررسی توانایی مدل‌های بزرگ استدلالی (LRM) در حل مسائل پیچیده پرداخته بود، بازتاب گسترده‌ای در میان پژوهشگران هوش مصنوعی داشت. اپل در این مقاله به صراحت نتیجه گرفته بود که حتی پیشرفته‌ترین مدل‌ها نیز در مواجهه با وظایف پیچیده دچار فروپاشی می‌شوند. اما همه این تحلیل را قبول ندارند.

الکس لاوسن، پژوهشگر بنیاد Open Philanthropy روز گذشته، مقاله‌ای تحلیلی منتشر کرد که بسیاری از یافته‌های بحث‌برانگیز اپل را ناشی از ضعف در طراحی آزمایش‌ها دانسته است. این مقاله با همکاری مدل هوش مصنوعی کلود اوپوس (Claude Opus) از شرکت Anthropic نوشته شده است.

لاوسن در مقاله خود با عنوان «توهمِ توهم تفکر» به این موضوع پرداخته است که اگرچه مدل‌های فعلی در حل پازل‌های پیچیده برنامه‌ریزی دچار چالش می‌شوند، اما اپل در تفسیر نتایج، میان محدودیت‌های خروجی عملی و نقص‌های طراحی ارزیابی با شکست واقعی در استدلال خلط کرده است.

پاسخ محققان به مقاله اپل: ایراد از ارزیابی است و ارتباطی با هوش مصنوعی ندارد

او سه ایراد اصلی را به روش اپل وارد می‌داند:

  • نادیده گرفتن محدودیت‌های توکن خروجی:

شرکت اپل مدعی است که مدل‌ها در پازل‌هایی مانند برج هانوی با ۸ دیسک یا بیشتر دچار فروپاشی می‌شوند، اما لاوسن می‌گوید که مدل‌هایی مانند Claude در این موارد به سقف ظرفیت توکن‌های خروجی خود رسیده‌اند. به گفته او، خروجی‌های واقعی مدل‌ها به صراحت اشاره می‌کنند: «الگو ادامه دارد، اما برای صرفه‌جویی در توکن‌ها متوقف می‌شوم.»

  • شمارش پازل‌های غیرقابل حل به عنوان شکست:

به گفته لاوسن، در آزمون عبور از رودخانه اپل، نمونه‌هایی از پازل‌ها گنجانده شده بود که اصولاً غیرقابل حل بودند (برای مثال، بیش از ۶ جفت کاراکتر با قایقی که ظرفیت عبور همه را نداشت). مدل‌ها به دلیل تشخیص این موضوع و عدم تلاش برای حل آنها، نمره منفی گرفته‌اند.

  • عدم تمایز میان شکست استدلالی و محدودیت خروجی:

شرکت اپل از اسکریپت‌های ارزیابی خودکاری استفاده کرده است، که تنها پاسخ‌هایی با فهرست کامل حرکات را به عنوان موفقیت تلقی کرده‌اند. به همین دلیل، خروجی‌های جزئی یا استراتژیک به عنوان شکست کامل ثبت شده‌اند.

لاوسن برای اثبات ادعای خود، بخشی از آزمون‌های برج هانوی را به شیوه‌ای متفاوت بازآزمایی کرده است: به جای فهرست کامل حرکات، از مدل‌ها خواسته است یک تابع بازگشتی به زبان Lua بنویسند که راه‌حل را تولید کند. نتیجه؟ مدل‌هایی مانند Claude، Gemini و o3 از OpenAI بدون مشکل توانستند راه‌حل الگوریتمی صحیح برای پازل‌هایی با ۱۵ دیسک ارائه دهند؛ یعنی به‌مراتب فراتر از پیچیدگی‌ که اپل در آن موفقیتی گزارش نکرده بود.

لاوسن نتیجه‌گیری می‌کند: «زمانی که محدودیت‌های مصنوعی خروجی را حذف می‌کنیم، مدل‌های زبانی بزرگ توان استدلال درباره وظایف پیچیده را دارند؛ حداقل در زمینه تولید الگوریتم به این صورت است.»

01
از 01
اهمیت این جدال علمی درباره هوش مصنوعی

در نگاه نخست، این بحث شاید مانند اختلافات معمول در تحقیقات هوش مصنوعی به نظر برسد، اما اهمیت آن بیش از این است. مقاله اپل بارها به عنوان شاهدی بر این ادعا مطرح شده است که مدل‌های زبانی کنونی فاقد توانایی استدلال مقیاس‌پذیر هستند. اما لاوسن نشان می‌دهد که واقعیت می‌تواند پیچیده‌تر باشد: بله، مدل‌ها در شمارش طولانی توکن‌ها مشکل دارند، اما موتورهای استدلالی‌ آنها به اندازه‌ای شکننده نیست که مقاله اپل القا می‌کند.

البته این به معنای رفع مسئولیت از مدل‌ها نیست. حتی لاوسن اذعان می‌کند که تعمیم الگوریتم در عمل همچنان یک چالش است و نتایج آزمایش‌های او فعلا مقدماتی به حساب می‌آیند. او همچنین پیشنهادهایی برای تحقیقات آینده مطرح کرده است:

  • طراحی آزمون‌هایی که تفاوت میان توان استدلال و محدودیت خروجی را نشان دهد.
  • از قابل حل بودن پازل‌ها پیش از ارزیابی عملکرد مدل اطمینان حاصل شود.
  • از سنجه‌های پیچیدگی که دشواری محاسباتی را نشان دهد نه صرفاً طول راه‌حل را استفاده شود.
  • اشکال مختلف ارائه پاسخ برای تفکیک درک الگوریتمی از اجرای آن در نظر گرفته شود.

به گفته لاوسن، پرسش اصلی این نیست که آیا مدل‌های زبانی بزرگ می‌توانند استدلال کنند یا خیر؛ بلکه این است که آیا روش‌های ارزیابی ما می‌توانند تفاوت میان استدلال واقعی و صرفاً تایپ کردن خروجی را نشان دهند یا خیر.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

نمای نزدیک از صفحه یک گوشی هوشمند که لوگوی رنگی و متن سفید Microsoft Copilot را نمایش می‌دهد.
فناوری

مایکروسافت برای تبلیغ “کوپایلت” به اینفلوئنسرها مبالغ هنگفت می‌پردازد

نوشته شده توسط اسما کلهر
20 بهمن 1404
نمای نزدیک از پنل پشتی بنفش‌رنگ آیفون ۱۷ که چیدمان عمودی دو دوربین آن را نشان می‌دهد.
فناوری

اپل دوربین آیفون را به ابزاری برای نظارت بر نحوه راه رفتن کاربران تبدیل می‌کند

نوشته شده توسط اسما کلهر
20 بهمن 1404
آیکون اپلیکیشن‌های ChatGPT، Gemini و Copilot در کنار هم روی صفحه نمایش موبایل یا تبلت.
فناوری

مایکروسافت، اوپن‌ای‌آی و ناشران وب در معرض خطر سوءاستفاده گوگل از انحصار جستجو

نوشته شده توسط اسما کلهر
20 بهمن 1404
تصویر گرافیکی از لوگوی ChatGPT و برند OpenAI با قلم سفید روی پس‌زمینه گرادیانی آبی و نارنجی روشن، نمادی از خدمت تبلیغات جدید در ChatGPT و توسعه محصولات هوش مصنوعی ارتباطی.
اخبار هوش مصنوعی

کاربران رایگان چت جی‌پی‌تی از امروز تبلیغ خواهند دید

نوشته شده توسط تارخ ترهنده
20 بهمن 1404
نمای نزدیک از صفحه تلویزیون که اپلیکیشن YouTube TV را در بخش برنامه‌ها (Apps) نشان می‌دهد.
شبکه های اجتماعی

یوتیوب تی‌وی مدل اشتراک‌گذاری خود را متحول می‌کند؛ طرح‌های ژانرمحور با هدف شخصی‌سازی تجربه کاربری از راه رسیدند

نوشته شده توسط اسما کلهر
20 بهمن 1404
خبر بعدی
چگونه در زمان جنگ آرامش روانی خود را حفظ کنیم؟

چگونه در زمان جنگ آرامش روانی خود را حفظ کنیم؟

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بهترین گوشی های دکمه ای

بهترین گوشی های دکمه ای بازار از نوکیا، جی ال ایکس و آلکاتل

19 بهمن 1404 - به‌روزشده در 20 بهمن 1404
متن جایگزین تصویر دوم: هواپیمای ترابری نظامی A400M ایرباس در حال پرواز از نمای زیرین، با چهار موتور توربوپراپ و طراحی مناسب برای مأموریت‌های چندمنظوره.

ایرباس از هواپیمای پهپادبر A400M رونمایی کرد

16 بهمن 1404

داغ‌ترین‌های روز

یک لپ‌تاپ ویندوزی در مقابل تپه‌ای از چاپگرهای قدیمی و مستهلک که نشان‌دهنده پایان پشتیبانی از درایورهای قدیمی است.

ویندوز ۱۱ در سال ۲۰۲۶ به پشتیبانی از درایورهای قدیمی چاپگر پایان می‌دهد؛ آماده‌باش برای کاربران!

18 بهمن 1404
بررسی Galaxy A07 5G

بررسی Galaxy A07 5G ؛ گوشی اقتصادی جذاب سامسونگ با پشتیبانی از 5G

19 بهمن 1404
این دو موشک ایرانی سامانه های پدافندی را به چالش می کشند + اینفوگرافیک

این دو موشک ایرانی سامانه های پدافندی را به چالش می کشند + اینفوگرافیک

19 بهمن 1404
پیش بینی دبیر اتحادیه طلا و جواهر از آینده بازار در هفته‌های آینده + ویدیو

پیش بینی دبیر اتحادیه طلا و جواهر از آینده بازار سکه و طلا + ویدیو

20 بهمن 1404
طرح گرافیکی از بخش بالایی و کناری گوشی آیفون با متن بزرگ "iPhone 17e" در پس‌زمینه سبز و زرد.

اقتصادی‌ترین گوشی اپل در راه است؛ هر آنچه از آیفون 17e می‌دانیم

18 بهمن 1404 - به‌روزشده در 19 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمای نزدیک از پنل پشتی گوشی شیائومی ۱۸ پرو شامل ماژول دوربین سه‌گانه با برند لایکا و یک صفحه نمایش کوچک ثانویه.

شیائومی ۱۸ پرو با دو دوربین ۲۰۰ مگاپیکسلی در یک بدنه جمع‌وجور ۶.۳ اینچی عرضه می شود

20 بهمن 1404
نمای داخلی یک کیس کامپیوتر گیمینگ با نورپردازی آبی و فن خنک‌کننده در حال چرخش.

مایکروسافت ۳۲ گیگابایت رم را به عنوان نقطه بهینه برای گیمرهای جدی معرفی می‌کند

20 بهمن 1404
نمای نزدیک از صفحه یک گوشی هوشمند که لوگوی رنگی و متن سفید Microsoft Copilot را نمایش می‌دهد.

مایکروسافت برای تبلیغ “کوپایلت” به اینفلوئنسرها مبالغ هنگفت می‌پردازد

20 بهمن 1404
یک تبلت روی میز که صفحه اپلیکیشن Signal Private Messenger را در محیط مایکروسافت استور نشان می‌دهد.

پیام‌رسان خصوصی سیگنال به فروشگاه مایکروسافت در ویندوز ۱۱ و ۱۰ پیوست

20 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir