• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند؟

چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند؟

صمد کردی نوشته شده توسط صمد کردی
پنجشنبه 30 آذر 1402 - 13:45
در اخبار هوش مصنوعی, فناوری
مدل‌های زبانی بزرگ
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

در حوزه ریاضیات، نمی‌توان به مدل‌های زبانی بزرگ (LLM) کاملاً اعتماد کرد. در این مطلب، توضیح می‌شود که چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند.

به‌گزارش تک‌ناک،‌ هنگام بررسی مدل‌های زبانی بزرگ (LLM)، ممکن است تصور کنید که آن‌ها راه‌حلی جادویی برای بیشتر مشکلات شما هستند. آن‌ها را می‌توان برای برنامه‌ریزی روزانه یا مطرح‌کردن انواع سؤالات به‌کار برد، با این امید که به بهترین نحو ممکن به شما پاسخ می‌دهند. بااین‌همه، یک حوزه وجود دارد که نباید به‌طور کامل به LLM‌ها اعتماد کرد: ریاضیات.

به‌طور خاص، در‌حالی‌که LLM‌ها می‌توانند الگوهای ریاضی را از داده‌های وسیع یاد بگیرند و با اعداد کوچک‌تر به نتایج دقیق‌تری برسند، همچنان به پای محاسبات ماشین‌حساب نمی‌رسند. این ضعف بارز در محاسبات ریاضی LLM‌ها قبلاً در تحقیقات و مقالاتی مانند «GPT می‌تواند مسائل ریاضی را بدون ماشین‌حساب حل کند”» بررسی شده است.

دانشگاه Tsinghua مدلی به نام MathGLM را معرفی کرد که برای حل مسائل ریاضی آموزش دیده و نشان داده شده است که دقت زیادی دارد. این مدل در‌مقایسه‌با GPT-4 و ChatGPT عملکرد بهتری دارد. 

هنگام بررسی مدل‌های زبانی بزرگ (LLM)، ممکن است تصور کنید که آن‌ها راه‌حلی جادویی برای بیشتر چالش‌های شما هستند. آن‌ها را می‌توان برای برنامه‌ریزی روزانه یا پرسیدن انواع سوالات به کار برد، با این امید که به بهترین نحو ممکن به شما پاسخ می‌دهند

همان‌طور‌که از محاسبات بالا مشخص است، MathGLM عملکرد بهتری از هر دو GPT-4 و ChatGPT دارد. با‌این‌حال، مشکل موجود این است که حتی با محاسبات پنج‌رقمی، بهترین نتیجه‌ای که می‌توانید از مدلی با ۲ میلیارد پارامتر دریافت کنید، دقت ۸۵.۱۶درصد است. بدون توجه به هرچیزی، ۱۰,۰۰۰×۵ همچنان ۵۰,۰۰۰ است و اگر LLM به آن نزدیک شود؛ ولی دقیقاً همان نباشد، پس همچنان جواب اشتباه است. ماشین‌حساب همه‌ی این مشکلات را با دقت ۱۰۰ درصد در هر زمانی حل خواهد کرد.

با افزایش اندازه اعداد، دقت کاهش می‌یابد که احتمالاً به‌دلیل تمرکز بر محاسبات کوچک‌تر در داده‌های آموزشی است. مدل‌ها واقعاً در حال انجام محاسبات نیستند؛ بلکه در حال شناسایی الگوها هستند. برای استفاده از MathGLM می‌توانید به GitHub تیم مراجعه کنید؛ اما اجرای آن نیازمند کامپیوتری قدرتمند است.

در‌مقابل، گوگل با FunSearch خود که LLM پیش‌آموزش‌دیده‌ای را با ارزیاب خودکار ترکیب می‌کند تا اشتباهات را کاهش دهد، موفقیت‌هایی را کسب کرده است. این روش به LLM‌ها اجازه می‌دهد تا ضمن حفظ خلاقیت، از انحرافات بیش‌از‌حد جلوگیری کنند. در‌حالی‌که LLM‌ها در ریاضیات ضعیف هستند، در ایجاد ایده‌های خلاقانه برتری دارند.

FunSearch یک رویکرد جدید از Google است که با استفاده از توضیحات مسائل ریاضی به شکل کد کار می‌کند. این توضیحات به عنوان اساسی برای ارزیابی خروجی‌ها و ایجاد یک مجموعه اولیه از برنامه‌ها عمل می‌کنند. در هر تکرار، FunSearch برخی از برنامه‌ها را انتخاب و به یک LLM مانند PaLM 2 ارائه می‌دهد تا برنامه‌های جدیدی ایجاد کند. بهترین‌ها برای بهبود مداوم انتخاب می‌شوند، یک فرآیند خودبهبودی مداوم.

FunSearch رویکردی جدید از گوگل است که با استفاده از توضیحات مسائل ریاضی به‌شکل کد کار می‌کند. این توضیحات به‌عنوان اساسی برای ارزیابی خروجی‌ها و ایجاد مجموعه‌ای اولیه از برنامه‌ها عمل می‌کنند. در هر تکرار، FunSearch برخی از برنامه‌ها را انتخاب و به LLM مانند PaLM 2 ارائه می‌دهد تا برنامه‌های جدیدی ایجاد کند. بهترین‌ها برای بهبود مداوم انتخاب می‌شوند.

FunSearch در یافتن بزرگ‌ترین مجموعه‌های cap موفق بود که از بهترین‌های شناخته‌شده برخی از دانشمندان برجسته جهان فراتر رفت. طبق مقاله‌ای در Nature، این ممکن است اولین کشف علمی باشد که LLM به آن نائل شده است.

گوگل با FunSearch نشان داده که LLM‌ها می‌توانند ابزارهای قدرتمندی برای ریاضیات باشند؛ اما نه به‌تنهایی. با ترکیب خلاقیت LLM‌ها با ارزیاب‌های دقیق، می‌توان به حل مسائل پیچیده و تولید ایده‌های نوآورانه پرداخت. این نمایانگر توانایی LLM‌ها در ریاضی نیست؛ بلکه بیشتر مهارت مهندسان در هدایت آن‌ها به‌سمت نتایج دقیق و معنادار است.

وقتی از مدلی زبان بزرگ (LLM) مانند ChatGPT یا بارد می‌خواهید مفهوم ریاضی را شرح دهد (مثلاً نحوه ضرب دو ماتریس)، معمولاً می‌توانید انتظار داشته باشید که توضیحات دقیق و صحیحی دریافت کنید. این مدل‌ها در تشریح مفاهیم و فرایندهای نظری تبحر دارند و می‌توانند اطلاعات مرتبط را به شیوه‌ای مفهوم ارائه دهند.

با‌این‌حال، وقتی می‌خواهید که LLM‌ها به‌طور خودکار محاسبات را انجام دهند (مثلاً ضرب دو ماتریس واقعی)، دقتشان ممکن است کاهش یابد. این اغلب به‌دلیل محدودیت‌ها و مسائل درک متن و ساختار داده‌های ریاضی به‌واسطه این مدل‌هاست. ممکن است ابعاد نادرستی را محاسبه کنند یا در مراحل محاسبه اشتباهاتی ایجاد شوند.

بنابراین، اگر قصد دارید از LLM‌ها برای کمک در ریاضیات استفاده کنید، بهتر است از آن‌ها برای فهمیدن مفاهیم نظری و فرایندهای حل مسئله استفاده کنید؛ ولی برای محاسبات واقعی و دقیق، بهتر است خودتان آن‌ها را انجام دهید یا از ابزارهای مخصوص محاسبه استفاده کنید.

حتی اگر پاسخ در مجموعه داده‌های آموزشی مدل باشد، همیشه امکان خطا وجود دارد. در‌نهایت، یادگیری و انجام محاسبات خودتان، بهترین رویکرد برای دقت و درک عمیق‌تر است.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

پوستر تبلیغاتی مدل هوش مصنوعی Qwen 3.5 علی‌بابا با تصویر یک خرس عروسکی و صندوقچه گنج.
اخبار هوش مصنوعی

علی‌بابا رقیب قدرتمندی برای ChatGPT معرفی کرد

نوشته شده توسط اسما کلهر
29 بهمن 1404
لوگوی درخشان سونی روی یک مکعب شیشه‌ای در محیطی تاریک با نورپردازی آبی.
فناوری

فناوری پیشرفته سونی برای ردیابی آهنگ‌های اصلی در موسیقی تولیدشده توسط هوش مصنوعی

نوشته شده توسط اسما کلهر
29 بهمن 1404
نمایی از رابط کاربری وب Google Gemini که قابلیت تولید موسیقی با هوش مصنوعی (Lyria) را نمایش می‌دهد. در صفحه، پیام تولید یک قطعه R&B Slow Jam دیده می‌شود و یک پلیر صوتی با تصویر کاور هنری در مرکز قرار دارد. این تصویر به کاربرد Gemini در خلق محتوای صوتی و موسیقی مولد با AI اشاره می‌کند.
اخبار هوش مصنوعی

جمنای گوگل به قابلیت ساخت موسیقی مجهز شد

نوشته شده توسط تارخ ترهنده
29 بهمن 1404
تصویری از یک دست انسان و یک دست ربات که کره‌ای که مرکز آن نوشته شده AI را نگه داشته‌اند.
اخبار هوش مصنوعی

نه جایگزینی نیرو و نه سرعت بیشتر؛ معمای عدم تأثیر هوش مصنوعی بر بهره‌وری

نوشته شده توسط تارخ ترهنده
29 بهمن 1404
نمای نزدیک از صفحه‌نمایش یک لپ‌تاپ که لوگوی Microsoft Copilot با آیکن گرادینتی رنگین‌کمانی و متن Copilot روی پس‌زمینه روشن نمایش داده شده است. تصویر به استفاده از دستیار هوش مصنوعی Copilot در محیط کاری و تعامل کاربر با ابزارهای AI مایکروسافت اشاره دارد.
اخبار هوش مصنوعی

نفوذ هوش مصنوعی به ایمیل‌های سری؛ رسوایی بزرگ با باگ کوپایلت

نوشته شده توسط تارخ ترهنده
29 بهمن 1404
خبر بعدی
رفع اضطراب

ساخت دارویی امیدوارکننده برای رفع اضطراب

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آمریکا آماده آزمایش موشک مافوق صوت HASTE می‌ شود

آمریکا آماده آزمایش موشک مافوق صوت HASTE می‌ شود

25 بهمن 1404
ربات انسان‌نمای Lingxi X2 در معبد شائولین؛ اجرای دقیق حرکات کونگ‌فو

ربات انسان‌نمای Lingxi X2 در معبد شائولین؛ اجرای دقیق حرکات کونگ‌فو + ویدیو

21 بهمن 1404

داغ‌ترین‌های روز

وقفه عملیاتی شیائومی

شیائومی ترمز به‌روزرسانی‌ها را کشید؛ آپدیت HyperOS تا ۳ مارس متوقف شد

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
بهترین گوشی های کارکرده

این گوشی‌های کارکرده هنوز ارزش خرید دارند!

26 بهمن 1404 - به‌روزشده در 27 بهمن 1404
دو جنگنده اف-۳۵ خاکستری‌رنگ در حال پرواز در ارتفاع بالا بر فراز ابرها در آرایش دوتایی کنار یکدیگر دیده می‌شوند.

وزیر دفاع هلند: جنگنده F-35 را می‌توان مانند آیفون جیلبریک کرد

27 بهمن 1404
فهرست دستگاه‌های پوکو برای اندروید ۱۷ اعلام شد

فهرست دستگاه‌های پوکو برای اندروید ۱۷ اعلام شد

27 بهمن 1404
مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

28 بهمن 1404 - به‌روزشده در 29 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمای نزدیک از ساعت هوشمند ریباک راش قرمز رنگ روی مچ دست در حال نمایش ضربان قلب.

ریباک ساعت هوشمند “راش” را با قیمت رقابتی ۶۹.۹۹ دلار عرضه کرد

29 بهمن 1404
پوستر تبلیغاتی مدل هوش مصنوعی Qwen 3.5 علی‌بابا با تصویر یک خرس عروسکی و صندوقچه گنج.

علی‌بابا رقیب قدرتمندی برای ChatGPT معرفی کرد

29 بهمن 1404
لوگوی درخشان سونی روی یک مکعب شیشه‌ای در محیطی تاریک با نورپردازی آبی.

فناوری پیشرفته سونی برای ردیابی آهنگ‌های اصلی در موسیقی تولیدشده توسط هوش مصنوعی

29 بهمن 1404
اسکرین‌شات از محیط Google AI Mode که پاسخ‌های هوش مصنوعی درباره ورزش کرلینگ را همراه با لینک‌های منبع و کارت‌های اطلاعاتی کناری نمایش می‌دهد.

گوگل نمایش لینک‌ها در AI Overviews و AI Mode را برجسته‌تر کرد

29 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir