• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند؟

صمد کردی نوشته شده توسط صمد کردی
پنج‌شنبه 30 آذر 1402 - 13:45
در اخبار هوش مصنوعی, فناوری
مدل‌های زبانی بزرگ
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

در حوزه ریاضیات، نمی‌توان به مدل‌های زبانی بزرگ (LLM) کاملاً اعتماد کرد. در این مطلب، توضیح می‌شود که چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند.

به‌گزارش تک‌ناک،‌ هنگام بررسی مدل‌های زبانی بزرگ (LLM)، ممکن است تصور کنید که آن‌ها راه‌حلی جادویی برای بیشتر مشکلات شما هستند. آن‌ها را می‌توان برای برنامه‌ریزی روزانه یا مطرح‌کردن انواع سؤالات به‌کار برد، با این امید که به بهترین نحو ممکن به شما پاسخ می‌دهند. بااین‌همه، یک حوزه وجود دارد که نباید به‌طور کامل به LLM‌ها اعتماد کرد: ریاضیات.

به‌طور خاص، در‌حالی‌که LLM‌ها می‌توانند الگوهای ریاضی را از داده‌های وسیع یاد بگیرند و با اعداد کوچک‌تر به نتایج دقیق‌تری برسند، همچنان به پای محاسبات ماشین‌حساب نمی‌رسند. این ضعف بارز در محاسبات ریاضی LLM‌ها قبلاً در تحقیقات و مقالاتی مانند «GPT می‌تواند مسائل ریاضی را بدون ماشین‌حساب حل کند”» بررسی شده است.

دانشگاه Tsinghua مدلی به نام MathGLM را معرفی کرد که برای حل مسائل ریاضی آموزش دیده و نشان داده شده است که دقت زیادی دارد. این مدل در‌مقایسه‌با GPT-4 و ChatGPT عملکرد بهتری دارد. 

هنگام بررسی مدل‌های زبانی بزرگ (LLM)، ممکن است تصور کنید که آن‌ها راه‌حلی جادویی برای بیشتر چالش‌های شما هستند. آن‌ها را می‌توان برای برنامه‌ریزی روزانه یا پرسیدن انواع سوالات به کار برد، با این امید که به بهترین نحو ممکن به شما پاسخ می‌دهند

همان‌طور‌که از محاسبات بالا مشخص است، MathGLM عملکرد بهتری از هر دو GPT-4 و ChatGPT دارد. با‌این‌حال، مشکل موجود این است که حتی با محاسبات پنج‌رقمی، بهترین نتیجه‌ای که می‌توانید از مدلی با ۲ میلیارد پارامتر دریافت کنید، دقت ۸۵.۱۶درصد است. بدون توجه به هرچیزی، ۱۰,۰۰۰×۵ همچنان ۵۰,۰۰۰ است و اگر LLM به آن نزدیک شود؛ ولی دقیقاً همان نباشد، پس همچنان جواب اشتباه است. ماشین‌حساب همه‌ی این مشکلات را با دقت ۱۰۰ درصد در هر زمانی حل خواهد کرد.

با افزایش اندازه اعداد، دقت کاهش می‌یابد که احتمالاً به‌دلیل تمرکز بر محاسبات کوچک‌تر در داده‌های آموزشی است. مدل‌ها واقعاً در حال انجام محاسبات نیستند؛ بلکه در حال شناسایی الگوها هستند. برای استفاده از MathGLM می‌توانید به GitHub تیم مراجعه کنید؛ اما اجرای آن نیازمند کامپیوتری قدرتمند است.

در‌مقابل، گوگل با FunSearch خود که LLM پیش‌آموزش‌دیده‌ای را با ارزیاب خودکار ترکیب می‌کند تا اشتباهات را کاهش دهد، موفقیت‌هایی را کسب کرده است. این روش به LLM‌ها اجازه می‌دهد تا ضمن حفظ خلاقیت، از انحرافات بیش‌از‌حد جلوگیری کنند. در‌حالی‌که LLM‌ها در ریاضیات ضعیف هستند، در ایجاد ایده‌های خلاقانه برتری دارند.

FunSearch یک رویکرد جدید از Google است که با استفاده از توضیحات مسائل ریاضی به شکل کد کار می‌کند. این توضیحات به عنوان اساسی برای ارزیابی خروجی‌ها و ایجاد یک مجموعه اولیه از برنامه‌ها عمل می‌کنند. در هر تکرار، FunSearch برخی از برنامه‌ها را انتخاب و به یک LLM مانند PaLM 2 ارائه می‌دهد تا برنامه‌های جدیدی ایجاد کند. بهترین‌ها برای بهبود مداوم انتخاب می‌شوند، یک فرآیند خودبهبودی مداوم.

FunSearch رویکردی جدید از گوگل است که با استفاده از توضیحات مسائل ریاضی به‌شکل کد کار می‌کند. این توضیحات به‌عنوان اساسی برای ارزیابی خروجی‌ها و ایجاد مجموعه‌ای اولیه از برنامه‌ها عمل می‌کنند. در هر تکرار، FunSearch برخی از برنامه‌ها را انتخاب و به LLM مانند PaLM 2 ارائه می‌دهد تا برنامه‌های جدیدی ایجاد کند. بهترین‌ها برای بهبود مداوم انتخاب می‌شوند.

FunSearch در یافتن بزرگ‌ترین مجموعه‌های cap موفق بود که از بهترین‌های شناخته‌شده برخی از دانشمندان برجسته جهان فراتر رفت. طبق مقاله‌ای در Nature، این ممکن است اولین کشف علمی باشد که LLM به آن نائل شده است.

گوگل با FunSearch نشان داده که LLM‌ها می‌توانند ابزارهای قدرتمندی برای ریاضیات باشند؛ اما نه به‌تنهایی. با ترکیب خلاقیت LLM‌ها با ارزیاب‌های دقیق، می‌توان به حل مسائل پیچیده و تولید ایده‌های نوآورانه پرداخت. این نمایانگر توانایی LLM‌ها در ریاضی نیست؛ بلکه بیشتر مهارت مهندسان در هدایت آن‌ها به‌سمت نتایج دقیق و معنادار است.

وقتی از مدلی زبان بزرگ (LLM) مانند ChatGPT یا بارد می‌خواهید مفهوم ریاضی را شرح دهد (مثلاً نحوه ضرب دو ماتریس)، معمولاً می‌توانید انتظار داشته باشید که توضیحات دقیق و صحیحی دریافت کنید. این مدل‌ها در تشریح مفاهیم و فرایندهای نظری تبحر دارند و می‌توانند اطلاعات مرتبط را به شیوه‌ای مفهوم ارائه دهند.

با‌این‌حال، وقتی می‌خواهید که LLM‌ها به‌طور خودکار محاسبات را انجام دهند (مثلاً ضرب دو ماتریس واقعی)، دقتشان ممکن است کاهش یابد. این اغلب به‌دلیل محدودیت‌ها و مسائل درک متن و ساختار داده‌های ریاضی به‌واسطه این مدل‌هاست. ممکن است ابعاد نادرستی را محاسبه کنند یا در مراحل محاسبه اشتباهاتی ایجاد شوند.

بنابراین، اگر قصد دارید از LLM‌ها برای کمک در ریاضیات استفاده کنید، بهتر است از آن‌ها برای فهمیدن مفاهیم نظری و فرایندهای حل مسئله استفاده کنید؛ ولی برای محاسبات واقعی و دقیق، بهتر است خودتان آن‌ها را انجام دهید یا از ابزارهای مخصوص محاسبه استفاده کنید.

حتی اگر پاسخ در مجموعه داده‌های آموزشی مدل باشد، همیشه امکان خطا وجود دارد. در‌نهایت، یادگیری و انجام محاسبات خودتان، بهترین رویکرد برای دقت و درک عمیق‌تر است.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

اختلال جهانی در پلتفرم ایکس در پی آتش‌سوزی در مرکز داده
پیشنهاد سردبیر

اختلال جهانی در شبکه اجتماعی ایکس در پی آتش‌سوزی در یکی از دیتاسنترها

نوشته شده توسط امیرحسین یونس
3 خرداد 1404
مدل جدید هوش مصنوعی Anthropic هنگام تهدید به خاموشی، به اخاذی متوسل می‌شود
اخبار هوش مصنوعی

مدل هوش مصنوعی Claude Opus 4 آنتروپیک هنگام تهدید به خاموشی، به اخاذی متوسل می‌شود

نوشته شده توسط اسما کلهر
3 خرداد 1404
رقیب Neuralink با هدایت گیب نیوئل، نخستین تراشه مغزی خود را در سال جاری عرضه خواهد کرد
فناوری

رقیب نورولینک با هدایت گیب نیوئل، نخستین تراشه مغزی خود را عرضه خواهد کرد

نوشته شده توسط اسما کلهر
3 خرداد 1404
نمای هوشمند FlectoLine دمای ساختمان را با الهام از طبیعت کنترل می کند
فناوری

نمای هوشمند FlectoLine دمای ساختمان را با الهام از طبیعت کنترل می کند

نوشته شده توسط ساینا چمنی
3 خرداد 1404
تسلا در ویدیویی تازه توانایی‌ های جدید ربات اپتیموس را نشان داد
رباتیک

تسلا در ویدیویی تازه توانایی‌ های جدید ربات اپتیموس را نشان داد

نوشته شده توسط ساینا چمنی
3 خرداد 1404
خبر بعدی
رفع اضطراب

ساخت دارویی امیدوارکننده برای رفع اضطراب

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

گلکسی A26 سامسونگ؛یک گوشی میان‌رده فراتر از انتظار

گلکسی A26 سامسونگ؛ یک گوشی میان‌رده فراتر از انتظار

11 اردیبهشت 1404
پایان پشتیبانی شیائومی از ۷ گوشی ردمی و پوکو؛ از جمله Poco F4

پایان پشتیبانی شیائومی از ۷ گوشی ردمی و پوکو

25 اردیبهشت 1404

داغ‌ترین‌های روز

بهترین فیلم های جهان

معرفی بهترین فیلم های سینمایی جهان

2 خرداد 1404
عرضه گوشی جدید «آیسد آمریکانو» توسط شیائومی: موبایلی با رایحه قهوه

شیائومی گوشی جدیدش را با رایحه قهوه روانه بازار کرد

2 خرداد 1404
۱۰ دسته بازی برتر برای کنسول و کامپیوتر در سال ۲۰۲۵

10 دسته بازی برتر برای کنسول و کامپیوتر در سال 2025

2 خرداد 1404
چین از پهپادهای پرنده‌نما با قابلیت استتار رونمایی کرد

چین از پهپادهای پرنده‌نما با قابلیت استتار رونمایی کرد

28 اردیبهشت 1404
بهترین هندزفری بلوتوثی سامسونگ: راهنمای کامل خرید مدل‌های حرفه‌ای تا اقتصادی

بهترین هندزفری بلوتوثی سامسونگ؛ راهنمای کامل خرید مدل‌های حرفه‌ای تا اقتصادی

2 خرداد 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

realme GT 7 رکورد جهانی Guinness World Record را برای ۲۴ ساعت پخش مداوم فیلم کسب کرد

گوشی ریلمی GT 7 رکورد جهانی گینس را برای ۲۴ ساعت پخش مداوم فیلم کسب کرد

3 خرداد 1404
پایان کار Mortal Kombat 1: هیچ محتوای جدیدی در راه نیست

پایان کار Mortal Kombat 1: هیچ محتوای جدیدی در راه نیست

3 خرداد 1404
بازی Resident Evil 9 در ابتدا یک عنوان چندنفره جهان‌باز با حضور لیان و جیل بوده است

Resident Evil 9 در ابتدا عنوان چندنفره جهان‌باز با حضور لیان و جیل بوده است

3 خرداد 1404
انتشار نسخه جدید Microsoft Edge با تمرکز بیشتر بر Copilot و بهبودهای امنیتی و نمایشی

انتشار نسخه جدید مایکروسافت اج با تمرکز بیشتر بر کوپایلت

3 خرداد 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir