• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند؟

چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند؟

صمد کردی نوشته شده توسط صمد کردی
پنجشنبه 30 آذر 1402 - 13:45
در اخبار هوش مصنوعی, فناوری
مدل‌های زبانی بزرگ
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

در حوزه ریاضیات، نمی‌توان به مدل‌های زبانی بزرگ (LLM) کاملاً اعتماد کرد. در این مطلب، توضیح می‌شود که چرا مدل‌های زبانی بزرگ در ریاضیات ضعف دارند.

به‌گزارش تک‌ناک،‌ هنگام بررسی مدل‌های زبانی بزرگ (LLM)، ممکن است تصور کنید که آن‌ها راه‌حلی جادویی برای بیشتر مشکلات شما هستند. آن‌ها را می‌توان برای برنامه‌ریزی روزانه یا مطرح‌کردن انواع سؤالات به‌کار برد، با این امید که به بهترین نحو ممکن به شما پاسخ می‌دهند. بااین‌همه، یک حوزه وجود دارد که نباید به‌طور کامل به LLM‌ها اعتماد کرد: ریاضیات.

به‌طور خاص، در‌حالی‌که LLM‌ها می‌توانند الگوهای ریاضی را از داده‌های وسیع یاد بگیرند و با اعداد کوچک‌تر به نتایج دقیق‌تری برسند، همچنان به پای محاسبات ماشین‌حساب نمی‌رسند. این ضعف بارز در محاسبات ریاضی LLM‌ها قبلاً در تحقیقات و مقالاتی مانند «GPT می‌تواند مسائل ریاضی را بدون ماشین‌حساب حل کند”» بررسی شده است.

دانشگاه Tsinghua مدلی به نام MathGLM را معرفی کرد که برای حل مسائل ریاضی آموزش دیده و نشان داده شده است که دقت زیادی دارد. این مدل در‌مقایسه‌با GPT-4 و ChatGPT عملکرد بهتری دارد. 

هنگام بررسی مدل‌های زبانی بزرگ (LLM)، ممکن است تصور کنید که آن‌ها راه‌حلی جادویی برای بیشتر چالش‌های شما هستند. آن‌ها را می‌توان برای برنامه‌ریزی روزانه یا پرسیدن انواع سوالات به کار برد، با این امید که به بهترین نحو ممکن به شما پاسخ می‌دهند

همان‌طور‌که از محاسبات بالا مشخص است، MathGLM عملکرد بهتری از هر دو GPT-4 و ChatGPT دارد. با‌این‌حال، مشکل موجود این است که حتی با محاسبات پنج‌رقمی، بهترین نتیجه‌ای که می‌توانید از مدلی با ۲ میلیارد پارامتر دریافت کنید، دقت ۸۵.۱۶درصد است. بدون توجه به هرچیزی، ۱۰,۰۰۰×۵ همچنان ۵۰,۰۰۰ است و اگر LLM به آن نزدیک شود؛ ولی دقیقاً همان نباشد، پس همچنان جواب اشتباه است. ماشین‌حساب همه‌ی این مشکلات را با دقت ۱۰۰ درصد در هر زمانی حل خواهد کرد.

با افزایش اندازه اعداد، دقت کاهش می‌یابد که احتمالاً به‌دلیل تمرکز بر محاسبات کوچک‌تر در داده‌های آموزشی است. مدل‌ها واقعاً در حال انجام محاسبات نیستند؛ بلکه در حال شناسایی الگوها هستند. برای استفاده از MathGLM می‌توانید به GitHub تیم مراجعه کنید؛ اما اجرای آن نیازمند کامپیوتری قدرتمند است.

در‌مقابل، گوگل با FunSearch خود که LLM پیش‌آموزش‌دیده‌ای را با ارزیاب خودکار ترکیب می‌کند تا اشتباهات را کاهش دهد، موفقیت‌هایی را کسب کرده است. این روش به LLM‌ها اجازه می‌دهد تا ضمن حفظ خلاقیت، از انحرافات بیش‌از‌حد جلوگیری کنند. در‌حالی‌که LLM‌ها در ریاضیات ضعیف هستند، در ایجاد ایده‌های خلاقانه برتری دارند.

FunSearch یک رویکرد جدید از Google است که با استفاده از توضیحات مسائل ریاضی به شکل کد کار می‌کند. این توضیحات به عنوان اساسی برای ارزیابی خروجی‌ها و ایجاد یک مجموعه اولیه از برنامه‌ها عمل می‌کنند. در هر تکرار، FunSearch برخی از برنامه‌ها را انتخاب و به یک LLM مانند PaLM 2 ارائه می‌دهد تا برنامه‌های جدیدی ایجاد کند. بهترین‌ها برای بهبود مداوم انتخاب می‌شوند، یک فرآیند خودبهبودی مداوم.

FunSearch رویکردی جدید از گوگل است که با استفاده از توضیحات مسائل ریاضی به‌شکل کد کار می‌کند. این توضیحات به‌عنوان اساسی برای ارزیابی خروجی‌ها و ایجاد مجموعه‌ای اولیه از برنامه‌ها عمل می‌کنند. در هر تکرار، FunSearch برخی از برنامه‌ها را انتخاب و به LLM مانند PaLM 2 ارائه می‌دهد تا برنامه‌های جدیدی ایجاد کند. بهترین‌ها برای بهبود مداوم انتخاب می‌شوند.

FunSearch در یافتن بزرگ‌ترین مجموعه‌های cap موفق بود که از بهترین‌های شناخته‌شده برخی از دانشمندان برجسته جهان فراتر رفت. طبق مقاله‌ای در Nature، این ممکن است اولین کشف علمی باشد که LLM به آن نائل شده است.

گوگل با FunSearch نشان داده که LLM‌ها می‌توانند ابزارهای قدرتمندی برای ریاضیات باشند؛ اما نه به‌تنهایی. با ترکیب خلاقیت LLM‌ها با ارزیاب‌های دقیق، می‌توان به حل مسائل پیچیده و تولید ایده‌های نوآورانه پرداخت. این نمایانگر توانایی LLM‌ها در ریاضی نیست؛ بلکه بیشتر مهارت مهندسان در هدایت آن‌ها به‌سمت نتایج دقیق و معنادار است.

وقتی از مدلی زبان بزرگ (LLM) مانند ChatGPT یا بارد می‌خواهید مفهوم ریاضی را شرح دهد (مثلاً نحوه ضرب دو ماتریس)، معمولاً می‌توانید انتظار داشته باشید که توضیحات دقیق و صحیحی دریافت کنید. این مدل‌ها در تشریح مفاهیم و فرایندهای نظری تبحر دارند و می‌توانند اطلاعات مرتبط را به شیوه‌ای مفهوم ارائه دهند.

با‌این‌حال، وقتی می‌خواهید که LLM‌ها به‌طور خودکار محاسبات را انجام دهند (مثلاً ضرب دو ماتریس واقعی)، دقتشان ممکن است کاهش یابد. این اغلب به‌دلیل محدودیت‌ها و مسائل درک متن و ساختار داده‌های ریاضی به‌واسطه این مدل‌هاست. ممکن است ابعاد نادرستی را محاسبه کنند یا در مراحل محاسبه اشتباهاتی ایجاد شوند.

بنابراین، اگر قصد دارید از LLM‌ها برای کمک در ریاضیات استفاده کنید، بهتر است از آن‌ها برای فهمیدن مفاهیم نظری و فرایندهای حل مسئله استفاده کنید؛ ولی برای محاسبات واقعی و دقیق، بهتر است خودتان آن‌ها را انجام دهید یا از ابزارهای مخصوص محاسبه استفاده کنید.

حتی اگر پاسخ در مجموعه داده‌های آموزشی مدل باشد، همیشه امکان خطا وجود دارد. در‌نهایت، یادگیری و انجام محاسبات خودتان، بهترین رویکرد برای دقت و درک عمیق‌تر است.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

لوگوی تایپوگرافی شده ROBLOX با رنگ قهوه‌ای تیره روی پس‌زمینه‌ای به رنگ سبز روشن به همراه چند مربع کج در گوشه‌ها.
اخبار هوش مصنوعی

روبلاکس از مفهوم «رؤیاپردازی لحظه‌ای» در مدل‌های جهان هوش مصنوعی خود رونمایی کرد

نوشته شده توسط اسما کلهر
15 بهمن 1404
ترافیک اینترنت ایران
اخبار داخلی

کلادفلر: اینترنت ایران محدود به لیست مجاز است

نوشته شده توسط صمد کردی
15 بهمن 1404
گوشی سامسونگ در دست که در حال بوت شدن است و لوگوی "Samsung Galaxy Secured by Knox" را نشان می‌دهد.
اخبار هوش مصنوعی

شکار بزرگ از اپل؛ مأموریت مخفی برای تحول پردازنده هوش مصنوعی سامسونگ

نوشته شده توسط اسما کلهر
15 بهمن 1404
نمایشگر هوشمند Amazon Echo Show قرارگرفته روی قفسه چوبی که رابط کاربری Alexa+ را نمایش می‌دهد؛ همراه با متن تبلیغاتی «Alexa+ Available to everyone in the U.S.» و اشاره به ارائه رایگان با عضویت Prime.
اخبار هوش مصنوعی

دستیار هوش مصنوعی الکسا پلاس آمازون وارد رقابت مستقیم با ChatGPT شد

نوشته شده توسط تارخ ترهنده
15 بهمن 1404
لوگوی انتراپیک شامل نماد یک خانه سفید با طرحی شبیه به پنجه یا ریشه در میان آن و یک خط منحنی سیاه در پایین، بر روی پس‌زمینه آبی ملایم.
اخبار هوش مصنوعی

نبرد استراتژی‌ها در دنیای هوش مصنوعی؛ آنتروپیک با شعار «بدون تبلیغات» به جنگ OpenAI می‌رود

نوشته شده توسط امیرحسین یونس
15 بهمن 1404
خبر بعدی
رفع اضطراب

ساخت دارویی امیدوارکننده برای رفع اضطراب

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

فعال‌سازی درگاه ملی خدمات دولت هوشمند + آموزش گام‌به‌گام ثبت‌نام

12 بهمن 1404
نمای زاویه‌دار از کیس گیمینگ مشکی ایسوس با پنل شیشه‌ای و افکت‌های هولوگرافیک روی بدنه.

ایسوس با ابرکامپیوتر هولوگرافیک ROG G1000 دنیای گیمینگ را شوکه کرد

16 دی 1404 - به‌روزشده در 17 دی 1404

داغ‌ترین‌های روز

بهترین پردازنده‌های کامپیوتر بازار ایران | راهنمای خرید CPU

بهترین پردازنده‌های کامپیوتر بازار ایران + راهنمای خرید CPU

12 بهمن 1404
راهنمای خرید بهترین گوشی های شیائومی

بهترین گوشی های شیائومی موجود در بازار ایران

7 بهمن 1404 - به‌روزشده در 8 بهمن 1404
طرح گرافیکی انتزاعی از پنجره‌های مختلف به‌روزرسانی (Windows Update) و کدهای دیجیتال.

۱۰ ویژگی و تغییر جدید به‌روزرسانی فوریه ویندوز ۱۱

10 بهمن 1404
مقایسه ساینا و کوییک؛ کدام خودرو اقتصادی انتخاب بهتری است؟

مقایسه ساینا و کوییک؛ کدام خودروی اقتصادی انتخاب بهتری است؟

12 بهمن 1404 - به‌روزشده در 13 بهمن 1404
سامسونگ سری گلکسی F70 را رسما معرفی کرد

سامسونگ سری گلکسی F70 را رسما معرفی کرد

11 بهمن 1404 - به‌روزشده در 12 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

رندر چهار گوشی گوگل پیکسل 10a به رنگ آبی یاسی که به صورت بادبزنی روی پس‌زمینه قرمز چیده شده‌اند.

گوگل بالاخره تاریخ عرضه پیکسل 10a را رسماً تأیید کرد

15 بهمن 1404
نمای نزدیک از پنل پشتی گوشی Galaxy S26 Ultra با پنج لنز دوربین مجزا و بدنه خاکستری مات.

بنچمارک گلکسی S26 اولترا از قدرت بی‌سابقه اسنپدراگون ۸ الیت نسل ۵ خبر می‌دهد

15 بهمن 1404 - به‌روزشده در 16 بهمن 1404
لوگوی تایپوگرافی شده ROBLOX با رنگ قهوه‌ای تیره روی پس‌زمینه‌ای به رنگ سبز روشن به همراه چند مربع کج در گوشه‌ها.

روبلاکس از مفهوم «رؤیاپردازی لحظه‌ای» در مدل‌های جهان هوش مصنوعی خود رونمایی کرد

15 بهمن 1404
ترافیک اینترنت ایران

کلادفلر: اینترنت ایران محدود به لیست مجاز است

15 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir