• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » ظرفیت واقعی حافظه مدل‌های زبانی بزرگ هوش مصنوعی آشکار شد

ظرفیت واقعی حافظه مدل‌های زبانی بزرگ هوش مصنوعی آشکار شد

نرگس چالوک نوشته شده توسط نرگس چالوک
دوشنبه 19 خرداد 1404 - 15:50
در اخبار هوش مصنوعی, فناوری
ظرفیت واقعی حافظه مدل‌های زبانی بزرگ هوش مصنوعی آشکار شد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. آموزش مدل‌های زبانی بزرگ؛ از واژه تا مفهوم
  • 2. کشف عددی بنیادین: ۳.۶ بیت به ازای هر پارامتر
  • 3. داده بیشتر، حفظ کمتر
  • 4. داده بیشتر، مدل امن‌تر

مطالعه‌ای مشترک از سوی پژوهشگران متا، گوگل، انویدیا و دانشگاه کرنل برای نخستین‌بار به‌ صورت دقیق نشان داده است که حافظه مدل‌های زبانی بزرگ (LLM) چه میزان از داده‌های آموزشی خود را «حفظ» می‌کنند.

به گزارش تک‌ناک، نتایج این تحقیق نشان می‌دهد که مدل‌های مبتنی بر ساختار GPT ظرفیت ثابتی برای حافظه‌سپاری دارند، که برابر با ۳.۶ بیت به ازای هر پارامتر است. به بیان دیگر، یک مدل با ۱.۵ میلیارد پارامتر، تنها حدود ۶۷۵ مگابایت اطلاعات خام را به‌ صورت مستقیم ذخیره می‌کند؛ رقمی که در مقایسه با مجموعه داده‌های تریلیون‌واژه‌ای بسیار ناچیز به نظر می‌رسد.

01
از 04
آموزش مدل‌های زبانی بزرگ؛ از واژه تا مفهوم

مدل‌های زبانی بزرگ همچون ChatGPT، Claude شرکت Anthropic و Gemini گوگل با تریلیون‌ها واژه از منابع گوناگون شامل وب‌سایت‌ها، کتاب‌ها، پایگاه‌های کد، تصاویر، صوت و ویدیو آموزش دیده‌اند. این مدل‌ها از دل چنین داده‌هایی، درکی آماری و تعمیم‌یافته از زبان و جهان پیرامون به‌دست می‌آورند. در این فرایند، میلیاردها پارامتر تنظیم می‌شود تا خروجی مدل، پاسخ‌هایی متناسب با الگوهای زبانی و مفهومی مشاهده‌شده در داده‌ها باشد.

اما همیشه این نگرانی وجود داشته که مدل‌ها ممکن است به‌جای تعمیم مفاهیم، صرفاً محتوای آموزش‌دیده را حفظ و بازتولید کنند. این مسئله به‌ویژه از منظر حقوقی و نقض احتمالی کپی‌رایت اهمیت فراوانی دارد.

02
از 04
کشف عددی بنیادین: ۳.۶ بیت به ازای هر پارامتر

پژوهش جدید نشان می‌دهد که مدل‌های GPT‌محور دارای ظرفیت حافظه‌ای ثابت و قابل اندازه‌گیری هستند، که ۳٫۶ بیت به ازای هر پارامتر است. این عدد به زبان ساده یعنی هر پارامتر تنها توانایی حفظ حدود ۱۲ مقدار متفاوت را دارد، که تقریباً معادل انتخاب یک ماه از سال یا نتیجه یک تاس ۱۲وجهی است. این مقدار حتی برای ذخیره یک کاراکتر کامل در زبان انگلیسی (که حدود ۴٫۷ بیت نیاز دارد) کافی نیست.

پژوهشگران با آموزش مدل‌های ترنسفورمر بر رشته‌هایی از بیت‌های کاملاً تصادفی، امکان هرگونه تعمیم را حذف کردند. در چنین شرایطی، عملکرد مدل‌های زبانی بزرگ در بازشناسی داده‌ها تنها می‌تواند ناشی از حافظه باشد. آنها از طریق این روش، رابطه مستقیمی میان تعداد پارامترها و میزان حافظه قابل ذخیره شناسایی کردند.

نتایج حافظه مدل‌های زبانی بزرگ با اندازه‌های مختلف — از ۵۰۰هزار تا ۱٫۵ میلیارد پارامتر — یکسان بود. حتی افزایش دقت عددی مدل از bfloat16 به float32 تنها باعث افزایش اندکی در ظرفیت حافظه (از ۳٫۵۱ به ۳٫۸۳ بیت) شد.

کشف ظرفیت واقعی حافظه مدل‌های زبانی بزرگ هوش مصنوعی

03
از 04
داده بیشتر، حفظ کمتر

برخلاف تصور رایج، آموزش مدل با داده بیشتر باعث افزایش حفظ‌شدگی نمی‌شود. به گفته جک موریس، نویسنده اصلی مقاله، آموزش با داده بیشتر باعث می‌شود که مدل‌ها به ازای هر نمونه، اطلاعات کمتری حفظ کنند. به‌ عبارت دیگر، داده بیشتر به معنای تعمیم بیشتر و حافظه کمتر است، که موضوعی حیاتی در مباحث حقوقی و اخلاقی مربوط به مدل‌های زبانی می‌شود.

همچنین این مطالعه نشان می‌دهد که حملات استنتاج عضویت — که برای تشخیص وجود یک داده خاص در مجموعه آموزشی طراحی شده‌اند — با افزایش حجم داده‌ها ناکارآمدتر می‌شوند. این یافته می‌تواند به کاهش نگرانی‌ها پیرامون افشای اطلاعات حساس یا دارای کپی‌رایت توسط LLMها کمک کند.

با وجود این، نویسندگان مقاله بیان کردند که داده‌های خاص و منحصربه‌فرد — مانند متون با سبک بسیار ویژه یا هنری — همچنان ممکن است بیشتر حفظ شوند. با وجود این‌، رویکرد آنها برای بررسی روندهای کلی طراحی شده است و به استثناها توجهی ندارند.

04
از 04
داده بیشتر، مدل امن‌تر

این پژوهش گامی مهم در جهت درک دقیق‌ عملکرد مدل‌های زبانی بزرگ و تفکیک حافظه از یادگیری محسوب می‌شود. یافته‌ها نشان می‌دهند که استفاده از داده‌های بیشتر نه‌تنها باعث تعمیم بهتر مدل می‌شود، بلکه ریسک بازتولید محتوای حساس یا تحت کپی‌رایت را نیز کاهش می‌دهد.

به‌ عنوان نمونه، یک مدل با ۵۰۰ هزار پارامتر می‌تواند حدود ۲۲۵ کیلوبایت داده حفظ کند، در حالی که ظرفیت حافظه یک مدل ۱٫۵ میلیارد پارامتری حدود ۶۷۵ مگابایت تخمین زده می‌شود. این میزان در مقایسه با فایل‌های رسانه‌ای زیاد نیست، اما در دنیای متن و زبان، معنا و اهمیت ویژه‌ای دارد.

با توجه به دعواهای حقوقی پرشمار میان توسعه‌دهندگان هوش مصنوعی و صاحبان محتوا، بی‌تردید این پژوهش به‌ عنوان مرجعی علمی و قانونی در بررسی عملکرد و مسئولیت مدل‌های زبانی مورد استناد قرار خواهد گرفت.

نرگس چالوک

نرگس چالوک

به‌عنوان مترجم وب‌سایت خبری در حوزه فناوری فعالیت می‌کنم و تجربه‌ی خوبی در زمینه‌ی سئو، تولید و انتشار محتوا، نگارش و ویرایش مقالات و گزارش‌های خبری دارم.علاوه بر این، مدرس زبان انگلیسی هستم و سال‌هاست به کودکان و بزرگسالان در محیط‌های حضوری و آنلاین آموزش می‌دهم. همیشه تلاش کرده‌ام شیوه‌های آموزشی متنوع و مؤثر را به‌کار بگیرم و با صبر و انگیزه، یادگیری زبان را برای زبان‌آموزان آسان‌تر کنم.

مطالب مرتبط

یک گوشی هوشمند که پیامی مبنی بر عدم امکان تایید سن کاربر و دکمه‌ای برای «تایید سن» (Verify age) را روی صفحه نشان می‌دهد.
پیشنهاد سردبیر

پایان تایید سن در اپلیکیشن‌ها؛ سیستم‌عامل‌ها پلیس جدید فضای مجازی می‌شوند

نوشته شده توسط امیرحسین یونس
7 اسفند 1404
صادرات عناصر نادر خاکی چین؛ فشار مستقیم بر صنعت نیمه‌رسانای ایالات متحده
فناوری

نفت قرن بیست‌‌ویکم در مشت پکن؛ ابعاد جدید محدودیت صادرات عناصر نادر خاکی چین

نوشته شده توسط امیرحسین یونس
7 اسفند 1404
باتری سیلیکون-کربن در پرچم‌داران آینده Samsung
فناوری

آیا گلکسی S27 میزبان باتری‌های سیلیکون‌کربن سامسونگ خواهد بود؟

نوشته شده توسط امیرحسین یونس
7 اسفند 1404
استارتاپ Vercept توسط Anthropic با هدف تقویت توسعه عامل‌های پیشرفته هوش مصنوعی
اخبار هوش مصنوعی

آنتروپیک استارتاپ Vercept را با هدف تقویت توسعه عامل‌های پیشرفته هوش مصنوعی خرید

نوشته شده توسط امیرحسین یونس
7 اسفند 1404
منظره‌ای هوایی از دره‌ای سرسبز با رودخانه پیچ‌درپیچ که به دریاچه‌ای آرام میان رشته‌کوه‌های مه‌آلود منتهی می‌شود؛ جاده آسفالتی از میان مراتع عبور کرده و چشم‌اندازی طبیعی و آرامش‌بخش ایجاد کرده است
اخبار هوش مصنوعی

گوگل از مدل نانو بنانا ۲ با قابلیت تولید تصویر سریع‌تر پرده‌برداری کرد

نوشته شده توسط تارخ ترهنده
7 اسفند 1404
خبر بعدی
سیگیت کارت حافظه ۴ ترابایتی جدید خود را برای Xbox معرفی کرد؛ قیمتی بالاتر از Xbox Series S

رونمایی کارت حافظه ۴ ترابایتی سیگیت برای ایکس‌باکس با قیمتی بیشتر از کنسول سری S

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بهترین فیلم‌های ترسناک غیر آمریکایی که نباید از دست بدهید

بهترین فیلم‌های ترسناک غیرآمریکایی که نباید از دست بدهید

26 بهمن 1404
نمای استودیویی از چند درایو SSD سازمانی Micron شامل مدل‌های Micron 9650، Micron 7600 و Micron 6600 ION با فرم‌فکتور E3.S و رابط PCIe NVMe، قرارگرفته روی پس‌زمینه کاملاً مشکی. طراحی صنعتی مینیمال، بدنه فلزی مشکی مات، کانکتورهای E3.S و چینش افقی و عمودی محصولات، تمرکز تصویر را بر کاربرد دیتاسنتری و ذخیره‌سازی پرسرعت نشان می‌دهد.

اولین SSD جهان با استاندارد PCIe 6.0 رکورد سرعت ۲۸ گیگابایت را شکست

25 بهمن 1404

داغ‌ترین‌های روز

از ایده تا پرواز پهپاد ونوم در ۷۱ روز؛ پروژه‌ای که معادلات پهپادی را تغییر می‌ دهد

از ایده تا پرواز پهپاد ونوم در ۷۱ روز؛ پروژه‌ای که معادلات پهپادی را تغییر می‌ دهد

2 اسفند 1404
رقابت J-35 چین با F-35 آمریکا در بازار جنگنده های نسل پنجم

رقابت J-35 چین با F-35 آمریکا در بازار جنگنده های نسل پنجم

4 اسفند 1404
بهترین گوشی های میان رده بازار

بهترین گوشی های میان رده بازار در سال ۲۰۲۶ + راهنمای کامل خرید

3 اسفند 1404 - به‌روزشده در 4 اسفند 1404
لاکهید مارتین نسخه ارتقایافته اف-۲۲ را با غلاف‌های IRST معرفی کرد

لاکهید مارتین نسخه ارتقایافته اف-۲۲ را با غلاف‌های IRST معرفی کرد + تصویر

6 اسفند 1404
اینترنت طبقاتی از شایعه تا واقعیت؛ ۵۰۰ سهمیه برای دسترسی آزاد!

اینترنت پرو از شایعه تا واقعیت؛ ۵۰۰ سهمیه برای دسترسی آزاد!

7 اسفند 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نسل جدید مینی‌پی‌سی‌های ابری برای سرویس Windows 365

رونمایی مایکروسافت از نسل جدید مینی‌پی‌سی‌های ابری برای سرویس Windows 365

8 اسفند 1404
ساعت هوشمند بر روی یک سطح سنگی که وضعیت باتری (۸۰ درصد) و بخش Battery Manager را نشان می‌دهد.

ساعت هوشمند حرفه ای Amazfit Active 3 Premium با طعم یاقوت و باتری ۱۲ روزه معرفی شد

7 اسفند 1404
افزایش قیمت گوشی‌های Xiaomi

موج جهانی افزایش قیمت گوشی‌ به شیائومی رسید

7 اسفند 1404
یک گوشی هوشمند که پیامی مبنی بر عدم امکان تایید سن کاربر و دکمه‌ای برای «تایید سن» (Verify age) را روی صفحه نشان می‌دهد.

پایان تایید سن در اپلیکیشن‌ها؛ سیستم‌عامل‌ها پلیس جدید فضای مجازی می‌شوند

7 اسفند 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir