• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اتهام تقلب در بنچمارک مدل‌های Llama 4؛ متا شفاف‌سازی کرد

اتهام تقلب در بنچمارک مدل‌های Llama 4؛ متا شفاف‌سازی کرد

سید محمد برازنده نوشته شده توسط سید محمد برازنده
سه شنبه 19 فروردین 1404 - 11:20
در اخبار هوش مصنوعی, فناوری
اتهام تقلب در بنچمارک مدل‌های Llama 4؛ متا شفاف‌سازی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. رونمایی پرحاشیه از نسل چهارم مدل‌های Llama
  • 2. افشاگری جنجالی درباره تقلب در بنچمارک Llama 4
  • 3. مقایسه عملکرد نسخه‌های داخلی و عمومی
  • 4. پاسخ رسمی متا درباره تقلب در بنچمارک Llama 4

در پی شایعاتی مبنی بر تقلب در نتایج بنچمارک مدل‌های Llama 4، شرکت متا با صدور بیانیه‌ای رسمی این اتهامات را رد و تأکید کرد که هیچ‌گونه تقلب یا استفاده از داده‌های بنچمارک در آموزش مدل‌ها صورت نگرفته است.

به گزارش تک‌ناک، شرکت متا اعلام کرد که مدل‌های Llama 4 طبق رویه‌های علمی متداول توسعه یافته‌اند و تفاوت در عملکرد نسخه‌ها، ناشی از ماهیت آزمایشی برخی نسخه‌های اولیه است.

01
از 04
رونمایی پرحاشیه از نسل چهارم مدل‌های Llama

شرکت متا در هفته گذشته، از نسل چهارم مدل‌های زبانی بزرگ خود با نام‌های Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth به عنوان بخشی از سیستم هوش مصنوعی چندوجهی پیشرفته‌، رونمایی کرد.

مدل Scout با قابلیت اجرا روی یک پردازنده گرافیکی Nvidia H100، از پنجره متنی گسترده‌ای به اندازه ۱۰ میلیون توکن پشتیبانی می‌کند. مدل Maverick که طراحی پیشرفته‌تری دارد، طبق ادعای متا، در حوزه‌هایی مانند: کدنویسی و استدلال منطقی، با مصرف پارامترهای فعال کمتر، عملکردی قابل مقایسه با مدل‌های پرچم‌دار مانند: GPT-4o و DeepSeek-V3 دارد.

در رأس این مجموعه، مدل Behemoth قرار دارد که با ۲۸۸ میلیارد پارامتر فعال و مجموع ۲ تریلیون پارامتر، از نظر مقیاس و توان پردازشی، یکی از بزرگ‌ترین مدل‌های زبانی معرفی‌شده تاکنون به‌ حساب می‌آید. به‌ گفته متا، این مدل در آزمون‌های استاندارد حوزه علوم و مهندسی (STEM) موفق به عبور از رقبایی مانند: GPT-4.5 و Claude Sonnet 3.7 شده است.

متا درباره اتهام تقلب در بنچمارک مدل‌های Llama 4 شفاف‌سازی کرد

02
از 04
افشاگری جنجالی درباره تقلب در بنچمارک Llama 4

به فاصله کوتاهی از انتشار تبلیغات گسترده پیرامون توانمندی‌های فنی این مدل‌ها، شایعه‌ای از سوی فردی در شبکه‌های اجتماعی پخش شد که خود را یکی از کارکنان پیشین متا معرفی کرده بود. این فرد مدعی شد که شرکت، به‌ منظور دستیابی به نتایج مطلوب در بنچمارک‌ها، مجموعه‌ای از داده‌های آزمونی را در مرحله‌ پس‌آموزش به مدل تزریق کرده است.

در بخشی از پست ترجمه‌شده‌ وی آمده است:

«عملکرد مدل حتی پس از تکرارهای متعدد آموزش، به سطح SOTA در پروژه‌های متن‌باز نمی‌رسید. به همین دلیل، مدیریت پیشنهاد استفاده از داده‌های بنچمارک در آموزش نهایی را مطرح کرد تا مدل در ظاهر، عملکرد متوازنی در معیارهای مختلف داشته باشد.»

همچنین این فرد ضمن اعلام استعفا از پروژه، درخواست کرده بود که نام او از گزارش فنی Llama 4 حذف شود. وی مدعی شد یکی از معاونان ارشد بخش هوش مصنوعی متا نیز به همین دلیل از سمت خود کناره‌گیری کرده است.

03
از 04
مقایسه عملکرد نسخه‌های داخلی و عمومی

گزارش‌های متعدد در پلتفرم X (توییتر) و Reddit نیز به تفاوت محسوس بین عملکرد نسخه‌ای از Maverick که در پلتفرم LMArena به نمایش درآمده بود و نسخه‌ای که برای توسعه‌دهندگان منتشر شده بود، اشاره داشتند. Ethan Mollick، استاد دانشگاه و پژوهشگر حوزه فناوری، در این باره نوشت:

«پاسخ‌های نسخه‌ Arena با مدل منتشرشده، تفاوت فاحشی دارد. به‌ نظر می‌رسد که نتایج Arena به نحوی تنظیم شده‌اند که پاسخ‌ها برای انسان‌ها قابل‌قبول‌تر جلوه کنند.»

شرکت متا نیز با تأیید آزمایشی بودن نسخه مورد استفاده در LMArena اعلام کرد:

«نسخه‌ چت آزمایشی Llama 4 Maverick موفق به کسب امتیاز ELO معادل ۱۴۱۷ در LMArena شده است. این نسخه فقط برای ارزیابی داخلی بوده و با نسخه نهایی تفاوت‌هایی داشته است.»

04
از 04
پاسخ رسمی متا درباره تقلب در بنچمارک Llama 4

شرکت متا در واکنش به این حواشی طی بیانیه‌ای اعلام کرد:

«این اتهامات به‌کلی نادرست‌ هستند. متا هرگز از داده‌های بنچمارک در آموزش مدل‌ها برای دست‌کاری نتایج استفاده نکرده است و نخواهد کرد.»

همچنین این شرکت با اشاره به تفاوت‌های اولیه در نسخه‌های عمومی و آزمایشی تصریح کرد که به‌ دلیل عرضه‌ سریع مدل‌ها، مدتی زمان لازم است تا تمامی نسخه‌های پیاده‌سازی‌شده در سرویس‌های مختلف، به‌ طور کامل بهینه‌سازی و هم‌راستا شوند.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

پنتاگون با شرکت Anthropic بر سر استفاده از هوش مصنوعی Cloud درگیر شد
اخبار هوش مصنوعی

پنتاگون با شرکت Anthropic بر سر استفاده از هوش مصنوعی Cloud درگیر شد

نوشته شده توسط سید محمد برازنده
27 بهمن 1404
بهترین پروتکل خانه هوشمند: Zigbee در برابر Z-Wave در برابر Wi-Fi
اینترنت و شبکه

بهترین پروتکل خانه هوشمند؛ مقایسه کامل Zigbee، Z-Wave و Wi-Fi

نوشته شده توسط علی‌رضا فاتح دلجویی
26 بهمن 1404
رمزگشایی کیوبیت‌های مایورانا با تکنیکی جدید
فناوری

رمزگشایی کیوبیت‌های مایورانا با تکنیکی جدید

نوشته شده توسط مانی
26 بهمن 1404
گوگل با حالت Deep Think در Gemini 3، هوش مصنوعی را وارد چاپ سه‌بعدی می‌ کند
اخبار هوش مصنوعی

گوگل با حالت Deep Think در Gemini 3، هوش مصنوعی را وارد چاپ سه‌بعدی می‌ کند

نوشته شده توسط مانی
26 بهمن 1404
ساخت ایمپلنت مغزی نرم با الهام از سازوکارهای اوریگامی در چین
فناوری

ساخت ایمپلنت مغزی نرم با الهام از سازوکارهای اوریگامی در چین

نوشته شده توسط مانی
26 بهمن 1404
خبر بعدی
رکورد بزرگ‌ترین توربین بادی جهان شکسته شد

رکورد بزرگ‌ترین توربین بادی جهان شکسته شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

پهپاد دست‌ساز یک یوتیوبر رکورد پرواز ۳.۵ ساعته را جابه‌جا کرد

پهپاد دست‌ساز یک یوتیوبر رکورد پرواز ۳.۵ ساعته را جابه‌جا کرد + ویدیو

25 بهمن 1404
متن جایگزین تصویر دوم: هواپیمای ترابری نظامی A400M ایرباس در حال پرواز از نمای زیرین، با چهار موتور توربوپراپ و طراحی مناسب برای مأموریت‌های چندمنظوره.

ایرباس از هواپیمای پهپادبر A400M رونمایی کرد

16 بهمن 1404

داغ‌ترین‌های روز

پوستر تبلیغاتی One UI 8.5 روی پس‌زمینه بنفش با تصویر یک گوشی هوشمند.

لیست سیاه سامسونگ لو رفت؛ محرومیت میلیون‌ها کاربر از به‌روزرسانی One UI 8.5

20 بهمن 1404 - به‌روزشده در 21 بهمن 1404

ایران کجای نقشه جهانی هوش مصنوعی ایستاده است؟

25 بهمن 1404
سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید

سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید + جدول مشخصات

25 بهمن 1404
وقفه عملیاتی شیائومی

شیائومی ترمز به‌روزرسانی‌ها را کشید؛ آپدیت HyperOS تا ۳ مارس متوقف شد

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
لوگوی سفید ویندوز ۱۱ در کنار یک ایموجی لبخند روی پس‌زمینه مشکی.

قابلیت جدید ویندوز ۱۱ برای پایان دست‌اندازی اپلیکیشن‌ها به تنظیمات سیستم

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

پنتاگون با شرکت Anthropic بر سر استفاده از هوش مصنوعی Cloud درگیر شد

پنتاگون با شرکت Anthropic بر سر استفاده از هوش مصنوعی Cloud درگیر شد

27 بهمن 1404
اپل مک‌بوک ارزان‌قیمت خود را ماه آینده معرفی می‌ کند

اپل مک‌بوک ارزان‌قیمت خود را ماه آینده معرفی می‌ کند

27 بهمن 1404
بهترین پروتکل خانه هوشمند: Zigbee در برابر Z-Wave در برابر Wi-Fi

بهترین پروتکل خانه هوشمند؛ مقایسه کامل Zigbee، Z-Wave و Wi-Fi

26 بهمن 1404
بررسی MSI Vector 16

نقد و بررسی MSI Vector 16 HX (A2XWIG): قدرت هوش مصنوعی در گیمینگ

26 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir