• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » سامسونگ از TRUEBench برای سنجش بهره‌وری هوش مصنوعی  پرده‌برداری کرد

سامسونگ از TRUEBench برای سنجش بهره‌وری هوش مصنوعی  پرده‌برداری کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 4 مهر 1404 - 22:15 - به‌روزشده در شنبه 5 مهر 1404 - 06:38
در اخبار هوش مصنوعی, فناوری
Samsung TRUEBench
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

TRUEBench سامسونگ با ۲,۴۸۵ سناریو در ده دسته و دوازده زبان، عملکرد واقعی مدل‌های هوش مصنوعی را در محیط کاری می‌سنجد.


به گزارش تک‌ناک، سامسونگ ابزار جدیدی به نام TRUEBench معرفی کرده است که با هدف ارزیابی توانایی سیستم‌های هوش مصنوعی در انجام وظایف واقعی محیط کار طراحی شده است، نه صرفاً آزمون‌های محدود و آکادمیک. این معیار سنجش شامل ۲,۴۸۵ سناریو در ده دسته و دوازده زبان مختلف می‌شود و همه‌چیز از درخواست‌های کوتاه تا پردازش اسناد طولانی را پوشش می‌دهد. سیستم امتیازدهی آن بسیار سخت‌گیرانه است؛ چرا‌که مدل‌ها باید تمام شرایط هر آزمون را برآورده کنند و همین امر نتایج را دشوارتر اما واقعی‌تر می‌سازد.

سال‌هاست که معیارهای هوش مصنوعی نتوانسته‌اند آنچه کاربران در عمل از این سیستم‌ها انتظار دارند، به‌درستی منعکس کنند. بیشتر آزمون‌ها همچنان بر پرسش و پاسخ‌های انگلیسی‌محور تمرکز دارند که هرچند مرتب به نظر می‌رسند، تنوع فعالیت‌های کاری روزمره را نشان نمی‌دهند. TRUEBench با نام کامل Trustworthy Real-world Usage Evaluation Benchmark پا را فراتر گذاشته و عملکرد مدل‌ها را در کارهایی همچون خلاصه‌سازی اسناد، ترجمه در دوازده زبان، تحلیل داده و اجرای دستورالعمل‌های چندمرحله‌ایمی‌سنجد که نیازمند حفظ بافت گفت‌وگو هستند.

نوت‌بوک‌چک می‌نویسد که سامسونگ برای این منظور مجموعه‌ای شامل ۲,۴۸۵ آزمون در ۱۰ دسته و ۴۶ زیرمجموعه توسعه داده است. ورودی‌ها از چند کاراکتر ساده تا بیش از بیست هزار کاراکتر متغیر هستند تا شرایطی شبیه فرمان‌های سریع یا گزارش‌های طولانی اداری را شبیه‌سازی کنند.

Samsung TRUEBench

برای قبولی در هر آزمون، مدل باید همه شرایط مشخص را برآورده کند. این روش «همه یا هیچ» نتایج را به واقعیت نزدیک‌تر می‌کند؛ چرا‌که خروجی فقط زمانی سودمند است که تمام نیازها را پاسخ دهد. سامسونگ این چهارچوب را با ترکیب بازبینی انسانی و بررسی هوش مصنوعی طراحی کرده است. ابتدا انسان‌ها شرایط اولیه را تعریف کردند و سپس هوش مصنوعی تناقض‌ها را مشخص کرد و در نهایت بازهم انسان‌ها اصلاحات را اعمال کردند تا سیستم نهایی شود. پس‌از آن، ارزیابی‌ها به‌صورت خودکار و در مقیاس وسیع اجرا شدند.

همچنین، سامسونگ مجموعه داده‌ها و جدول رتبه‌بندی و آمار خروجی را ازطریق Hugging Face به‌صورت عمومی منتشر کرده است. کاربران می‌توانند تا پنج مدل را به‌طور مستقیم مقایسه و نتایج را بررسی کنند. این سطح از شفافیت به توسعه‌دهندگان و پژوهشگران و کاربران امکان می‌دهد تا خودشان به‌جای اتکا به ادعاهای سامسونگ، کیفیت واقعی معیار را ارزیابی کنند.

بااین‌حال، TRUEBench بی‌نقص نیست. تعیین قوانین همواره با درجه‌ای از سوگیری همراه است و الزام به موفقیت کامل در هر شرط بدین‌معناست که پاسخ‌های جزئی، اما مفید نیز شکست تلقی می‌شوند. هرچند پشتیبانی از زبان‌ها گسترده‌تر از بسیاری از آزمون‌های موجود است، عملکرد در زبان‌هایی با داده آموزشی محدود متفاوت خواهد بود. همچنین، تمرکز این آزمون بیشتر بر وظایف عمومی کسب‌وکار است و حوزه‌های تخصصی مانند حقوق، پزشکی یا پژوهش‌های علمی را به‌طور کامل پوشش نمی‌دهد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

یک مرکز داده (Data Center) تاریک و آینده‌نگر، با نمایشگر هولوگرافیک که تاریخ "2038-01-19" و یک جمجمه و استخوان را نمایش می‌دهد، که نمادی از باگ Y2K38 است.
امنیت سایبری

خطر پنهان Y2K38؛ هکرها زمان را دستکاری می‌کنند

نوشته شده توسط اسما کلهر
23 آبان 1404
نمای بیرونی یک ساختمان با آجرکاری تیره که لوگوی رنگارنگ Google بر روی آن نصب شده است.
فناوری

دادگاه آلمان گوگل را به پرداخت ۵۷۲ میلیون یورو محکوم کرد

نوشته شده توسط اسما کلهر
23 آبان 1404
یک هکر کلاه‌دار در محیطی تاریک که در حال تایپ بر روی صفحه‌کلید است و در سمت راست او یک شبکه داده سه‌بعدی نورانی با نمادهای قفل و اعداد وجود دارد.
امنیت سایبری

اولین حمله سایبری هدایت‌شده با هوش مصنوعی توسط آنتروپیک خنثی شد

نوشته شده توسط اسما کلهر
23 آبان 1404
ورودی ساختمان Baidu با پله‌های چوبی، گیت‌های ورودی و لوگوی قرمز و آبی بزرگ Baidu روی دیوار، در حالی که یک کارمند در پیش‌زمینه در حال راه رفتن است.
اخبار هوش مصنوعی

بایدو از پردازنده‌های هوش مصنوعی M100 و M300 پرده‌برداری کرد

نوشته شده توسط اسما کلهر
23 آبان 1404
پوستری تبلیغاتی از دوربین اکشن DJI Osmo Action 6 که مقاومت این دستگاه را در سرما نشان می‌دهد
دوربین دیجیتال

دوربین DJI Osmo Action 6 با سنسور بزرگ‌تر معرفی شد

نوشته شده توسط تارخ ترهنده
23 آبان 1404
خبر بعدی

کیبورد مکانیکی بی سیم وخودشارژ لنوو رونمایی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

امسال مدل GPT-6 عرضه نمی‌ شود

مدل هوش‌مصنوعی GPT-6 امسال عرضه نمی‌ شود

27 مهر 1404
Nuu-B40-5G-dual-screen-smartphone

Nuu B40 با دو نمایشگر عرضه شد؛ رقیب ارزان‌قیمت شیائومی ۱۷

26 مهر 1404 - به‌روزشده در 27 مهر 1404

داغ‌ترین‌های روز

پیش‌بینی قیمت ریپل (XRP) پس از راه‌اندازی صندوق ETF شرکت کنری کپیتال

پیش‌بینی قیمت ریپل (XRP) پس از راه‌اندازی صندوق ETF شرکت کنری کپیتال

21 آبان 1404
کارشناسان: ریپل (XRP) جای طلا را در چرخه مالی بعدی می‌ گیرد

کارشناسان: ریپل (XRP) جای طلا را در چرخه مالی بعدی می‌ گیرد

22 آبان 1404
Realme C85 Pro and C85 5G

ریلمی C85 پرو و ​​C85 5G با باتری‌های ۷۰۰۰ میلی‌آمپر ساعتی معرفی شد

12 آبان 1404 - به‌روزشده در 13 آبان 1404
پس‌زمینه انتزاعی با گرادیانت محو و رنگارنگ (صورتی، نارنجی، آبی روشن) با متن سفید "GPT-5.1" در سمت چپ و "OpenAI" در سمت راست.

شرکت OepnAI ازمدل هوش مصنوعی GPT-5.1  رونمایی کرد

22 آبان 1404
دوربین دید در شب گوشی Oukitel WP60 در تاریکی مطلق عکاسی می‌ کند

دوربین دید در شب گوشی Oukitel WP60 در تاریکی مطلق عکاسی می‌ کند + تصویر

21 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

دو کارت گرافیک (GPU) که به صورت مورب کنار هم قرار گرفته‌اند؛ یکی کارت NVIDIA GeForce RTX (با طراحی فن Founders Edition) و دیگری کارت AMD Radeon با سه فن، که هر دو روی پس‌زمینه‌ای با رنگ‌های سبز و قرمز قرار دارند.

افزایش قیمت کارت‌های گرافیک انویدیا و AMD به‌دلیل افزایش هزینه‌های DRAM

23 آبان 1404
یک مرکز داده (Data Center) تاریک و آینده‌نگر، با نمایشگر هولوگرافیک که تاریخ "2038-01-19" و یک جمجمه و استخوان را نمایش می‌دهد، که نمادی از باگ Y2K38 است.

خطر پنهان Y2K38؛ هکرها زمان را دستکاری می‌کنند

23 آبان 1404
اسلاید تبلیغاتی مادربرد MSI PRO B840M-P EVO WIFI6E PZ، که ویژگی‌هایی مانند "64MB BIOS" و "READY FOR AI PC" را برجسته می‌کند.

مادربرد جدید MSI B840 با کانکتورهای پشتی رونمایی شد

23 آبان 1404
ردیف‌هایی از واحدهای بزرگ ذخیره‌سازی باتری Tesla Megapack سفید رنگ با فن‌های خنک‌کننده در بالا، که در یک سایت خاکی در فضای باز قرار دارند.

راه‌حل جدید تسلا برای حل بحران مصرف برق مراکز داده هوش مصنوعی

23 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir