• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » سامسونگ از TRUEBench برای سنجش بهره‌وری هوش مصنوعی  پرده‌برداری کرد

سامسونگ از TRUEBench برای سنجش بهره‌وری هوش مصنوعی  پرده‌برداری کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 4 مهر 1404 - 22:15 - به‌روزشده در شنبه 5 مهر 1404 - 06:38
در اخبار هوش مصنوعی, فناوری
Samsung TRUEBench
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

TRUEBench سامسونگ با ۲,۴۸۵ سناریو در ده دسته و دوازده زبان، عملکرد واقعی مدل‌های هوش مصنوعی را در محیط کاری می‌سنجد.


به گزارش تک‌ناک، سامسونگ ابزار جدیدی به نام TRUEBench معرفی کرده است که با هدف ارزیابی توانایی سیستم‌های هوش مصنوعی در انجام وظایف واقعی محیط کار طراحی شده است، نه صرفاً آزمون‌های محدود و آکادمیک. این معیار سنجش شامل ۲,۴۸۵ سناریو در ده دسته و دوازده زبان مختلف می‌شود و همه‌چیز از درخواست‌های کوتاه تا پردازش اسناد طولانی را پوشش می‌دهد. سیستم امتیازدهی آن بسیار سخت‌گیرانه است؛ چرا‌که مدل‌ها باید تمام شرایط هر آزمون را برآورده کنند و همین امر نتایج را دشوارتر اما واقعی‌تر می‌سازد.

سال‌هاست که معیارهای هوش مصنوعی نتوانسته‌اند آنچه کاربران در عمل از این سیستم‌ها انتظار دارند، به‌درستی منعکس کنند. بیشتر آزمون‌ها همچنان بر پرسش و پاسخ‌های انگلیسی‌محور تمرکز دارند که هرچند مرتب به نظر می‌رسند، تنوع فعالیت‌های کاری روزمره را نشان نمی‌دهند. TRUEBench با نام کامل Trustworthy Real-world Usage Evaluation Benchmark پا را فراتر گذاشته و عملکرد مدل‌ها را در کارهایی همچون خلاصه‌سازی اسناد، ترجمه در دوازده زبان، تحلیل داده و اجرای دستورالعمل‌های چندمرحله‌ایمی‌سنجد که نیازمند حفظ بافت گفت‌وگو هستند.

نوت‌بوک‌چک می‌نویسد که سامسونگ برای این منظور مجموعه‌ای شامل ۲,۴۸۵ آزمون در ۱۰ دسته و ۴۶ زیرمجموعه توسعه داده است. ورودی‌ها از چند کاراکتر ساده تا بیش از بیست هزار کاراکتر متغیر هستند تا شرایطی شبیه فرمان‌های سریع یا گزارش‌های طولانی اداری را شبیه‌سازی کنند.

Samsung TRUEBench

برای قبولی در هر آزمون، مدل باید همه شرایط مشخص را برآورده کند. این روش «همه یا هیچ» نتایج را به واقعیت نزدیک‌تر می‌کند؛ چرا‌که خروجی فقط زمانی سودمند است که تمام نیازها را پاسخ دهد. سامسونگ این چهارچوب را با ترکیب بازبینی انسانی و بررسی هوش مصنوعی طراحی کرده است. ابتدا انسان‌ها شرایط اولیه را تعریف کردند و سپس هوش مصنوعی تناقض‌ها را مشخص کرد و در نهایت بازهم انسان‌ها اصلاحات را اعمال کردند تا سیستم نهایی شود. پس‌از آن، ارزیابی‌ها به‌صورت خودکار و در مقیاس وسیع اجرا شدند.

همچنین، سامسونگ مجموعه داده‌ها و جدول رتبه‌بندی و آمار خروجی را ازطریق Hugging Face به‌صورت عمومی منتشر کرده است. کاربران می‌توانند تا پنج مدل را به‌طور مستقیم مقایسه و نتایج را بررسی کنند. این سطح از شفافیت به توسعه‌دهندگان و پژوهشگران و کاربران امکان می‌دهد تا خودشان به‌جای اتکا به ادعاهای سامسونگ، کیفیت واقعی معیار را ارزیابی کنند.

بااین‌حال، TRUEBench بی‌نقص نیست. تعیین قوانین همواره با درجه‌ای از سوگیری همراه است و الزام به موفقیت کامل در هر شرط بدین‌معناست که پاسخ‌های جزئی، اما مفید نیز شکست تلقی می‌شوند. هرچند پشتیبانی از زبان‌ها گسترده‌تر از بسیاری از آزمون‌های موجود است، عملکرد در زبان‌هایی با داده آموزشی محدود متفاوت خواهد بود. همچنین، تمرکز این آزمون بیشتر بر وظایف عمومی کسب‌وکار است و حوزه‌های تخصصی مانند حقوق، پزشکی یا پژوهش‌های علمی را به‌طور کامل پوشش نمی‌دهد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

مدیرعامل انویدیا: هر دستگاه پردازش محلی به یک سیستم خودمختار تبدیل خواهد شد
اخبار هوش مصنوعی

مدیرعامل انویدیا: هر دستگاه پردازش محلی به یک سیستم خودمختار تبدیل خواهد شد

نوشته شده توسط نرگس چالوک
17 خرداد 1405
نمای نزدیک از یکی از ماهواره‌های منظومه راسوت در مدار زمین؛ پنل خورشیدی و تجهیزات ارتباطی ماهواره در حالی دیده می‌شوند که لبه آبی‌رنگ زمین در پس‌زمینه فضا قابل مشاهده است.
اینترنت و شبکه

روسیه با راسوت به جنگ اینترنت ماهواره‌ای استارلینک رفت

نوشته شده توسط نرگس چالوک
17 خرداد 1405
هوش مصنوعی لنوو
اخبار هوش مصنوعی

لنوو زیرساخت هوش مصنوعی جام جهانی ۲۰۲۶ را تامین می‌کند

نوشته شده توسط مانی
17 خرداد 1405
رقیب ChatGPT
اخبار هوش مصنوعی

۱۰ رقیب قدرتمند ChatGPT که باید در سال ۲۰۲۶ بشناسید

نوشته شده توسط مانی
17 خرداد 1405
سهمیه آدرس‌های موقت نسخه رایگان سرویس Firefox Relay افزایش یافت
اینترنت و شبکه

سهمیه آدرس‌های موقت نسخه رایگان سرویس Firefox Relay افزایش یافت

نوشته شده توسط سید محمد برازنده
17 خرداد 1405
خبر بعدی

کیبورد مکانیکی بی سیم وخودشارژ لنوو رونمایی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

روسیه از جنگنده دو سرنشینه سوخو-57D رونمایی کرد

روسیه از جنگنده دو سرنشینه سوخو-57D رونمایی کرد + تصویر

30 اردیبهشت 1405
چرا این برنامه باستانی هنوز از ویندوز ۱۱ حذف نشده است؟

چرا این برنامه باستانی هنوز از ویندوز ۱۱ حذف نشده است؟

26 اردیبهشت 1405

داغ‌ترین‌های روز

نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
آیفون 17 پرو مکس سفارشی کاویار با طراحی الهام‌گرفته از ساعت‌های نجومی لوکس در جعبه اختصاصی آبی‌رنگ.

آیفون ۱۷ پرومکس کاویار با محفظه اختصاصی ساعت سوئیسی رونمایی شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
جنگنده یوروفایتر Tranche 4 اسپانیا در باند فرودگاه

اسپانیا پیشرفته‌ترین جنگنده یوروفایتر خود را رونمایی کرد

13 خرداد 1405
تارا بهتر است یا دنا پلاس؟ مقایسه کامل مشخصات، مزایا، معایب و ارزش خرید

تارا بهتر است یا دنا پلاس؟ + مزایا، معایب و ارزش خرید

14 خرداد 1405 - به‌روزشده در 17 خرداد 1405
آئودی از قدرتمندترین خودروی تاریخ خود رونمایی کرد

آئودی از قدرتمندترین خودروی تاریخ خود رونمایی کرد + تصویر

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

مدیرعامل انویدیا: هر دستگاه پردازش محلی به یک سیستم خودمختار تبدیل خواهد شد

مدیرعامل انویدیا: هر دستگاه پردازش محلی به یک سیستم خودمختار تبدیل خواهد شد

17 خرداد 1405
نمای نزدیک از یکی از ماهواره‌های منظومه راسوت در مدار زمین؛ پنل خورشیدی و تجهیزات ارتباطی ماهواره در حالی دیده می‌شوند که لبه آبی‌رنگ زمین در پس‌زمینه فضا قابل مشاهده است.

روسیه با راسوت به جنگ اینترنت ماهواره‌ای استارلینک رفت

17 خرداد 1405
هوش مصنوعی لنوو

لنوو زیرساخت هوش مصنوعی جام جهانی ۲۰۲۶ را تامین می‌کند

17 خرداد 1405
گوشی Oppo Find X10 Ultra تنها پرچم‌دار با زوم ۱۰ برابری می شود

گوشی Oppo Find X10 Ultra تنها پرچم‌دار با زوم ۱۰ برابری می شود

17 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir