• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » سامسونگ از TRUEBench برای سنجش بهره‌وری هوش مصنوعی  پرده‌برداری کرد

سامسونگ از TRUEBench برای سنجش بهره‌وری هوش مصنوعی  پرده‌برداری کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 4 مهر 1404 - 22:15 - به‌روزشده در شنبه 5 مهر 1404 - 06:38
در اخبار هوش مصنوعی, فناوری
Samsung TRUEBench
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

TRUEBench سامسونگ با ۲,۴۸۵ سناریو در ده دسته و دوازده زبان، عملکرد واقعی مدل‌های هوش مصنوعی را در محیط کاری می‌سنجد.


به گزارش تک‌ناک، سامسونگ ابزار جدیدی به نام TRUEBench معرفی کرده است که با هدف ارزیابی توانایی سیستم‌های هوش مصنوعی در انجام وظایف واقعی محیط کار طراحی شده است، نه صرفاً آزمون‌های محدود و آکادمیک. این معیار سنجش شامل ۲,۴۸۵ سناریو در ده دسته و دوازده زبان مختلف می‌شود و همه‌چیز از درخواست‌های کوتاه تا پردازش اسناد طولانی را پوشش می‌دهد. سیستم امتیازدهی آن بسیار سخت‌گیرانه است؛ چرا‌که مدل‌ها باید تمام شرایط هر آزمون را برآورده کنند و همین امر نتایج را دشوارتر اما واقعی‌تر می‌سازد.

سال‌هاست که معیارهای هوش مصنوعی نتوانسته‌اند آنچه کاربران در عمل از این سیستم‌ها انتظار دارند، به‌درستی منعکس کنند. بیشتر آزمون‌ها همچنان بر پرسش و پاسخ‌های انگلیسی‌محور تمرکز دارند که هرچند مرتب به نظر می‌رسند، تنوع فعالیت‌های کاری روزمره را نشان نمی‌دهند. TRUEBench با نام کامل Trustworthy Real-world Usage Evaluation Benchmark پا را فراتر گذاشته و عملکرد مدل‌ها را در کارهایی همچون خلاصه‌سازی اسناد، ترجمه در دوازده زبان، تحلیل داده و اجرای دستورالعمل‌های چندمرحله‌ایمی‌سنجد که نیازمند حفظ بافت گفت‌وگو هستند.

نوت‌بوک‌چک می‌نویسد که سامسونگ برای این منظور مجموعه‌ای شامل ۲,۴۸۵ آزمون در ۱۰ دسته و ۴۶ زیرمجموعه توسعه داده است. ورودی‌ها از چند کاراکتر ساده تا بیش از بیست هزار کاراکتر متغیر هستند تا شرایطی شبیه فرمان‌های سریع یا گزارش‌های طولانی اداری را شبیه‌سازی کنند.

Samsung TRUEBench

برای قبولی در هر آزمون، مدل باید همه شرایط مشخص را برآورده کند. این روش «همه یا هیچ» نتایج را به واقعیت نزدیک‌تر می‌کند؛ چرا‌که خروجی فقط زمانی سودمند است که تمام نیازها را پاسخ دهد. سامسونگ این چهارچوب را با ترکیب بازبینی انسانی و بررسی هوش مصنوعی طراحی کرده است. ابتدا انسان‌ها شرایط اولیه را تعریف کردند و سپس هوش مصنوعی تناقض‌ها را مشخص کرد و در نهایت بازهم انسان‌ها اصلاحات را اعمال کردند تا سیستم نهایی شود. پس‌از آن، ارزیابی‌ها به‌صورت خودکار و در مقیاس وسیع اجرا شدند.

همچنین، سامسونگ مجموعه داده‌ها و جدول رتبه‌بندی و آمار خروجی را ازطریق Hugging Face به‌صورت عمومی منتشر کرده است. کاربران می‌توانند تا پنج مدل را به‌طور مستقیم مقایسه و نتایج را بررسی کنند. این سطح از شفافیت به توسعه‌دهندگان و پژوهشگران و کاربران امکان می‌دهد تا خودشان به‌جای اتکا به ادعاهای سامسونگ، کیفیت واقعی معیار را ارزیابی کنند.

بااین‌حال، TRUEBench بی‌نقص نیست. تعیین قوانین همواره با درجه‌ای از سوگیری همراه است و الزام به موفقیت کامل در هر شرط بدین‌معناست که پاسخ‌های جزئی، اما مفید نیز شکست تلقی می‌شوند. هرچند پشتیبانی از زبان‌ها گسترده‌تر از بسیاری از آزمون‌های موجود است، عملکرد در زبان‌هایی با داده آموزشی محدود متفاوت خواهد بود. همچنین، تمرکز این آزمون بیشتر بر وظایف عمومی کسب‌وکار است و حوزه‌های تخصصی مانند حقوق، پزشکی یا پژوهش‌های علمی را به‌طور کامل پوشش نمی‌دهد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

خرابکاری کابل زیردریایی دریای بالتیک
فناوری

تنش در دریای بالتیک؛ عملیات ویژه فنلاند برای توقیف کشتی متهم به قطع کابل زیردریایی

نوشته شده توسط اسما کلهر
10 دی 1404
تصویر ترکیبی از چهره ایلان ماسک و یک گوشی هوشمند که لوگوی Grok AI را نمایش می‌دهد.
فناوری

سودای سلطه بر هوش مصنوعی؛ ایلان ماسک ظرفیت محاسباتی xAI را به ۲ گیگاوات می‌رساند

نوشته شده توسط اسما کلهر
10 دی 1404
تصویر گرافیکی از یک ماهواره با پنل‌های خورشیدی صلیبی شکل در فضای تاریک.
فناوری

انقلاب در صنعت نیمه‌رسانا؛ کوره ۱,۰۰۰ درجه‌ای بریتانیا در فضا با موفقیت روشن شد

نوشته شده توسط اسما کلهر
10 دی 1404
لوگوی نورانی آبی‌رنگ شرکت بایت‌دنس (ByteDance) بر روی نمای ساختمان در شب با پس‌زمینه آسمان‌خراش‌ها.
اخبار هوش مصنوعی

قمار ۱۴ میلیارد دلاری بایت‌دنس در بازار هوش مصنوعی؛ تیک‌تاک زرادخانه تراشه‌های انویدیا را تقویت می‌کند

نوشته شده توسط امیرحسین یونس
10 دی 1404
تصویری ترکیبی از خط افق شهر نیویورک در شب که با لایه‌ای از بردهای الکترونیکی و قطعات سخت‌افزاری کامپیوتری پوشانده شده است.
فناوری

تدابیر امنیتی بحث‌برانگیز در نیویورک؛ رزبری پای و فلیپر زیرو در فهرست اقلام ممنوعه مراسم تحلیف

نوشته شده توسط امیرحسین یونس
10 دی 1404
خبر بعدی

کیبورد مکانیکی بی سیم وخودشارژ لنوو رونمایی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بیت کوین

چه عاملی باعث سقوط قیمت بیت‌کوین به زیر ۹۰ هزار دلار شد؟

16 آذر 1404
اعمال محدودیت های جدید در اینستاگرام

محدودیت جدید اینستاگرام: سقف سه هشتگ برای هر پست

11 آذر 1404

داغ‌ترین‌های روز

بهترین دوربین عکاسی ۲۰۲۵ ؛ راهنمای جامع انتخاب و خرید دوربین عکاسی

7 دی 1404

بهترین پرامپت‌های حرفه‌ای برای ساخت لوگو با هوش مصنوعی 

7 دی 1404
لوگوی عدد ۳ بزرگ سفید روی پس‌زمینه انتزاعی آبی و نارنجی با متن Xiaomi HyperOS.

جانی دوباره در رگ‌های محصولات قدیمی؛ آغاز انتشار HyperOS 3 شیائومی برپایه اندروید ۱۵

10 دی 1404
نمای پشت گوشی Honor Power 2 در سه رنگ نارنجی، سفید و مشکی، با بدنه تخت، ماژول دوربین مستطیلی با سه لنز بزرگ و طراحی الهام‌گرفته از پرچم‌داران مدرن، تمرکز بر تنوع رنگ و هویت بصری محصول

این گوشی کپی برابر اصل آیفون ۱۷ پرو است

5 دی 1404 - به‌روزشده در 7 دی 1404
بهترین گوشی موبایل بازار ایران

بهترین گوشی‌های بازار ایران در دی‌ماه ۱۴۰۴+ راهنمای جامع خرید

7 دی 1404 - به‌روزشده در 8 دی 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمای استودیویی ایستگاه شارژ Xiaomi 140W GaN با بدنه مشکی، چهار پورت USB در پنل جلو و کابل برق متصل

شیائومی از ایستگاه شارژ ۱۴۰ واتی جدید رونمایی کرد

10 دی 1404
دو گوشی از سری iQOO Neo 11 در رنگ‌های بژ و نارنجی با ماژول دوربین مربعی و طراحی بدنه مدرن

گوشی‌های iQOO با باتری‌های غول‌پیکر عرضه می شوند

10 دی 1404
رندر گرافیکی تراشه Qualcomm Snapdragon 8 Elite Gen 6 با طراحی طلایی، قرارگرفته روی برد مدار چاپی با نورپردازی دیجیتال

به‌ این دلیل گوشی‌های رده بالا سراغ Snapdragon 8 Elite Gen 6 Pro می‌روند

10 دی 1404
خرابکاری کابل زیردریایی دریای بالتیک

تنش در دریای بالتیک؛ عملیات ویژه فنلاند برای توقیف کشتی متهم به قطع کابل زیردریایی

10 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir