• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » نقد و بررسی » قطعات کامپیوتر » نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
سه شنبه 21 شهریور 1402 - 15:38
در قطعات کامپیوتر, نقد و بررسی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت انویدیا می‌گوید نرم‌افزار تازه‌ای به نام TensorRT-LL که به صورت منبع باز عرضه شده است، قادر است به طور چشمگیری عملکرد مدل‌های زبانی بزرگ (LLM) را بر روی GPU‌ها افزایش دهد.

به گزارش تکناک، طبق ادعای این شرکت، قابلیت‌های TensorRT-LL اجازه می‌دهد تا عملکرد GPU محاسباتی H100 را در مدل GPT-J LLM با شش میلیارد پارامتر به دو برابر افزایش دهد. مهمترین نکته این است که این نرم‌افزار قادر است این بهبود عملکرد را بدون نیاز به آموزش مجدد مدل فراهم کند.

شرکت انویدیا  TensorRT-LLM را به طور خاص برای افزایش سرعت عملکرد استنتاج مدل‌های زبانی بزرگ توسعه داده است و گرافیک‌های عملکرد ارائه شده توسط NVIDIA در واقع نشان می‌دهند که بهبود سرعت H100 آن به دلیل بهینه‌سازی‌های نرم‌افزاری مناسب دو برابر شده است.

یکی از ویژگی های برجسته TensorRT-LLM انویدیا، تکنیک نوآورانه دسته بندی در پرواز است. این روش به بارهای کاری‌ پویا و متنوع مدل‌های زبانی بزرگ پاسخ می‌دهد که می‌توانند در درخواست‌های محاسباتی خود با اختلاف زیادی مواجه شوند.

دسته‌بندی در حال پرواز (In-flight batching) بهینه‌سازی برنامه‌ریزی این بارهای کاری‌ را به حداکثر اندازه ممکن استفاده از منابع GPU تضمین می‌کند. به عبارتی دیگر، این روش باعث افزایش دو برابر در ظرفیت تولید درخواست‌های واقعی مدل‌های زبانی بزرگ بر روی GPU‌ های Tensor Core H100 می‌شود و در نتیجه، فرآیندهای استنتاج هوش مصنوعی سریعتر و کارآمدتری را ارائه می‌دهد.

شرکت NVIDIA می‌گوید که TensorRT-LLM خود را با یک کامپایلر یادگیری عمیق همراه با هسته‌های بهینه‌سازی، مراحل پیش‌پردازش و پس‌پردازش و اجزای ارتباطی چند-GPU/چند-نود یکپارچه کرده است، تضمین می‌کند که این اجزا به طور مؤثرتری روی GPU‌های خود اجرا شوند.

این یکپارچگی به وسیله یک API پایتون مدولار تکمیل شده است که رابطی مطلوب برای توسعه‌دهندگان فراهم می‌کند تا قابلیت‌های نرم‌افزار و سخت‌افزار را بدون نیاز به آشنایی عمیق با زبان‌های برنامه‌نویسی پیچیده افزایش دهند. به عنوان مثال، MosaicML ویژگی‌های خاصی را که نیاز داشت را به TensorRT-LLM اضافه کرده است و آن‌ها را به صورت سازگار در سرویس استنتاج خود یکپارچه سازی کرده است.

“Naveen Rao، معاون رئیس دپارتمان مهندسی در Databricks، می‌گوید: ‘TensorRT-LLM در استفاده آسان است، دارای ویژگی‌های فراوانی از جمله استریمینگ توکن‌ها، دسته‌بندی در حال پرواز، paged-attention

، کوانتیزاسیون و غیره، و کارآمد است. این نرم‌افزار عملکرد برتری را برای سرویس دهی LLM با استفاده از GPU‌های NVIDIA ارائه می‌دهد و به ما امکان می‌دهد تا صرفه جویی در هزینه‌ها را برای مشتریان خود فراهم کنیم.'”

عملکرد GPU H100 از Nvidia هنگام استفاده از TensorRT-LLM بسیار تاثیرگذار است. در معماری Hopper از Nvidia، GPU H100 هنگام استفاده از TensorRT-LLM، عملکردی با ضریب هشت برابر نسبت به GPU A100 ارائه می‌دهد. علاوه بر این، در آزمایش مدل Llama 2 توسعه داده شده توسط متا، TensorRT-LLM نسبت به GPU‌های A100، عملکرد استنتاج را با شتاب 4.6 برابر افزایش داد. این ارقام بر پتانسیل تحول آفرین نرم افزار در حوزه هوش مصنوعی و یادگیری ماشین تاکید می کند.

در نهایت، GPU‌های H100 هنگام استفاده از TensorRT-LLM، فرمت FP8 را پشتیبانی می‌کنند. این قابلیت امکان کاهش مصرف حافظه را بدون کاهش دقت مدل فراهم می کند، که برای شرکت‌ها و سازمان‌هایی که بودجه و/یا فضای دیتاسنتر محدود دارند و نمی‌توانند تعداد سرور کافی را برای تنظیم LLM‌های خود نصب کنند، مفید است.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

حلقه هوشمند Reebok Smart Ring با قابلیت سنجش خواب و استرس عرضه شد
گجت

حلقه هوشمند Reebok Smart Ring با قابلیت سنجش خواب و استرس عرضه شد + تصویر

نوشته شده توسط نرگس چالوک
30 مهر 1404 - به‌روزشده در 1 آبان 1404
I-built-the-worlds-smallest-FPV-drone
گجت

ساخت کوچک‌ترین پهپاد FPV جهان توسط یوتیوبر معروف

نوشته شده توسط اسما کلهر
29 مهر 1404
بررسی موبایل و تبلت

ویوو X300 با دوربین ۲۰۰ مگاپیکسلی زایس، رقیب سرسخت S25 اولترا

نوشته شده توسط مانی
29 مهر 1404 - به‌روزشده در 30 مهر 1404
رونمایی HyperSpace Trackpad Pro
گجت

هایپراسپیس ۱۵۰ دلاری جایگزین مجیک ترک‌پد اپل برای کاربران ویندوز است

نوشته شده توسط امیرحسین یونس
28 مهر 1404
بهترین اپلیکیشن های خبرخوان
پیشنهاد سردبیر

بهترین اپلیکیشن های خبرخوان برای اندروید و iOS در سال ۲۰۲۵

نوشته شده توسط مهدی کریمی صمدی
27 مهر 1404 - به‌روزشده در 28 مهر 1404
خبر بعدی

رونمایی از یک مشکل جدید در بازی Starfield

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

جنجال تازه میان OpenAI، گوگل و متا بر سر دستاوردهای ریاضی مدل GPT-5

جنجال تازه میان OpenAI، گوگل و متا بر سر دستاوردهای ریاضی مدل GPT-5

28 مهر 1404
هادی چوپان نایب قهرمان مسترالمپیا 2025 شد

هادی چوپان نایب قهرمان مسترالمپیا ۲۰۲۵ شد

20 مهر 1404

داغ‌ترین‌های روز

Xiaomi 17 Pro most durable smartphone display

شیائومی بادوام‌ترین نمایشگر گوشی جهان را ساخت

30 مهر 1404 - به‌روزشده در 3 آبان 1404
شیائومی به‌روزرسانی امنیتی جدیدی را برای بیش از ۲۰ گوشی ردمی و پوکو منتشر کرد

به‌روزرسانی امنیتی جدید شیائومی برای بیش از ۲۰ گوشی ردمی و پوکو منتشر شد

29 مهر 1404
مقایسه گلکسی S25 FE با S24 FE

مقایسه گلکسی S25 FE با S24 FE؛ ارتقا واقعی یا تکرار هوشمندانه؟

27 مهر 1404 - به‌روزشده در 1 آبان 1404
جهش احتمالی قیمت ریپل (XRP)؛ نشانه‌های تکنیکال از صعودی قریب‌الوقوع خبر می‌دهند

جهش احتمالی قیمت ریپل (XRP)؛ نشانه‌های تکنیکال از صعودی قریب‌الوقوع خبر می‌دهند

3 آبان 1404
شرکت Kospet ساعت هوشمند و مقاوم TANK T4 را معرفی کرد

شرکت Kospet ساعت هوشمند و مقاوم TANK T4 را معرفی کرد

27 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

Xiaomi 17 series sets 2 million activation

فروش شیائومی ۱۷ در کمتر از یک ماه از مرز ۲ میلیون دستگاه گذشت

3 آبان 1404
Microsoft-Copilot-Mico

تجهیز گلکسی بوکز به یک شخصیت هوش مصنوعی؛ با او صحبت کنید

3 آبان 1404
شیائومی P25 و P25A

شیائومی دو گوشی اقتصادی با تراشه‌ یونی‌ساک عرضه می‌کند

3 آبان 1404
مینی پی‌سی xFusion

مینی پی‌سی FusionX Spark با پردازنده GB10 انویدیا رونمایی شد

3 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir