• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » نقد و بررسی » قطعات کامپیوتر » نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
سه‌شنبه 21 شهریور 1402 - 15:38
در قطعات کامپیوتر, نقد و بررسی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت انویدیا می‌گوید نرم‌افزار تازه‌ای به نام TensorRT-LL که به صورت منبع باز عرضه شده است، قادر است به طور چشمگیری عملکرد مدل‌های زبانی بزرگ (LLM) را بر روی GPU‌ها افزایش دهد.

به گزارش تکناک، طبق ادعای این شرکت، قابلیت‌های TensorRT-LL اجازه می‌دهد تا عملکرد GPU محاسباتی H100 را در مدل GPT-J LLM با شش میلیارد پارامتر به دو برابر افزایش دهد. مهمترین نکته این است که این نرم‌افزار قادر است این بهبود عملکرد را بدون نیاز به آموزش مجدد مدل فراهم کند.

شرکت انویدیا  TensorRT-LLM را به طور خاص برای افزایش سرعت عملکرد استنتاج مدل‌های زبانی بزرگ توسعه داده است و گرافیک‌های عملکرد ارائه شده توسط NVIDIA در واقع نشان می‌دهند که بهبود سرعت H100 آن به دلیل بهینه‌سازی‌های نرم‌افزاری مناسب دو برابر شده است.

یکی از ویژگی های برجسته TensorRT-LLM انویدیا، تکنیک نوآورانه دسته بندی در پرواز است. این روش به بارهای کاری‌ پویا و متنوع مدل‌های زبانی بزرگ پاسخ می‌دهد که می‌توانند در درخواست‌های محاسباتی خود با اختلاف زیادی مواجه شوند.

دسته‌بندی در حال پرواز (In-flight batching) بهینه‌سازی برنامه‌ریزی این بارهای کاری‌ را به حداکثر اندازه ممکن استفاده از منابع GPU تضمین می‌کند. به عبارتی دیگر، این روش باعث افزایش دو برابر در ظرفیت تولید درخواست‌های واقعی مدل‌های زبانی بزرگ بر روی GPU‌ های Tensor Core H100 می‌شود و در نتیجه، فرآیندهای استنتاج هوش مصنوعی سریعتر و کارآمدتری را ارائه می‌دهد.

شرکت NVIDIA می‌گوید که TensorRT-LLM خود را با یک کامپایلر یادگیری عمیق همراه با هسته‌های بهینه‌سازی، مراحل پیش‌پردازش و پس‌پردازش و اجزای ارتباطی چند-GPU/چند-نود یکپارچه کرده است، تضمین می‌کند که این اجزا به طور مؤثرتری روی GPU‌های خود اجرا شوند.

این یکپارچگی به وسیله یک API پایتون مدولار تکمیل شده است که رابطی مطلوب برای توسعه‌دهندگان فراهم می‌کند تا قابلیت‌های نرم‌افزار و سخت‌افزار را بدون نیاز به آشنایی عمیق با زبان‌های برنامه‌نویسی پیچیده افزایش دهند. به عنوان مثال، MosaicML ویژگی‌های خاصی را که نیاز داشت را به TensorRT-LLM اضافه کرده است و آن‌ها را به صورت سازگار در سرویس استنتاج خود یکپارچه سازی کرده است.

“Naveen Rao، معاون رئیس دپارتمان مهندسی در Databricks، می‌گوید: ‘TensorRT-LLM در استفاده آسان است، دارای ویژگی‌های فراوانی از جمله استریمینگ توکن‌ها، دسته‌بندی در حال پرواز، paged-attention

، کوانتیزاسیون و غیره، و کارآمد است. این نرم‌افزار عملکرد برتری را برای سرویس دهی LLM با استفاده از GPU‌های NVIDIA ارائه می‌دهد و به ما امکان می‌دهد تا صرفه جویی در هزینه‌ها را برای مشتریان خود فراهم کنیم.'”

عملکرد GPU H100 از Nvidia هنگام استفاده از TensorRT-LLM بسیار تاثیرگذار است. در معماری Hopper از Nvidia، GPU H100 هنگام استفاده از TensorRT-LLM، عملکردی با ضریب هشت برابر نسبت به GPU A100 ارائه می‌دهد. علاوه بر این، در آزمایش مدل Llama 2 توسعه داده شده توسط متا، TensorRT-LLM نسبت به GPU‌های A100، عملکرد استنتاج را با شتاب 4.6 برابر افزایش داد. این ارقام بر پتانسیل تحول آفرین نرم افزار در حوزه هوش مصنوعی و یادگیری ماشین تاکید می کند.

در نهایت، GPU‌های H100 هنگام استفاده از TensorRT-LLM، فرمت FP8 را پشتیبانی می‌کنند. این قابلیت امکان کاهش مصرف حافظه را بدون کاهش دقت مدل فراهم می کند، که برای شرکت‌ها و سازمان‌هایی که بودجه و/یا فضای دیتاسنتر محدود دارند و نمی‌توانند تعداد سرور کافی را برای تنظیم LLM‌های خود نصب کنند، مفید است.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

این ضبط صوت هوشمند، گفتار را به متن تبدیل می کند
گجت

این ضبط صوت هوشمند، گفتار را به متن تبدیل می کند

نوشته شده توسط سید محمد برازنده
31 خرداد 1405
اولتراهیومن از پلتفرم M2 Live رونمایی کرد
گجت

این دستگاه دائما قند خون شما را زیرنظر دارد

نوشته شده توسط سید محمد برازنده
31 خرداد 1405
کنترلر استیم با ابزاری جدید به یک ماشین کنترلی تبدیل می شود
کنسول بازی

کنترلر استیم با ابزاری جدید به یک ماشین کنترلی تبدیل می شود

نوشته شده توسط تارخ ترهنده
31 خرداد 1405
تلویزیون هوشمند یا اندروید باکس؛ بهترین انتخاب برای ارتقای سیستم سرگرمی خانگی
پیشنهاد سردبیر

تلویزیون هوشمند یا اندروید باکس؛ بهترین انتخاب برای ارتقای سیستم سرگرمی خانگی

نوشته شده توسط فاطمه امامی
29 خرداد 1405
مقایسه گلکسی A57 با گلکسی S25 FE
بررسی موبایل و تبلت

گلکسی A57 یا گلکسی S25 FE؛ کدام گوشی سامسونگ ارزش خرید بیشتری دارد؟

نوشته شده توسط مهدی کریمی صمدی
29 خرداد 1405
خبر بعدی

رونمایی از یک مشکل جدید در بازی Starfield

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آیفون ۲۰ با طراحی متفاوت رونمایی می‌ شود

آیفون ۲۰ با طراحی متفاوت رونمایی می‌ شود

3 خرداد 1405
اپل مدل هوش مصنوعی بی نیاز از اینترنت را راه‌اندازی می کند

اپل مدل هوش مصنوعی بی نیاز از اینترنت راه‌اندازی می کند

9 خرداد 1405

داغ‌ترین‌های روز

پیشرفته‌ترین هواپیماهای بدون سرنشین رزمی جهان در سال ۲۰۲۶؛ معرفی ۶ پهپاد نظامی برتر دنیا

با ۶ پهپاد نظامی برتر و پیشرفته دنیا آشنا شوید

29 خرداد 1405
سامانه لیزری ضدپهپاد Lijian ساخت چین در نمایشگاه دفاعی ۲۰۲۶؛ مجهز به حسگرهای اپتیکی و سامانه رهگیری اهداف هوایی.

سلاح لیزری ضدپهپاد قابل‌حمل چین رونمایی شد

31 خرداد 1405
مقایسه گلکسی A57 با گلکسی S25 FE

گلکسی A57 یا گلکسی S25 FE؛ کدام گوشی سامسونگ ارزش خرید بیشتری دارد؟

29 خرداد 1405
راهنمای تنظیمات مودم

راهنمای جامع تنظیم مودم ADSL، VDSL، TD-LTE و فیبر نوری

29 خرداد 1405
مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بزرگ‌ترین مزرعه شناور پرورش ماهی چین به آب انداخته شد

بزرگ‌ترین مزرعه شناور پرورش ماهی چین به آب انداخته شد

31 خرداد 1405
سامانه لیزری ضدپهپاد Lijian ساخت چین در نمایشگاه دفاعی ۲۰۲۶؛ مجهز به حسگرهای اپتیکی و سامانه رهگیری اهداف هوایی.

سلاح لیزری ضدپهپاد قابل‌حمل چین رونمایی شد

31 خرداد 1405
گلکسی M47 5G، جدیدترین میان رده سامسونگ به بازار می آید

گلکسی M47 5G، جدیدترین میان رده سامسونگ به بازار می آید

31 خرداد 1405
این ضبط صوت هوشمند، گفتار را به متن تبدیل می کند

این ضبط صوت هوشمند، گفتار را به متن تبدیل می کند

31 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir