• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » نقد و بررسی » قطعات کامپیوتر » نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
سه شنبه 21 شهریور 1402 - 15:38
در قطعات کامپیوتر, نقد و بررسی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت انویدیا می‌گوید نرم‌افزار تازه‌ای به نام TensorRT-LL که به صورت منبع باز عرضه شده است، قادر است به طور چشمگیری عملکرد مدل‌های زبانی بزرگ (LLM) را بر روی GPU‌ها افزایش دهد.

به گزارش تکناک، طبق ادعای این شرکت، قابلیت‌های TensorRT-LL اجازه می‌دهد تا عملکرد GPU محاسباتی H100 را در مدل GPT-J LLM با شش میلیارد پارامتر به دو برابر افزایش دهد. مهمترین نکته این است که این نرم‌افزار قادر است این بهبود عملکرد را بدون نیاز به آموزش مجدد مدل فراهم کند.

شرکت انویدیا  TensorRT-LLM را به طور خاص برای افزایش سرعت عملکرد استنتاج مدل‌های زبانی بزرگ توسعه داده است و گرافیک‌های عملکرد ارائه شده توسط NVIDIA در واقع نشان می‌دهند که بهبود سرعت H100 آن به دلیل بهینه‌سازی‌های نرم‌افزاری مناسب دو برابر شده است.

یکی از ویژگی های برجسته TensorRT-LLM انویدیا، تکنیک نوآورانه دسته بندی در پرواز است. این روش به بارهای کاری‌ پویا و متنوع مدل‌های زبانی بزرگ پاسخ می‌دهد که می‌توانند در درخواست‌های محاسباتی خود با اختلاف زیادی مواجه شوند.

دسته‌بندی در حال پرواز (In-flight batching) بهینه‌سازی برنامه‌ریزی این بارهای کاری‌ را به حداکثر اندازه ممکن استفاده از منابع GPU تضمین می‌کند. به عبارتی دیگر، این روش باعث افزایش دو برابر در ظرفیت تولید درخواست‌های واقعی مدل‌های زبانی بزرگ بر روی GPU‌ های Tensor Core H100 می‌شود و در نتیجه، فرآیندهای استنتاج هوش مصنوعی سریعتر و کارآمدتری را ارائه می‌دهد.

شرکت NVIDIA می‌گوید که TensorRT-LLM خود را با یک کامپایلر یادگیری عمیق همراه با هسته‌های بهینه‌سازی، مراحل پیش‌پردازش و پس‌پردازش و اجزای ارتباطی چند-GPU/چند-نود یکپارچه کرده است، تضمین می‌کند که این اجزا به طور مؤثرتری روی GPU‌های خود اجرا شوند.

این یکپارچگی به وسیله یک API پایتون مدولار تکمیل شده است که رابطی مطلوب برای توسعه‌دهندگان فراهم می‌کند تا قابلیت‌های نرم‌افزار و سخت‌افزار را بدون نیاز به آشنایی عمیق با زبان‌های برنامه‌نویسی پیچیده افزایش دهند. به عنوان مثال، MosaicML ویژگی‌های خاصی را که نیاز داشت را به TensorRT-LLM اضافه کرده است و آن‌ها را به صورت سازگار در سرویس استنتاج خود یکپارچه سازی کرده است.

“Naveen Rao، معاون رئیس دپارتمان مهندسی در Databricks، می‌گوید: ‘TensorRT-LLM در استفاده آسان است، دارای ویژگی‌های فراوانی از جمله استریمینگ توکن‌ها، دسته‌بندی در حال پرواز، paged-attention

، کوانتیزاسیون و غیره، و کارآمد است. این نرم‌افزار عملکرد برتری را برای سرویس دهی LLM با استفاده از GPU‌های NVIDIA ارائه می‌دهد و به ما امکان می‌دهد تا صرفه جویی در هزینه‌ها را برای مشتریان خود فراهم کنیم.'”

عملکرد GPU H100 از Nvidia هنگام استفاده از TensorRT-LLM بسیار تاثیرگذار است. در معماری Hopper از Nvidia، GPU H100 هنگام استفاده از TensorRT-LLM، عملکردی با ضریب هشت برابر نسبت به GPU A100 ارائه می‌دهد. علاوه بر این، در آزمایش مدل Llama 2 توسعه داده شده توسط متا، TensorRT-LLM نسبت به GPU‌های A100، عملکرد استنتاج را با شتاب 4.6 برابر افزایش داد. این ارقام بر پتانسیل تحول آفرین نرم افزار در حوزه هوش مصنوعی و یادگیری ماشین تاکید می کند.

در نهایت، GPU‌های H100 هنگام استفاده از TensorRT-LLM، فرمت FP8 را پشتیبانی می‌کنند. این قابلیت امکان کاهش مصرف حافظه را بدون کاهش دقت مدل فراهم می کند، که برای شرکت‌ها و سازمان‌هایی که بودجه و/یا فضای دیتاسنتر محدود دارند و نمی‌توانند تعداد سرور کافی را برای تنظیم LLM‌های خود نصب کنند، مفید است.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

بهترین گوشی های دکمه ای
بررسی موبایل و تبلت

بهترین گوشی های دکمه ای بازار از نوکیا، جی ال ایکس و آلکاتل

نوشته شده توسط مهدی کریمی صمدی
19 بهمن 1404 - به‌روزشده در 20 بهمن 1404
بررسی Lenovo Legion 5 16IRX9
بررسی لپ تاپ و کامپیوتر

نقد و بررسی لپ تاپ Lenovo Legion 5 (16IRX9)؛ نماد تعادل میان قیمت و عملکرد

نوشته شده توسط مهدی کریمی صمدی
19 بهمن 1404
بررسی Galaxy A07 5G
بررسی موبایل و تبلت

بررسی Galaxy A07 5G ؛ گوشی اقتصادی جذاب سامسونگ با پشتیبانی از 5G

نوشته شده توسط مهدی کریمی صمدی
19 بهمن 1404
اولین نگاه به موبایل ترامپ
بررسی موبایل و تبلت

اولین نگاه به موبایل ترامپ

نوشته شده توسط مانی
18 بهمن 1404
خداحافظی ادوبی با انیمیشن دوبعدی محبوب Adobe Animate
نرم افزار

خداحافظی ادوبی با انیمیشن دوبعدی محبوب Adobe Animate

نوشته شده توسط سید محمد برازنده
14 بهمن 1404
خبر بعدی

رونمایی از یک مشکل جدید در بازی Starfield

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آیا مولکول‌های حیات می‌توانند در اعماق فضا شکل بگیرند؟

آیا مولکول‌های حیات می‌توانند در اعماق فضا شکل بگیرند؟ + تصویر

12 بهمن 1404
اپل از ردیاب AirTag 2 با ویژگی های جدید رونمایی کرد

اپل از ردیاب AirTag 2 با ویژگی های جدید رونمایی کرد

8 بهمن 1404

داغ‌ترین‌های روز

بررسی Galaxy A07 5G

بررسی Galaxy A07 5G ؛ گوشی اقتصادی جذاب سامسونگ با پشتیبانی از 5G

19 بهمن 1404
بهترین گوشی های دکمه ای

بهترین گوشی های دکمه ای بازار از نوکیا، جی ال ایکس و آلکاتل

19 بهمن 1404 - به‌روزشده در 20 بهمن 1404
یک لپ‌تاپ ویندوزی در مقابل تپه‌ای از چاپگرهای قدیمی و مستهلک که نشان‌دهنده پایان پشتیبانی از درایورهای قدیمی است.

ویندوز ۱۱ در سال ۲۰۲۶ به پشتیبانی از درایورهای قدیمی چاپگر پایان می‌دهد؛ آماده‌باش برای کاربران!

18 بهمن 1404
بهترین بازی‌های رایگان استیم که باید امتحان کنید

بهترین بازی‌های رایگان استیم که باید امتحان کنید

19 بهمن 1404 - به‌روزشده در 20 بهمن 1404
این دو موشک ایرانی سامانه های پدافندی را به چالش می کشند + اینفوگرافیک

این دو موشک ایرانی سامانه های پدافندی را به چالش می کشند + اینفوگرافیک

19 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

شاسی‌بلندهای برقی ۱۰۰۰ اسب‌ بخاری مرسدس در راه‌ هستند

شاسی‌بلندهای برقی ۱۰۰۰ اسب‌ بخاری مرسدس در راه‌ هستند

21 بهمن 1404
با سودآورترین سرمایه‌گذاری فناورانه ایران آشنا شوید

با سودآورترین سرمایه‌گذاری فناورانه ایران آشنا شوید

21 بهمن 1404
ربات انسان‌نمای Lingxi X2 در معبد شائولین؛ اجرای دقیق حرکات کونگ‌فو

ربات انسان‌نمای Lingxi X2 در معبد شائولین؛ اجرای دقیق حرکات کونگ‌فو + ویدیو

21 بهمن 1404
گیت‌هاب مدل GPT-5.3-Codex را برای پردازش سریع‌تر عرضه کرد

گیت‌هاب مدل GPT-5.3-Codex را برای پردازش سریع‌تر عرضه کرد

21 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir