• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک نقد و بررسی قطعات کامپیوتر

نرم افزار جدید انویدیا عملکرد مدل‌های زبانی را بالا می برد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
سه‌شنبه 21 شهریور 1402 - 15:38
در قطعات کامپیوتر, نقد و بررسی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت انویدیا می‌گوید نرم‌افزار تازه‌ای به نام TensorRT-LL که به صورت منبع باز عرضه شده است، قادر است به طور چشمگیری عملکرد مدل‌های زبانی بزرگ (LLM) را بر روی GPU‌ها افزایش دهد.

به گزارش تکناک، طبق ادعای این شرکت، قابلیت‌های TensorRT-LL اجازه می‌دهد تا عملکرد GPU محاسباتی H100 را در مدل GPT-J LLM با شش میلیارد پارامتر به دو برابر افزایش دهد. مهمترین نکته این است که این نرم‌افزار قادر است این بهبود عملکرد را بدون نیاز به آموزش مجدد مدل فراهم کند.

شرکت انویدیا  TensorRT-LLM را به طور خاص برای افزایش سرعت عملکرد استنتاج مدل‌های زبانی بزرگ توسعه داده است و گرافیک‌های عملکرد ارائه شده توسط NVIDIA در واقع نشان می‌دهند که بهبود سرعت H100 آن به دلیل بهینه‌سازی‌های نرم‌افزاری مناسب دو برابر شده است.

یکی از ویژگی های برجسته TensorRT-LLM انویدیا، تکنیک نوآورانه دسته بندی در پرواز است. این روش به بارهای کاری‌ پویا و متنوع مدل‌های زبانی بزرگ پاسخ می‌دهد که می‌توانند در درخواست‌های محاسباتی خود با اختلاف زیادی مواجه شوند.

دسته‌بندی در حال پرواز (In-flight batching) بهینه‌سازی برنامه‌ریزی این بارهای کاری‌ را به حداکثر اندازه ممکن استفاده از منابع GPU تضمین می‌کند. به عبارتی دیگر، این روش باعث افزایش دو برابر در ظرفیت تولید درخواست‌های واقعی مدل‌های زبانی بزرگ بر روی GPU‌ های Tensor Core H100 می‌شود و در نتیجه، فرآیندهای استنتاج هوش مصنوعی سریعتر و کارآمدتری را ارائه می‌دهد.

شرکت NVIDIA می‌گوید که TensorRT-LLM خود را با یک کامپایلر یادگیری عمیق همراه با هسته‌های بهینه‌سازی، مراحل پیش‌پردازش و پس‌پردازش و اجزای ارتباطی چند-GPU/چند-نود یکپارچه کرده است، تضمین می‌کند که این اجزا به طور مؤثرتری روی GPU‌های خود اجرا شوند.

این یکپارچگی به وسیله یک API پایتون مدولار تکمیل شده است که رابطی مطلوب برای توسعه‌دهندگان فراهم می‌کند تا قابلیت‌های نرم‌افزار و سخت‌افزار را بدون نیاز به آشنایی عمیق با زبان‌های برنامه‌نویسی پیچیده افزایش دهند. به عنوان مثال، MosaicML ویژگی‌های خاصی را که نیاز داشت را به TensorRT-LLM اضافه کرده است و آن‌ها را به صورت سازگار در سرویس استنتاج خود یکپارچه سازی کرده است.

“Naveen Rao، معاون رئیس دپارتمان مهندسی در Databricks، می‌گوید: ‘TensorRT-LLM در استفاده آسان است، دارای ویژگی‌های فراوانی از جمله استریمینگ توکن‌ها، دسته‌بندی در حال پرواز، paged-attention

، کوانتیزاسیون و غیره، و کارآمد است. این نرم‌افزار عملکرد برتری را برای سرویس دهی LLM با استفاده از GPU‌های NVIDIA ارائه می‌دهد و به ما امکان می‌دهد تا صرفه جویی در هزینه‌ها را برای مشتریان خود فراهم کنیم.'”

عملکرد GPU H100 از Nvidia هنگام استفاده از TensorRT-LLM بسیار تاثیرگذار است. در معماری Hopper از Nvidia، GPU H100 هنگام استفاده از TensorRT-LLM، عملکردی با ضریب هشت برابر نسبت به GPU A100 ارائه می‌دهد. علاوه بر این، در آزمایش مدل Llama 2 توسعه داده شده توسط متا، TensorRT-LLM نسبت به GPU‌های A100، عملکرد استنتاج را با شتاب 4.6 برابر افزایش داد. این ارقام بر پتانسیل تحول آفرین نرم افزار در حوزه هوش مصنوعی و یادگیری ماشین تاکید می کند.

در نهایت، GPU‌های H100 هنگام استفاده از TensorRT-LLM، فرمت FP8 را پشتیبانی می‌کنند. این قابلیت امکان کاهش مصرف حافظه را بدون کاهش دقت مدل فراهم می کند، که برای شرکت‌ها و سازمان‌هایی که بودجه و/یا فضای دیتاسنتر محدود دارند و نمی‌توانند تعداد سرور کافی را برای تنظیم LLM‌های خود نصب کنند، مفید است.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

تسلط اپل بر بازار هدفون و ساعت هوشمند
پیشنهاد سردبیر

آیا اپل همچنان بر بازار هدفون و ساعت هوشمند تسلط دارد؟

نوشته شده توسط اسما کلهر
12 تیر 1404
احتمال ساخت حلقه هوشمند اپل؛ جایگزینی برای ساعت‌های هوشمند؟
گجت

آیا دوران سلطه اپل واچ به پایان رسیده است؟ حلقه‌های هوشمند در راهند!

نوشته شده توسط اسما کلهر
9 تیر 1404
راهنمای خرید محصولات خانه هوشمند؛ از امنیت تا صرفه‌جویی انرژی
پیشنهاد سردبیر

معرفی بهترین گجت ها برای داشتن یک خانه هوشمند

نوشته شده توسط فاطمه امامی
8 تیر 1404
مقایسه بهترین هاب های USB در سال 1404
پیشنهاد سردبیر

مقایسه بهترین هاب های USB در سال 1404

نوشته شده توسط فاطمه امامی
8 تیر 1404
بهترین گوشی های ارزان با باتری قدرتمند
بررسی موبایل و تبلت

بهترین گوشی های ارزان با باتری قدرتمند که ارزش خرید بسیار بالایی دارند

نوشته شده توسط مهدی کریمی صمدی
8 تیر 1404
خبر بعدی
رونمایی از یک مشکل جدید در بازی Starfield

رونمایی از یک مشکل جدید در بازی Starfield

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

khordad1404 khordad1404 khordad1404

پیشنهادی

بازگشت گفتار بیمار ALS با فناوری ایمپلنت مغزی

بازگشت قدرت تکلم به بیمار ALS با فناوری ایمپلنت مغزی

25 خرداد 1404
نقش ویتامین C در بازسازی و جوان‌ سازی پوست

نقش شگفت انگیز ویتامین C در جوانسازی پوست

9 تیر 1404

داغ‌ترین‌های روز

اضافه شدن قابلیت پرتاب پهپاد به هواپیمای سوخت‌رسان KC-135

اضافه شدن قابلیت پرتاب پهپاد به هواپیمای سوخت‌رسان KC-135

11 تیر 1404
تأیید ETF ریپل توسط SEC؛ آیا قیمت به ۲.۶۹ دلار می‌رسد؟

تأیید ETF ریپل توسط SEC؛ آیا قیمت به ۲.۶۹ دلار می‌رسد؟

11 تیر 1404
رکود تورمی در بازار موبایل؛ خریدار نیست، گوشی هم نیست!

رکود تورمی در بازار موبایل؛ خریدار نیست، گوشی هم نیست!

11 تیر 1404
گوشی شیائومی میکس فلیپ ۲

شیائومی میکس فلیپ 2 با پردازنده اسنپدراگون 8 الیت و لولای بادوام معرفی شد

5 تیر 1404
ریپل در مسیر سلطه جهانی؛ سرنخ‌هایی مهم از برنامه‌های ریپل برای ۲۰۳۰

ریپل در مسیر سلطه جهانی؛ سرنخ‌هایی مهم از برنامه‌های ریپل برای ۲۰۳۰

11 تیر 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

کوپایلت و مدیریت فایل‌ها

چگونه از کوپایلت ویندوز برای جست‌وجو و مدیریت فایل‌ها استفاده کنیم؟

13 تیر 1404
معرفی مفهوم جدید Windows Classic Remastered – تلفیقی نوستالژیک از نسخه‌های محبوب ویندوز

Windows Classic Remastered؛ ترکیبی از نوستالژی و نوآوری در طراحی سیستم‌عامل

13 تیر 1404
رکوردشکنی AMD با پردازنده جدید Ryzen Threadripper 9980X؛ سریع‌ترین پردازنده دسکتاپ در عملکرد چندرشته‌ای

پردازنده Ryzen Threadripper 9980X رکورد جدیدی در آزمون چندرشته‌ای ثبت کرد

13 تیر 1404
ویژگی‌های امنیتی HyperOS

با این ویژگی‌های امنیتی HyperOS از اطلاعات شخصی‌تان در فضای کاری محافظت کنید

13 تیر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir