• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » انویدیا با همکاری دانشگاه MIT هوش مصنوعی SANA را منتشر کرد

انویدیا با همکاری دانشگاه MIT هوش مصنوعی SANA را منتشر کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 5 آبان 1403 - 20:30
در اخبار هوش مصنوعی
مدل جدید تولید ویدئوی هوش مصنوعی SANA عرضه شد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. ویژگی‌های اصلی طراحی Sana
  • 2. برتری‌های عملکرد Sana در‌مقایسه‌با مدل‌های پیشرفته

مدل هوش مصنوعی جدید انویدیا به نام SANA می‌تواند تصاویر با کیفیت 4K و وضوح ۴۰۹۶ در ۴۰۹۶ پیکسل را در چند ثانیه تولید کند.

محققان انویدیا و دانشگاه MIT و «دانشگاه چینهوا» مدل هوش مصنوعی جدیدی به نام Sana معرفی کرده‌اند که می‌تواند تصاویری با کیفیت عالی و هماهنگی قوی بین متن و تصویر را با سرعت بسیار زیاد تولید کند.

nvlabs می‌نویسد که ویژگی‌های اصلی طراحی این مدل شامل فشرده‌سازی عمیق خودرمزگذار، استفاده از DiT خطی، کدگذاری متن با مدل کوچک فقط رمزگشا و بهینه‌سازی در مراحل آموزش و نمونه‌گیری است. Sana به‌عنوان راهکاری برای تولید محتوای تصویری باکیفیت و هزینه ارزان، ابزار مهمی برای طراحان و محققان ارائه می‌دهد.

01
از 02
ویژگی‌های اصلی طراحی Sana

۱. فشرده‌سازی عمیق خودرمزگذار (Deep Compression Autoencoder)

این فناوری با نام DC-AE، برخلاف خودرمزگذارهای سنتی که فشرده‌سازی را تا ۸ برابر انجام می‌دهند، مقیاس فشرده‌سازی را تا ۳۲ برابر افزایش داده است. خودرمزگذار DC-AE با فشرده‌سازی تصویر به‌گونه‌ای طراحی شده است که تعداد توکن‌های نهفته (Latent Tokens) را ۱۶ برابر کاهش می‌دهد و در نتیجه، آموزش و تولید تصاویر با وضوح چشمگیر، همچون وضوح 4K، بهبود یافته است.

۲. DiT خطی کارآمد

در این چهارچوب، DiT خطی جایگزین توجهات معمولی (Vanilla Attention) شده است و پیچیدگی محاسباتی را از مرتبه O(N²) به O(N) کاهش می‌دهد. DiT خطی با Mix-FFN همراه است که به کمک کانولوشن‌های عمقی ۳ در ۳ در MLP، اطلاعات محلی توکن‌ها را تقویت می‌کند. این روش بدون نیاز به کدگذاری موقعیت (NoPE) کیفیت تصویر را حفظ و زمان پردازش برای تولید تصاویر 4K را ۱/۷ برابر سریع‌تر می‌کند.

۳. کدکننده متن با مدل کوچک فقط رمزگشا

هوش مصنوعی Sana از مدل Gemma به‌عنوان کدکننده متن استفاده می‌کند که برخلاف مدل‌هایی نظیر CLIP و T5، درک بهتری از متن و دستورها را ارائه می‌دهد. به‌منظور بهبود هماهنگی متن و تصویر، از طراحی دستورالعمل‌های پیچیده انسانی (CHI) در Gemma بهره گرفته شده و با استفاده از یادگیری در بافت، توانایی هماهنگی متن و تصویر افزایش یافته است.

۴. راهبردهای بهینه آموزش و استنتاج

هوش مصنوعی Sana با ارائه راهکارهایی مانند Flow-DPM-Solver، مراحل نمونه‌گیری را از ۲۸-۵۰ به ۱۴-۲۰ مرحله کاهش می‌دهد و عملکرد بهتری را در‌مقایسه‌با روش‌های سنتی مانند Flow-Euler-Solver به ارمغان می‌آورد. در این فرایند، چندین مدل VLM توضیحات متنوعی تولید می‌کنند و با استراتژی مبتنی‌بر امتیاز CLIP (CLIPScore)، توضیحاتی با امتیاز بیشتر انتخاب می‌شود تا همگرایی و هماهنگی متن و تصویر بهبود یابد.

مدل جدید تولید ویدئوی هوش مصنوعی SANA

02
از 02
برتری‌های عملکرد Sana در‌مقایسه‌با مدل‌های پیشرفته

آزمایش‌ها نشان می‌دهد که هوش مصنوعی Sana-0.6B در‌مقایسه‌با مدل‌های بزرگ‌تر مانند Flux-12B با وجود اندازه بسیار کوچک‌تر (۲۰ برابر)، تا بیش از ۱۰۰ برابر سریع‌تر عمل می‌کند. این مدل حتی روی یک GPU لپ‌تاپ با حافظه ۱۶ گیگابایت به خوبی کار می‌کند و می‌تواند تصاویر با وضوح ۱۰۲۴ در ۱۰۲۴ را در کمتر از ۱ ثانیه تولید کند. Sana-0.6B با مدل‌هایی مانند PixArt-Σ که اندازه مشابهی دارند، تا ۵ برابر سریع‌تر است و در معیارهای FID، امتیاز CLIPو GenEval و DPG-Bench نیز به‌طرز چشمگیری برتری دارد.

در‌مقایسه‌با مدل‌های پیشرفته‌ای مانند FLUX-dev و Sana-0.6B عملکردی رقابتی ارائه می‌دهد. برای مثال، در معیارهای DPG-Bench، این مدل دقتی معادل و در GenEval اندکی کمتر دارد؛ اما با بهره‌وری درخورتوجه، Sana-0.6B در طول گذر ۳۹ برابر و Sana-1.6B نیز ۲۳ برابر سریع‌تر است.

این چهارچوب جدید نه‌تنها سرعت زیادی دارد؛ بلکه به تولید محتوای تصویری باکیفیت و هزینه کمتر کمک می‌کند و در آینده می‌تواند به‌عنوان ابزاری مؤثر برای طراحان محتوا و محققان و توسعه‌دهندگان به‌کار گرفته شود.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

گوگل قابلیت NotebookLM را در اختیار دانشجویان قرار داد
اخبار هوش مصنوعی

گوگل قابلیت NotebookLM را در اختیار دانشجویان قرار داد

نوشته شده توسط مانی
20 اردیبهشت 1405
جنگ پشت پرده هوش مصنوعی؛ نگرانی مایکروسافت از تغییر جبهه OpenAI
اخبار هوش مصنوعی

جنگ پشت پرده هوش مصنوعی؛ نگرانی مایکروسافت از تغییر جبهه OpenAI

نوشته شده توسط مانی
20 اردیبهشت 1405
هوش مصنوعی Mythos بیش از 400 باگ امنیتی فایرفاکس را رفع کرد
اخبار هوش مصنوعی

هوش مصنوعی Mythos بیش از ۴۰۰ باگ امنیتی فایرفاکس را رفع کرد

نوشته شده توسط سید محمد برازنده
20 اردیبهشت 1405
نبرد میلیارد دلاری دیتاسنترها؛ AMD تاج را از اینتل گرفت
اخبار هوش مصنوعی

نبرد میلیارد دلاری دیتاسنترها؛ AMD تاج را از اینتل گرفت

نوشته شده توسط مانی
20 اردیبهشت 1405
هوش مصنوعی کدکس OpenAI به مرورگر کروم اضافه شد
اخبار هوش مصنوعی

هوش مصنوعی کدکس OpenAI به مرورگر کروم اضافه شد

نوشته شده توسط سید محمد برازنده
19 اردیبهشت 1405
خبر بعدی
هوش مصنوعی، جایگزین انسان در مشاغل خاص با بهره‌وری هزار برابری

هوش مصنوعی؛ جایگزین انسان در مشاغل خاص با بهره‌وری هزار‌برابری

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

رسوایی اداره بهره‌وری دولت آمریکا در استفاده از ChatGPT

رسوایی اداره بهره‌وری دولت آمریکا در استفاده از ChatGPT

19 اردیبهشت 1405
هشدار مدیرعامل دل: کمبود DRAM تا ۲۰۲۸ ادامه دارد

بازار حافظه به سمت کمبود شدید و افزایش قیمت بی‌سابقه می‌رود

22 فروردین 1405

داغ‌ترین‌های روز

برنامه Google Earth با قابلیت‌ های متنوع و جذاب خود، امکانات وسیعی را برای مشاهده اماکن و نقشه‌ های قدیمی برای کاربران به ارمغان می‌آورد.

سفر به گذشته با Google Earth

17 فروردین 1403 - به‌روزشده در 27 مهر 1404
اسلحه پنهان ایران در تنگه هرمز رونمایی شد!

اسلحه پنهان ایران در تنگه هرمز رونمایی شد!

20 اردیبهشت 1405
توافق ایران و آمریکا

سیگنال توافق آمریکا و ایران بازار بیت‌کوین را سبزپوش کرد

17 اردیبهشت 1405
هوش مصنوعی گوگل کروم حافظه رایانه شما را می‌بلعد

هوش مصنوعی گوگل کروم حافظه رایانه شما را می‌بلعد

17 اردیبهشت 1405

۵ روش برای رفع مشکل آیفون گرفتار در حالت ریکاوری

24 آبان 1402 - به‌روزشده در 4 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بازار خودرو همچنان متلاطم است + قیمت های روز

بازار خودرو همچنان متلاطم است + قیمت های روز

20 اردیبهشت 1405
اسلحه پنهان ایران در تنگه هرمز رونمایی شد!

اسلحه پنهان ایران در تنگه هرمز رونمایی شد!

20 اردیبهشت 1405
جعبه‌های بسته‌بندی Starlink شامل کیت اصلی و لوازم جانبی در یک فروشگاه تجهیزات شبکه و الکترونیک.

استفاده از استارلینک نیازمند احراز هویت با پاسپورت شد

20 اردیبهشت 1405
آمریکا مهلت دریافت به‌روزرسانی پهپادها و روترهای ممنوعه را تمدید کرد

آمریکا مهلت دریافت به‌روزرسانی پهپادها و روترهای ممنوعه را تمدید کرد

20 اردیبهشت 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir