• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » انویدیا با همکاری دانشگاه MIT هوش مصنوعی SANA را منتشر کرد

انویدیا با همکاری دانشگاه MIT هوش مصنوعی SANA را منتشر کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 5 آبان 1403 - 20:30
در اخبار هوش مصنوعی
مدل جدید تولید ویدئوی هوش مصنوعی SANA عرضه شد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. ویژگی‌های اصلی طراحی Sana
  • 2. برتری‌های عملکرد Sana در‌مقایسه‌با مدل‌های پیشرفته

مدل هوش مصنوعی جدید انویدیا به نام SANA می‌تواند تصاویر با کیفیت 4K و وضوح ۴۰۹۶ در ۴۰۹۶ پیکسل را در چند ثانیه تولید کند.

محققان انویدیا و دانشگاه MIT و «دانشگاه چینهوا» مدل هوش مصنوعی جدیدی به نام Sana معرفی کرده‌اند که می‌تواند تصاویری با کیفیت عالی و هماهنگی قوی بین متن و تصویر را با سرعت بسیار زیاد تولید کند.

nvlabs می‌نویسد که ویژگی‌های اصلی طراحی این مدل شامل فشرده‌سازی عمیق خودرمزگذار، استفاده از DiT خطی، کدگذاری متن با مدل کوچک فقط رمزگشا و بهینه‌سازی در مراحل آموزش و نمونه‌گیری است. Sana به‌عنوان راهکاری برای تولید محتوای تصویری باکیفیت و هزینه ارزان، ابزار مهمی برای طراحان و محققان ارائه می‌دهد.

01
از 02
ویژگی‌های اصلی طراحی Sana

۱. فشرده‌سازی عمیق خودرمزگذار (Deep Compression Autoencoder)

این فناوری با نام DC-AE، برخلاف خودرمزگذارهای سنتی که فشرده‌سازی را تا ۸ برابر انجام می‌دهند، مقیاس فشرده‌سازی را تا ۳۲ برابر افزایش داده است. خودرمزگذار DC-AE با فشرده‌سازی تصویر به‌گونه‌ای طراحی شده است که تعداد توکن‌های نهفته (Latent Tokens) را ۱۶ برابر کاهش می‌دهد و در نتیجه، آموزش و تولید تصاویر با وضوح چشمگیر، همچون وضوح 4K، بهبود یافته است.

۲. DiT خطی کارآمد

در این چهارچوب، DiT خطی جایگزین توجهات معمولی (Vanilla Attention) شده است و پیچیدگی محاسباتی را از مرتبه O(N²) به O(N) کاهش می‌دهد. DiT خطی با Mix-FFN همراه است که به کمک کانولوشن‌های عمقی ۳ در ۳ در MLP، اطلاعات محلی توکن‌ها را تقویت می‌کند. این روش بدون نیاز به کدگذاری موقعیت (NoPE) کیفیت تصویر را حفظ و زمان پردازش برای تولید تصاویر 4K را ۱/۷ برابر سریع‌تر می‌کند.

۳. کدکننده متن با مدل کوچک فقط رمزگشا

هوش مصنوعی Sana از مدل Gemma به‌عنوان کدکننده متن استفاده می‌کند که برخلاف مدل‌هایی نظیر CLIP و T5، درک بهتری از متن و دستورها را ارائه می‌دهد. به‌منظور بهبود هماهنگی متن و تصویر، از طراحی دستورالعمل‌های پیچیده انسانی (CHI) در Gemma بهره گرفته شده و با استفاده از یادگیری در بافت، توانایی هماهنگی متن و تصویر افزایش یافته است.

۴. راهبردهای بهینه آموزش و استنتاج

هوش مصنوعی Sana با ارائه راهکارهایی مانند Flow-DPM-Solver، مراحل نمونه‌گیری را از ۲۸-۵۰ به ۱۴-۲۰ مرحله کاهش می‌دهد و عملکرد بهتری را در‌مقایسه‌با روش‌های سنتی مانند Flow-Euler-Solver به ارمغان می‌آورد. در این فرایند، چندین مدل VLM توضیحات متنوعی تولید می‌کنند و با استراتژی مبتنی‌بر امتیاز CLIP (CLIPScore)، توضیحاتی با امتیاز بیشتر انتخاب می‌شود تا همگرایی و هماهنگی متن و تصویر بهبود یابد.

مدل جدید تولید ویدئوی هوش مصنوعی SANA

02
از 02
برتری‌های عملکرد Sana در‌مقایسه‌با مدل‌های پیشرفته

آزمایش‌ها نشان می‌دهد که هوش مصنوعی Sana-0.6B در‌مقایسه‌با مدل‌های بزرگ‌تر مانند Flux-12B با وجود اندازه بسیار کوچک‌تر (۲۰ برابر)، تا بیش از ۱۰۰ برابر سریع‌تر عمل می‌کند. این مدل حتی روی یک GPU لپ‌تاپ با حافظه ۱۶ گیگابایت به خوبی کار می‌کند و می‌تواند تصاویر با وضوح ۱۰۲۴ در ۱۰۲۴ را در کمتر از ۱ ثانیه تولید کند. Sana-0.6B با مدل‌هایی مانند PixArt-Σ که اندازه مشابهی دارند، تا ۵ برابر سریع‌تر است و در معیارهای FID، امتیاز CLIPو GenEval و DPG-Bench نیز به‌طرز چشمگیری برتری دارد.

در‌مقایسه‌با مدل‌های پیشرفته‌ای مانند FLUX-dev و Sana-0.6B عملکردی رقابتی ارائه می‌دهد. برای مثال، در معیارهای DPG-Bench، این مدل دقتی معادل و در GenEval اندکی کمتر دارد؛ اما با بهره‌وری درخورتوجه، Sana-0.6B در طول گذر ۳۹ برابر و Sana-1.6B نیز ۲۳ برابر سریع‌تر است.

این چهارچوب جدید نه‌تنها سرعت زیادی دارد؛ بلکه به تولید محتوای تصویری باکیفیت و هزینه کمتر کمک می‌کند و در آینده می‌تواند به‌عنوان ابزاری مؤثر برای طراحان محتوا و محققان و توسعه‌دهندگان به‌کار گرفته شود.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

پایان الزام قانونی OepnAI برای نگهداری دائمی داده‌های ChatGPT
اخبار هوش مصنوعی

پایان الزام قانونی OepnAI برای نگهداری دائمی داده‌های ChatGPT

نوشته شده توسط سید محمد برازنده
20 مهر 1404
اپلیکیشن Sora OpenAI برای اندروید
اخبار هوش مصنوعی

خبر خوش برای کاربران اندروید؛ اپلیکیشن Sora به‌زودی در دسترس قرار می‌گیرد

نوشته شده توسط اسما کلهر
19 مهر 1404 - به‌روزشده در 20 مهر 1404
شکایت نویسندگان از اپل
اخبار هوش مصنوعی

شکایت نویسندگان از اپل به‌دلیل استفاده از کتاب‌های کپی‌رایت برای آموزش هوش مصنوعی

نوشته شده توسط امیرحسین یونس
19 مهر 1404
راهنمای کامل دریافت کد دعوت سورا 2
آموزش

راهنمای کامل دریافت کد دعوت سورا ۲ + تصویر

نوشته شده توسط آرمین ثنایی سرشت
19 مهر 1404
اتصال Copilot ویندوز به Gmail، Google Drive و دیگر سرویس‌ها آغاز شد
اخبار هوش مصنوعی

اتصال Copilot ویندوز به Gmail، Google Drive و دیگر سرویس‌ها آغاز شد

نوشته شده توسط سید محمد برازنده
19 مهر 1404
خبر بعدی
هوش مصنوعی، جایگزین انسان در مشاغل خاص با بهره‌وری هزار برابری

هوش مصنوعی؛ جایگزین انسان در مشاغل خاص با بهره‌وری هزار‌برابری

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

سلطه گوگل کروم بر مرورگرهای دسکتاپ

گوگل کروم رکورد زد؛ سهم ۷۲ درصدی بازار مرورگرها

9 مهر 1404
بررسی Xiaomi 15T

بررسی Xiaomi 15T ؛ بالارده جدید شیائومی با پردازنده پوکو ایکس ۷ پرو!

20 مهر 1404

داغ‌ترین‌های روز

لپ‌تاپ ردمجیک ۱۶ پرو ۲۰۲۶

لپ‌تاپ گیمینگ ردمجیک ۱۶ پرو ۲۰۲۶ با کارت گرافیک RTX 5090 عرضه می‌شود

19 مهر 1404 - به‌روزشده در 20 مهر 1404
۱۰ موشک ویرانگر دنیا بر اساس بُرد و قدرت تخریب

۱۰ موشک ویرانگر دنیا بر اساس بُرد و قدرت تخریب

20 مهر 1404
معرفی بهترین ساعت هوشمند صفحه گرد ۲۰۲۵

معرفی بهترین ساعت هوشمند صفحه گرد ۲۰۲۵

13 مهر 1404
تبلت جدید پوکو با درگاه سیم کارت عرضه می‌ شود

تبلت جدید پوکو با درگاه سیم کارت عرضه می‌ شود

20 مهر 1404
ریپل

پیش‌بینی قیمت ریپل (XRP) با احتمال ورود ۱۰ میلیارد دلاری سرمایه به ETFها

14 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

قابلیت‌های پنهان اندروید؛ ترفندهایی که تجربه کاربری شما را متحول می‌کنند

قابلیت‌های پنهان اندروید؛ ترفندهایی که تجربه کاربری شما را متحول می‌کنند

20 مهر 1404
چه موقع باید رم لپ تاپ را ارتقا بدهیم؟

چه موقع باید رم لپ تاپ را ارتقا بدهیم؟

20 مهر 1404
رتبه‌بندی کامل سری Call of Duty از ۲۰۰۳ تا ۲۰۲۵ | از بدترین تا بهترین

رتبه‌بندی کامل سری Call of Duty از ۲۰۰۳ تا ۲۰۲۵ ؛ از بدترین تا بهترین

20 مهر 1404

بهترین هندزفری گردنی ۲۰۲۵؛ راهنمای خرید و معرفی برترین مدل‌ها

20 مهر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir