• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

انویدیا با همکاری دانشگاه MIT هوش مصنوعی SANA را منتشر کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 5 آبان 1403 - 20:30
در اخبار هوش مصنوعی
مدل جدید تولید ویدئوی هوش مصنوعی SANA عرضه شد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل هوش مصنوعی جدید انویدیا به نام SANA می‌تواند تصاویر با کیفیت 4K و وضوح ۴۰۹۶ در ۴۰۹۶ پیکسل را در چند ثانیه تولید کند.

محققان انویدیا و دانشگاه MIT و «دانشگاه چینهوا» مدل هوش مصنوعی جدیدی به نام Sana معرفی کرده‌اند که می‌تواند تصاویری با کیفیت عالی و هماهنگی قوی بین متن و تصویر را با سرعت بسیار زیاد تولید کند.

nvlabs می‌نویسد که ویژگی‌های اصلی طراحی این مدل شامل فشرده‌سازی عمیق خودرمزگذار، استفاده از DiT خطی، کدگذاری متن با مدل کوچک فقط رمزگشا و بهینه‌سازی در مراحل آموزش و نمونه‌گیری است. Sana به‌عنوان راهکاری برای تولید محتوای تصویری باکیفیت و هزینه ارزان، ابزار مهمی برای طراحان و محققان ارائه می‌دهد.

فهرست مطالب

  • ویژگی‌های اصلی طراحی Sana
    • ۱. فشرده‌سازی عمیق خودرمزگذار (Deep Compression Autoencoder)
    • ۲. DiT خطی کارآمد
    • ۳. کدکننده متن با مدل کوچک فقط رمزگشا
    • ۴. راهبردهای بهینه آموزش و استنتاج
  • برتری‌های عملکرد Sana در‌مقایسه‌با مدل‌های پیشرفته

ویژگی‌های اصلی طراحی Sana

۱. فشرده‌سازی عمیق خودرمزگذار (Deep Compression Autoencoder)

این فناوری با نام DC-AE، برخلاف خودرمزگذارهای سنتی که فشرده‌سازی را تا ۸ برابر انجام می‌دهند، مقیاس فشرده‌سازی را تا ۳۲ برابر افزایش داده است. خودرمزگذار DC-AE با فشرده‌سازی تصویر به‌گونه‌ای طراحی شده است که تعداد توکن‌های نهفته (Latent Tokens) را ۱۶ برابر کاهش می‌دهد و در نتیجه، آموزش و تولید تصاویر با وضوح چشمگیر، همچون وضوح 4K، بهبود یافته است.

۲. DiT خطی کارآمد

در این چهارچوب، DiT خطی جایگزین توجهات معمولی (Vanilla Attention) شده است و پیچیدگی محاسباتی را از مرتبه O(N²) به O(N) کاهش می‌دهد. DiT خطی با Mix-FFN همراه است که به کمک کانولوشن‌های عمقی ۳ در ۳ در MLP، اطلاعات محلی توکن‌ها را تقویت می‌کند. این روش بدون نیاز به کدگذاری موقعیت (NoPE) کیفیت تصویر را حفظ و زمان پردازش برای تولید تصاویر 4K را ۱/۷ برابر سریع‌تر می‌کند.

۳. کدکننده متن با مدل کوچک فقط رمزگشا

هوش مصنوعی Sana از مدل Gemma به‌عنوان کدکننده متن استفاده می‌کند که برخلاف مدل‌هایی نظیر CLIP و T5، درک بهتری از متن و دستورها را ارائه می‌دهد. به‌منظور بهبود هماهنگی متن و تصویر، از طراحی دستورالعمل‌های پیچیده انسانی (CHI) در Gemma بهره گرفته شده و با استفاده از یادگیری در بافت، توانایی هماهنگی متن و تصویر افزایش یافته است.

۴. راهبردهای بهینه آموزش و استنتاج

هوش مصنوعی Sana با ارائه راهکارهایی مانند Flow-DPM-Solver، مراحل نمونه‌گیری را از ۲۸-۵۰ به ۱۴-۲۰ مرحله کاهش می‌دهد و عملکرد بهتری را در‌مقایسه‌با روش‌های سنتی مانند Flow-Euler-Solver به ارمغان می‌آورد. در این فرایند، چندین مدل VLM توضیحات متنوعی تولید می‌کنند و با استراتژی مبتنی‌بر امتیاز CLIP (CLIPScore)، توضیحاتی با امتیاز بیشتر انتخاب می‌شود تا همگرایی و هماهنگی متن و تصویر بهبود یابد.

مدل جدید تولید ویدئوی هوش مصنوعی SANA

برتری‌های عملکرد Sana در‌مقایسه‌با مدل‌های پیشرفته

آزمایش‌ها نشان می‌دهد که هوش مصنوعی Sana-0.6B در‌مقایسه‌با مدل‌های بزرگ‌تر مانند Flux-12B با وجود اندازه بسیار کوچک‌تر (۲۰ برابر)، تا بیش از ۱۰۰ برابر سریع‌تر عمل می‌کند. این مدل حتی روی یک GPU لپ‌تاپ با حافظه ۱۶ گیگابایت به خوبی کار می‌کند و می‌تواند تصاویر با وضوح ۱۰۲۴ در ۱۰۲۴ را در کمتر از ۱ ثانیه تولید کند. Sana-0.6B با مدل‌هایی مانند PixArt-Σ که اندازه مشابهی دارند، تا ۵ برابر سریع‌تر است و در معیارهای FID، امتیاز CLIPو GenEval و DPG-Bench نیز به‌طرز چشمگیری برتری دارد.

در‌مقایسه‌با مدل‌های پیشرفته‌ای مانند FLUX-dev و Sana-0.6B عملکردی رقابتی ارائه می‌دهد. برای مثال، در معیارهای DPG-Bench، این مدل دقتی معادل و در GenEval اندکی کمتر دارد؛ اما با بهره‌وری درخورتوجه، Sana-0.6B در طول گذر ۳۹ برابر و Sana-1.6B نیز ۲۳ برابر سریع‌تر است.

این چهارچوب جدید نه‌تنها سرعت زیادی دارد؛ بلکه به تولید محتوای تصویری باکیفیت و هزینه کمتر کمک می‌کند و در آینده می‌تواند به‌عنوان ابزاری مؤثر برای طراحان محتوا و محققان و توسعه‌دهندگان به‌کار گرفته شود.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

مذاکره بریتانیا و OpenAI درباره طرح ارائه رایگان ChatGPT Plus
اخبار هوش مصنوعی

مذاکره بریتانیا و OpenAI درباره طرح ارائه رایگان ChatGPT Plus

نوشته شده توسط سید محمد برازنده
3 شهریور 1404
مدل هوش مصنوعی Grok 2.5 متن‌باز شد
اخبار هوش مصنوعی

مدل هوش مصنوعی Grok 2.5 متن‌باز شد

نوشته شده توسط سید محمد برازنده
3 شهریور 1404
فناوری Spectrum-XGS انویدیا؛ اتصال دیتاسنترها برای خلق ابرخوشه هوش مصنوعی
اخبار هوش مصنوعی

فناوری جدید انویدیا رونمایی شد؛ اتصال دیتاسنترها برای خلق ابرخوشه هوش مصنوعی

نوشته شده توسط اسما کلهر
1 شهریور 1404 - به‌روزشده در 3 شهریور 1404
اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدیوهای بلند توسعه داد
اخبار هوش مصنوعی

اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدئوهای طولانی توسعه داد

نوشته شده توسط امیرحسین یونس
1 شهریور 1404 - به‌روزشده در 3 شهریور 1404
استفاده رایگان از Veo 3 در اپلیکیشن Gemini فقط امروز و فردا
اخبار هوش مصنوعی

استفاده رایگان از Veo 3 در اپلیکیشن جمنای فقط امروز و فردا

نوشته شده توسط اسما کلهر
1 شهریور 1404 - به‌روزشده در 3 شهریور 1404
خبر بعدی
هوش مصنوعی، جایگزین انسان در مشاغل خاص با بهره‌وری هزار برابری

هوش مصنوعی؛ جایگزین انسان در مشاغل خاص با بهره‌وری هزار‌برابری

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

دانشمندان ژاپنی یک مسکن خوراکی غیر مخدر برای تسکین درد معرفی کردند

دانشمندان ژاپنی مسکن خوراکی غیرمخدر برای تسکین درد معرفی کردند

19 مرداد 1404
هشدارهای واتساپ برای مقابله با کلاهبرداری

واتساپ با افزودن قابلیت جدید، کاربران را از کلاهبرداری‌های گروهی آگاه می‌کند

14 مرداد 1404

داغ‌ترین‌های روز

گوشی پوکو M7 نسخه 4G با باتری ۷۰۰۰ میلی‌آمپری معرفی شد

گوشی پوکو M7 نسخه 4G با باتری 7000 میلی‌آمپری معرفی شد

26 مرداد 1404
ساعت هوشمند جدید شیائومی با باتری ۹۳۰ میلی‌آمپری و با LTE معرفی می‌شود

معرفی ساعت هوشمند جدید شیائومی با باتری ۹۳۰ میلی‌آمپرساعتی و پشتیبانی از LTE

1 شهریور 1404 - به‌روزشده در 3 شهریور 1404
در صورت صعود اتریوم (ETH) به محدوده ۹,۵۰۰ دلار چه قیمتی در انتظار ریپل خواهد بود؟

در صورت صعود اتریوم (ETH) به محدوده ۹,۵۰۰ دلار چه قیمتی در انتظار ریپل خواهد بود؟

1 شهریور 1404 - به‌روزشده در 3 شهریور 1404
ساخت نخستین توربین بادی سیمانی جهان در ایران

ساخت نخستین توربین بادی سیمانی جهان در ایران+ ویدئو

29 مرداد 1404
این گوشی های سامسونگ در ماه آینده آپدیت بتای One UI 8 را دریافت می‌کنند

این گوشی‌های سامسونگ ماه آینده آپدیت بتای One UI 8 را دریافت می‌کنند

28 مرداد 1404 - به‌روزشده در 29 مرداد 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اتریوم رکورد تاریخی زد و روی قله قیمتی ۴,۹۴۸ دلار ایستاد؛ هدف بعدی ۵,۰۰۰ دلار

اتریوم رکورد تاریخی زد و روی قله قیمتی ۴,۹۴۸ دلار ایستاد؛ هدف بعدی ۵,۰۰۰ دلار

3 شهریور 1404
گری‌اسکیل، بیت‌وایز و دیگر شرکت‌ها درخواست‌های جدیدی برای راه‌اندازی ETF اسپات ریپل ثبت کردند

گری‌اسکیل، بیت‌وایز و دیگر شرکت‌ها درخواست‌های جدیدی برای راه‌اندازی ETF اسپات ریپل ثبت کردند

3 شهریور 1404
فیلیپین در پی راه‌اندازی صندوق ذخیره راهبردی شامل ۱۰ هزار بیت‌کوین است

فیلیپین صندوق ذخیره راهبردی با ۱۰ هزار بیت‌کوین راه اندازی می کند

3 شهریور 1404
نهنگ‌های رمزارزی به‌دنبال شکار اتریوم هم‌زمان با عقب‌نشینی بیت‌کوین تا نزدیکی ۱۱۲,۷۰۰ دلار

نهنگ‌های رمزارزی به‌دنبال شکار اتریوم هم‌زمان با عقب‌نشینی بیت‌کوین تا نزدیکی ۱۱۲۷۰۰ دلار

3 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir