Open Sora با گرافیک RTX 3090 ویدئو ۴ ثانیه‌ای تولید می‌کند

Open Sora

Open Sora با استفاده از کارت گرافیک RTX 3090، ویدئوهای باکیفیت را به‌طور خودکار تولید، اما محدودیت حافظه آن را به کلیپ‌های 4 ثانیه‌ای با کیفیت 240p محدود می‌کند.

به‌گزارش تک‌ناک، بک‌پروپ، ارائه‌دهنده‌ی ابری پردازنده‌ی گرافیکی (GPU) برای محاسبات هوش مصنوعی، اخیراً با استفاده از محیطی مبتنی‌بر Open Sora v1.2، ویدئوهای تولید‌شده با هوش مصنوعی را به‌نمایش گذاشته است. این شرکت چهار نمونه را با استفاده از ورودی‌های مختلف نشان داده است و نتایج به‌طور کلی کیفیت متوسطی دارند. با‌این‌حال، نیازمندی‌های سخت‌افزاری حتی برای این نمونه‌های نسبتاً ساده بسیار زیاد است.

تامزهاردور به‌نقل از پست وبلاگی بک‌پروپ می‌نویسد که روی کارت گرافیک RTX 3090، می‌توان ویدئوهایی تا کیفیت 240p و مدت‌زمان 4 ثانیه تولید کرد. مقادیر بیشتر از آن نیازمند حافظه‌ای بیش از ظرفیت کارت است. تولید ویدئو 2 ثانیه‌ای حدود 30 ثانیه و ویدئو 4 ثانیه‌ای حدود 60 ثانیه زمان می‌برد. ویدئو 4 ثانیه‌ای در کل حدود ده‌میلیون پیکسل دارد.

Open Sora

کارت گرافیک قدرتمند RTX 3090 انویدیا زمانی پیشتاز میدان بود و همچنان نیز عملکرد رضایت‌بخشی ارائه می‌دهد. این کارت گرافیک از ۲۴ گیگابایت حافظه‌ی GDDR6X بهره می‌برد که عنصری مهم برای بسیاری از پردازش‌های هوش مصنوعی پیچیده به‌شمار می‌رود. این میزان حافظه برای اجرای تمامی بازی‌های جدید کافی است و حتی با ظرفیت مدل جدیدتر RTX 4090 برابری می‌کند؛ اما همچنان برای تولید ویدئو با Open Sora محدودیت محسوب می‌شود.

در‌حال‌حاضر، تنها راه دستیابی به حافظه‌ی بیشتر در کارت گرافیک، استفاده از سخت‌افزار حرفه‌ای یا سرورهای دیتاسنتر است. کارت گرافیک تک‌واحدی H100 PCIe انویدیا می‌تواند تا ۹۴ گیگابایت حافظه‌ی HBM2e داشته باشد. این مقدار برای مدل جدیدتر H200 SXM-Only انویدیا با حافظه‌ی HBM3e به ۱۴۱ گیگابایت هم می‌رسد.

این کارت‌های گرافیک‌ دیتاسنتر جدا از ظرفیت عظیم حافظه که بیش از سه برابر کارت‌های گرافیک‌ قدرتمند مصرفی است، از پهنای باند حافظه‌ی گسترده‌تری نیز برخوردارند. نسل بعدی حافظه‌های HBM3 مایکرون قرار است به سرعت انتقال ۲ ترابایت‌بر‌ثانیه دست پیدا کند. قیمت آداپترهای H100 PCIe در بازار خرده‌فروشی حدود ۳۰ هزار دلار است؛ هرچند توزیع‌کنندگان مجاز ممکن است آن‌ها را با کمی تخفیف ارائه دهند.

بیشتر بخوانید:

با بودجه‌ی بسیار معقولانه‌تر ۶,۸۰۰ دلار می‌توانید کارت گرافیک RTX 6000 Ada Generation انویدیا با ۴۸ گیگابایت حافظه تهیه کنید. این میزان حافظه دو برابر کارت‌های گرافیک مصرفی دیگر است و احتمالاً برای تولید ویدئو با رزولوشن ۵۱۲ در ۵۱۲ هرچند با طول‌های نسبتاً کوتاه کافی خواهد بود.

Open Sora

در‌حالی‌که گزینه‌های دیگری مانند H100 NVL وجود دارد، پیدا‌کردن نسخه‌ی دوگانه آن دشوار است. با‌این‌حال، شرکت Newegg سرور دوگانه Supermicro Grace Hopper را با قیمت ۷۵ هزار دلار ارائه می‌دهد که ۱۸۶ گیگابایت حافظه‌ی مشترک VRAM در‌اختیار شما قرار می‌دهد. با چنین ظرفیتی احتمالاً ساخت محتوای ویدئویی با کیفیت 720p امکان‌پذیر باشد.

بدیهی است که بزرگ‌ترین مانع برای تهیه هر‌یک از کارت‌های گرافیک‌ ذکر‌شده قیمت آن‌هاست. قیمت پایه‌ی کارت گرافیک RTX 4090 از ۱,۵۹۹ دلار شروع می‌شود که برای اکثر مصرف‌کنندگان مبلغ زیادی است. کارت‌های گرافیک‌ حرفه‌ای چهار برابر این مقدار و کارت‌های گرافیک‌ هوش مصنوعی مخصوص دیتاسنترها تا ۲۰ برابر گران‌تر هستند.

هرچند رقبای اینتل (Gaudi) و ای‌ام‌دی (MI300X) برای H100 وجود دارند، انتظار می‌رود قیمت Gaudi اینتل همچنان بیش از ۱۵ هزار دلار و قیمت MI300X ای‌ام‌دی بین ۱۰ هزار تا ۱۵ هزار دلار باشد. علاوه‌بر‌این، تراشه‌ی هوش مصنوعی Sohu AI هم وجود دارد که گفته می‌شود تا ۲۰ برابر از H100 سریع‌تر است؛ ولی هنوز در‌دسترس قرار نگرفته است.

حتی اگر بودجه‌ی لازم را داشته باشید، برای تهیه‌ی اکثر این کارت‌های گرافیک‌ نمی‌توانید به نزدیک‌ترین فروشگاه کامپیوتر مراجعه کنید؛ زیرا زمان انتظار سفارش‌های بزرگ H100 دو تا سه ماه از زمان پرداخت تا زمان رسیدن به دست شما است.

همچنین، نباید نیازمندی‌های برق را فراموش کنید. نسخه‌ی PCIe کارت گرافیک H100 حداکثر ۳۵۰ وات برق مصرف می‌کند؛ بنابراین، اگر ۲۴ ساعته در حال تولید ویدئو باشد، سالانه درحدود ۳ مگاوات‌ساعت انرژی مصرف می‌کند که با در‌نظر‌گرفتن قیمت سخت‌افزار، هزینه‌ای تقریباً ۳۰۰ دلاری در سال به‌همراه دارد.

راه‌اندازی و اجرای Open Sora نیز کار ساده‌ای نیست؛ به‌خصوص اگر بخواهید آن را روی سیستم‌هایی غیر از انویدیا اجرا کنید. همچنین، مانند بسیاری دیگر از تولیدکنندگان هوش مصنوعی، سؤالات زیادی درباره‌ی حق تکثیر و استفاده‌ی منصفانه همچنان بدون پاسخ باقی مانده است. بااین‌همه حتی با بهترین سخت‌افزار موجود، به‌نظر می‌رسد برای ساخت فیلم‌های سینمایی حماسی، به چیزی فراتر از هوش مصنوعی مولد نیاز داشته باشیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.