Open Sora با استفاده از کارت گرافیک RTX 3090، ویدئوهای باکیفیت را بهطور خودکار تولید، اما محدودیت حافظه آن را به کلیپهای 4 ثانیهای با کیفیت 240p محدود میکند.
بهگزارش تکناک، بکپروپ، ارائهدهندهی ابری پردازندهی گرافیکی (GPU) برای محاسبات هوش مصنوعی، اخیراً با استفاده از محیطی مبتنیبر Open Sora v1.2، ویدئوهای تولیدشده با هوش مصنوعی را بهنمایش گذاشته است. این شرکت چهار نمونه را با استفاده از ورودیهای مختلف نشان داده است و نتایج بهطور کلی کیفیت متوسطی دارند. بااینحال، نیازمندیهای سختافزاری حتی برای این نمونههای نسبتاً ساده بسیار زیاد است.
تامزهاردور بهنقل از پست وبلاگی بکپروپ مینویسد که روی کارت گرافیک RTX 3090، میتوان ویدئوهایی تا کیفیت 240p و مدتزمان 4 ثانیه تولید کرد. مقادیر بیشتر از آن نیازمند حافظهای بیش از ظرفیت کارت است. تولید ویدئو 2 ثانیهای حدود 30 ثانیه و ویدئو 4 ثانیهای حدود 60 ثانیه زمان میبرد. ویدئو 4 ثانیهای در کل حدود دهمیلیون پیکسل دارد.
کارت گرافیک قدرتمند RTX 3090 انویدیا زمانی پیشتاز میدان بود و همچنان نیز عملکرد رضایتبخشی ارائه میدهد. این کارت گرافیک از ۲۴ گیگابایت حافظهی GDDR6X بهره میبرد که عنصری مهم برای بسیاری از پردازشهای هوش مصنوعی پیچیده بهشمار میرود. این میزان حافظه برای اجرای تمامی بازیهای جدید کافی است و حتی با ظرفیت مدل جدیدتر RTX 4090 برابری میکند؛ اما همچنان برای تولید ویدئو با Open Sora محدودیت محسوب میشود.
درحالحاضر، تنها راه دستیابی به حافظهی بیشتر در کارت گرافیک، استفاده از سختافزار حرفهای یا سرورهای دیتاسنتر است. کارت گرافیک تکواحدی H100 PCIe انویدیا میتواند تا ۹۴ گیگابایت حافظهی HBM2e داشته باشد. این مقدار برای مدل جدیدتر H200 SXM-Only انویدیا با حافظهی HBM3e به ۱۴۱ گیگابایت هم میرسد.
این کارتهای گرافیک دیتاسنتر جدا از ظرفیت عظیم حافظه که بیش از سه برابر کارتهای گرافیک قدرتمند مصرفی است، از پهنای باند حافظهی گستردهتری نیز برخوردارند. نسل بعدی حافظههای HBM3 مایکرون قرار است به سرعت انتقال ۲ ترابایتبرثانیه دست پیدا کند. قیمت آداپترهای H100 PCIe در بازار خردهفروشی حدود ۳۰ هزار دلار است؛ هرچند توزیعکنندگان مجاز ممکن است آنها را با کمی تخفیف ارائه دهند.
بیشتر بخوانید:
با بودجهی بسیار معقولانهتر ۶,۸۰۰ دلار میتوانید کارت گرافیک RTX 6000 Ada Generation انویدیا با ۴۸ گیگابایت حافظه تهیه کنید. این میزان حافظه دو برابر کارتهای گرافیک مصرفی دیگر است و احتمالاً برای تولید ویدئو با رزولوشن ۵۱۲ در ۵۱۲ هرچند با طولهای نسبتاً کوتاه کافی خواهد بود.
درحالیکه گزینههای دیگری مانند H100 NVL وجود دارد، پیداکردن نسخهی دوگانه آن دشوار است. بااینحال، شرکت Newegg سرور دوگانه Supermicro Grace Hopper را با قیمت ۷۵ هزار دلار ارائه میدهد که ۱۸۶ گیگابایت حافظهی مشترک VRAM دراختیار شما قرار میدهد. با چنین ظرفیتی احتمالاً ساخت محتوای ویدئویی با کیفیت 720p امکانپذیر باشد.
بدیهی است که بزرگترین مانع برای تهیه هریک از کارتهای گرافیک ذکرشده قیمت آنهاست. قیمت پایهی کارت گرافیک RTX 4090 از ۱,۵۹۹ دلار شروع میشود که برای اکثر مصرفکنندگان مبلغ زیادی است. کارتهای گرافیک حرفهای چهار برابر این مقدار و کارتهای گرافیک هوش مصنوعی مخصوص دیتاسنترها تا ۲۰ برابر گرانتر هستند.
هرچند رقبای اینتل (Gaudi) و ایامدی (MI300X) برای H100 وجود دارند، انتظار میرود قیمت Gaudi اینتل همچنان بیش از ۱۵ هزار دلار و قیمت MI300X ایامدی بین ۱۰ هزار تا ۱۵ هزار دلار باشد. علاوهبراین، تراشهی هوش مصنوعی Sohu AI هم وجود دارد که گفته میشود تا ۲۰ برابر از H100 سریعتر است؛ ولی هنوز دردسترس قرار نگرفته است.
حتی اگر بودجهی لازم را داشته باشید، برای تهیهی اکثر این کارتهای گرافیک نمیتوانید به نزدیکترین فروشگاه کامپیوتر مراجعه کنید؛ زیرا زمان انتظار سفارشهای بزرگ H100 دو تا سه ماه از زمان پرداخت تا زمان رسیدن به دست شما است.
همچنین، نباید نیازمندیهای برق را فراموش کنید. نسخهی PCIe کارت گرافیک H100 حداکثر ۳۵۰ وات برق مصرف میکند؛ بنابراین، اگر ۲۴ ساعته در حال تولید ویدئو باشد، سالانه درحدود ۳ مگاواتساعت انرژی مصرف میکند که با درنظرگرفتن قیمت سختافزار، هزینهای تقریباً ۳۰۰ دلاری در سال بههمراه دارد.
راهاندازی و اجرای Open Sora نیز کار سادهای نیست؛ بهخصوص اگر بخواهید آن را روی سیستمهایی غیر از انویدیا اجرا کنید. همچنین، مانند بسیاری دیگر از تولیدکنندگان هوش مصنوعی، سؤالات زیادی دربارهی حق تکثیر و استفادهی منصفانه همچنان بدون پاسخ باقی مانده است. بااینهمه حتی با بهترین سختافزار موجود، بهنظر میرسد برای ساخت فیلمهای سینمایی حماسی، به چیزی فراتر از هوش مصنوعی مولد نیاز داشته باشیم.