با Azure AI Speech صدای هوش مصنوعی خود را بسازید

مایکروسافت به کاربران راهی ارائه می‌کند تا با استفاده از Azure AI Speech صدای سفارشی هوش مصنوعی خود را بسازند.

به‌گزارش تک‌ناک، مایکروسافت قصد دارد به شرکت‌ها و افراد اجازه دهد تا صدایی سفارشی برپایه‌ی هوش مصنوعی یا AI (artificial intelligence : field of computer science and engineering practices for intelligence demonstrated by machines and intelligent agents) ایجاد کنند که می‌تواند برای دوبله در زبان‌های دیگر، بازی‌ها و… استفاده شود. در کنفرانس توسعه‌دهندگان Ignite 2023، بخش خدمات هوش مصنوعی Azure مایکروسافت این ویژگی جدید را با نام Personal Voice معرفی کرد.

مایکروسافت در پست وبلاگی می‌گوید که این افزونه شبیه به توسعه ویژگی صدای عصبی سفارشی فعلی آن در Azure AI Speech است. Personal Voice همان‌طور‌که نامش نشان می‌دهد، متفاوت است؛ زیرا از صدای خودِ فرد استفاده می‌کند تا صداهای مبتنی‌بر هوش مصنوعی را ایجاد کند و سپس می‌تواند برای ساختن صداها در بیش از 100 زبان استفاده شود.

در وبلاگ آمده است:

آماده‌سازی نمونه‌های آموزشی برای ایجاد صدای هوش مصنوعی ممکن است دشوار یا هزینه‌بر باشد. با استفاده از Personal Voice، کاربران می‌توانند با نمونه‌ی صدایی به طول حداقل 60 ثانیه، صدایی مشابه با صدای خود ایجاد کنند.

Azure AI Speech می‌تواند برای ایجاد دستیار صوتی استفاده شود که به‌طور دقیق شبیه به شخصیتی باشد که از Personal Voice برای ساخت چت‌بات هوش مصنوعی استفاده می‌کند. همچنین، گیمرها از آن برای صدا دادن به شخصیت‌های خود همراه با دوبله‌سازی صدای بازیگر به زبان‌های دیگر و… می‌توانند استفاده کنند.

بدیهی است که از این فناوری می‌توان برای ایجاد صدای جعلی از افراد واقعی برای اقدامات غیرقانونی استفاده کرد. مایکروسافت می‌گوید هر‌کسی که با این ویژگی صدای هوش مصنوعی تولید می‌کند، باید بیانیه‌ای ضبط‌شده بگوید که کاربر می‌داند مشتری صدای خود را ایجاد و استفاده خواهد کرد. علاوه‌بر‌این، حداقل در‌حال‌حاضر این ویژگی فقط در مواقع خاص استفاده می‌شود. مایکروسافت می‌گوید:

در برنامه‌هایی که خروجی صوتی را مشتریانی که معیارهای دسترسی محدود را برآورده می‌کنند، محدود و تعریف می‌کنند، صدای محتوای تولید‌شده‌ی کاربران یا محتوای باز و بیشتر را نمی‌خواند.

استفاده از مدل صدا باید در برنامه باقی بماند و خروجی نباید از برنامه منتشرشدنی یا اشتراک‌گذاری‌شدنی باشد. برخی از نمونه‌های برنامه‌هایی که با این توضیحات مطابقت دارند، دستیارهای صوتی در دستگاه‌های هوشمند و شخصی‌سازی صدای شخصیت در بازی هستند.

کاربران باید رهنمودها و کد اخلاقی مایکروسافت را برای استفاده از این فناوری رعایت کنند. در‌حال‌حاضر، این ویژگی فقط در مناطق غرب اروپا و شرق آمریکا و جنوب‌شرق آسیا جهان دردسترس خواهد بود. نسخه‌ی پیش‌نمایش عمومی 1دسامبر۲۰۲۳ به‌صورت زنده راه‌اندازی خواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.