گوگل مدل صوتی Chirp 3 را به پلتفرم Vertex AI اضافه کرد. این مدل پیشرفته برای پردازش گفتار و تبدیل متن به گفتار و تشخیص صوتی بهینه شده است.
به گزارش تکناک، گوگل اعلام کرد که مدل صوتی Chirp 3 را از هفته آینده به پلتفرم Vertex AI اضافه خواهد کرد. این مدل شامل فناوریهای تبدیل گفتار به متن و تبدیل متن به گفتار با کیفیت مطلوب است و میتواند تحولی بزرگ در توسعه اپلیکیشنهای مبتنی بر صوت ایجاد کند.
فهرست مطالب
تمرکز جدید بر هوش مصنوعی صوتی
درحالیکه تاکنون بیشتر تمرکز هوش مصنوعی مولد بر تولید متن و تصاویر و محتواهای دیگر بوده است، حالا به نظر میرسد که موج جدید این فناوری روی صوت متمرکز شده و این تحول با سرعت زیادی در حال شکلگیری است. هفته گذشته، گوگل اعلام کرد که مدل Chirp 3 هشت صدای جدید را برای ۳۱ زبان ارائه خواهد کرد. این مدل میتواند در کاربردهایی مانند دستیارهای صوتی، تولید کتابهای صوتی، توسعه عوامل پشتیبانی و صداگذاری برای ویدئوها استفاده شود. این خبر در جریان رویدادی در دفاتر دیپمایند گوگل در لندن اعلام شد.
رقابت در حوزه هوش مصنوعی صوتی
به نقل از تککرانچ، در کنار گوگل دیگر شرکتهای فعال در حوزه هوش مصنوعی نیز در حال توسعه فناوریهای مشابه هستند. استارتاپ Sesame که اپلیکیشنهای پرطرفدار Maya و Miles را توسعه داده است، هفته گذشته مدل جدیدی را معرفی کرد که به توسعهدهندگان امکان میدهد تا اپلیکیشنها و خدمات سفارشی خود را با استفاده از این فناوری ایجاد کنند.
محدودیتهای استفاده از Chirp 3
با وجود پیشرفتهای جدید، گوگل اعلام کرده است که برای جلوگیری از سوءاستفاده، محدودیتهایی در استفاده از Chirp 3 اعمال خواهد شد. توماس کوریان، مدیرعامل Google Cloud، در نشست خبری تأکید کرد که این شرکت در حال همکاری با تیم ایمنی خود برای بررسی راهکارهای کنترل و نظارت بر استفاده از این فناوری است.
در همین حال، ElevenLabs، استارتاپ فعال درزمینه خدمات صوتی مبتنیبر هوش مصنوعی، تاکنون صدهامیلیون دلار سرمایه جذب کرده است تا دامنه فعالیتهای خود را در این حوزه گسترش دهد.

توسعه Vertex AI و آینده مدلهای هوش مصنوعی
با اضافهشدن Chirp 3، پلتفرم Vertex AI در کنار سایر مدلهای هوش مصنوعی پیشرفته گوگل ازجمله نسخههای جدید جمنای و مدل تولید تصویر Imagen و ابزار ویدئوسازی Veo 2 قرار میگیرد. بااینحال، هنوز مشخص نیست که Chirp 3 تا چه اندازه میتواند صدایی واقعی و مشابه با صدای انسان ارائه دهد. برخی شرکتهای دیگر مانند Sesame در این زمینه عملکرد چشمگیری داشتهاند. باوجوداین، دمیس هاسابیس، مدیرعامل دیپمایند، تأکید کرده است که توسعه این فناوری مسیری طولانی و تدریجی است.
نگاهی به تاریخچه Vertex AI
پلتفرم Vertex AI در سال ۲۰۲۱ بهعنوان بستری برای توسعه خدمات یادگیری ماشینی در فضای ابری راهاندازی شد. این اقدام پیشاز موج گسترده علاقه به هوش مصنوعی مولد، بهویژه پساز معرفی خدمات GPT شرکت OpenAI، انجام شد. از آن زمان، گوگل توجه بیشتری به Vertex AI نشان داده و تلاش کرده است تا در رقابت با شرکتهایی مانند مایکروسافت و آمازون که ابزارهای مشابهی را برای توسعهدهندگان ارائه میدهند، جایگاه خود را تقویت کند.
Vertex AI علاوهبر امکان توسعه هوش مصنوعی مولد برپایه Gemini، قابلیتهایی مانند دستهبندی دادهها و آموزش مدلها و استقرار آنها در محیط عملیاتی را نیز فراهم میکند.
آینده Chirp و رقابت با Alexa
گوگل سالهاست که روی فناوری صوتی Chirp کار میکند و این نام را ابتدا بهعنوان اسم رمزی برای پروژهای در رقابت با الکسا شرکت آمازون انتخاب کرده بود. با ورود Chirp 3 به Vertex AI، به نظر میرسد که گوگل قصد دارد این فناوری را به بخشی مهم از اکوسیستم هوش مصنوعی خود تبدیل کند. حال باید دید که این شرکت میتواند در رقابت با دیگر غولهای فناوری، جایگاه برتری در حوزه هوش مصنوعی صوتی به دست آورد یا خیر.