شرکت گوگل از هوش مصنوعی DolphinGemma رونمایی کرده که با هدف کمک به دانشمندان برای بررسی نحوه ارتباط دلفینها و فهم معنای صداهای آنها توسعه یافته است.
به گزارش تکناک، پروژه DolphinGemma با همکاری محققان مؤسسه فناوری جورجیا (Georgia Tech) و پروژه دلفین وحشی (WDP) به رهبری دکتر دنیس هرزینگ در حال انجام است. هدف اصلی WDP، مطالعه غیرتهاجمی و میدانی طولانیمدت روی دلفینهای خالدار آتلانتیک (Stenella frontalis)، از جمله مستندسازی رفتارهای طبیعی، ساختارهای اجتماعی و الگوهای صوتی آنها است.
پروژه WDP طی سالها، دادههایی گردآوری کرده است که ارتباط میان برخی صداها و رفتارهای خاص را نشان میدهد. به عنوان نمونه:
- صدای سوتهای اختصاصی (Signature Whistles)، که نقش «نام» را داشتهاند و مادران و تولهها با آن همدیگر را پیدا میکنند.
- صداهای انفجاری به شکل «جیغ»، که در هنگام درگیری شنیده میشود.
- کلیکهایی به صورت «وزوز»، که هنگام جفتگیری یا تعقیب کوسهها شنیده میشود.
شرکت گوگل میگوید که تحلیل این ساختار پیچیده ارتباطی دلفینها کار عظیمی است، اما دادههای برچسبخورده WDP فرصت منحصربهفردی برای هوش مصنوعی فراهم میکنند. اینجا است که DolphinGemma وارد میشود.
این مدل زبانی بزرگ با استفاده از SoundStream tokenizer گوگل، صداهای دلفین را به واحدهای صوتی قابل پردازش تبدیل و آنها را وارد یک معماری مدلسازی ویژه میکند، که میتواند توالیهای پیچیده را تحلیل نماید. هوش مصنوعی DolphinGemma با حدود ۴۰۰ میلیون پارامتر، به حدی سبک است که روی گوشیهای پیکسل به صورت بومی اجرا میشود. محققان WDP هم از همین گوشیها در میدان استفاده میکنند.

برخلاف دیگر مدلهای یادگیری ماشینی که با متن یا تصویر سر و کار دارند، DolphinGemma فقط با صوت کار میکند؛ یعنی صدا دریافت میکند و صدا تولید مینماید. ساختار آن بهگونهای طراحی شده است که مانند پیشبینی کلمات بعدی در مدلهای زبانی، صدای بعدی در توالی صوتی دلفینها را پیشبینی کند. دکتر هرزینگ عملکرد آن را برای سوتها، کلیکها و پالسهای انفجاری دلفینها، با سیستم Autocomplete مقایسه میکند.
پیش از ورود گوگل به این عرصه، WDP از سیستمی به نام CHAT (مخفف Cetacean Hearing Augmentation Telemetry) برای برقراری ارتباط ابتدایی دوطرفه با دلفینها استفاده میکرد. این سیستم با تولید سوتهای مصنوعی و مرتبط کردن آنها با اشیایی مثل سارگاسوم، چمن دریایی یا روسریهایی که دلفینها دوست داشتند، سعی میکرد واژگان مشترکی ایجاد کند. امید آن بود که دلفینها با تقلید این صداهای ساختگی، خواسته خود را ابراز کنند.

جالب اینکه سیستم CHAT با گوشی Pixel 6 اجرا میشد و تحلیل صوتی را در لحظه انجام میداد. حالا در فصل جدید، قرار است از Pixel 9 با سختافزار صوتی پیشرفتهتر و قدرت پردازش بالاتر استفاده شود تا مدلهای یادگیری عمیق و تطبیق الگوها همزمان اجرا شوند.
شرکت گوگل اعلام کرده است که مانند دیگر مدلهای خانواده Gemma، نسخه متنباز هوش مصنوعی DolphinGemma نیز تابستان امسال منتشر خواهد شد تا محققان سراسر جهان بتوانند از آن برای تحلیل دادههای صوتی خود استفاده کنند و درک ما از این پستانداران هوشمند دریایی را افزایش دهند.
گفتنی است که خانواده مدلهای Gemma شامل مدلهایی سبک با مقیاسهای ۱، ۴، ۱۲ و ۲۷ میلیارد پارامتر است.