تحول در تایپ صوتی با اپلیکیشن جدید Willow برای iOS

شرکت Willow با عرضه اپلیکیشن جدید خود برای iOS، قابلیت تایپ صوتی را وارد مرحله‌ تازه‌ای کرده است.

به گزارش سرویس کامپیوتر و موبایل تک‌ناک، اکنون کاربران iOS می‌توانند در تمام اپلیکیشن‌های خود تنها با صحبت کردن، تایپ کنند و حتی متن گفته‌شده را به صورت مستقیم ویرایش نمایند. این حرکت در زمانی صورت می‌گیرد که مدل‌های مدرن هوش مصنوعی توانایی درک صدای انسان را با دقتی بسیار بالاتر نسبت به گذشته پیدا کرده‌اند و ابزارهای دیکته‌گویی یکی از کاربردهای پربازده این پیشرفت به حساب می‌آیند.

اپلیکیشن جدید Willow که پیش‌تر به‌عنوان یک ابزار روی Mac شناخته می‌شد، حالا یک کیبورد کامل iOS را در اختیار کاربر قرار می‌دهد که عملکردی مشابه Wispr Flow دارد، اما با یک مزیت مهم همراه است. این کیبورد برخلاف Wispr Flow که تنها کیبورد عددی ارائه می‌دهد، یک کیبورد کامل برای تایپ دارد و به کاربر امکان می‌دهد هنگام تبدیل صدا به متن، به‌راحتی کلمات یا جمله‌های اشتباه را ویرایش کند. به این ترتیب، کاربر نیازی ندارد که میان کیبوردهای مختلف جابه‌جا شود و فرایند اصلاح متن بسیار سریع‌تر انجام می‌شود. این اپ از صد زبان پشتیبانی می‌کند و قابلیت تعریف واژگان سفارشی یا ساخت سبک‌های نوشتاری مخصوص برای کار، پیام‌رسانی، ایمیل و سایر دسته‌ها را نیز ارائه می‌دهد.

شرکت Willow توسط Allan Guo و Lawrence Liu تأسیس شده است؛ دو بنیان‌گذاری که تحصیلات خود را در Stanford رها کردند تا استارت‌آپی با تمرکز بر ابزارهای مبتنی بر صدا بسازند. Guo در ابتدا سال ۲۰۲۴ با تیم و ایده‌ای متفاوت وارد Y Combinator شد؛ ایده‌ای در حوزه سلامت برای مدیریت مراکز مراقبتی، که در نهایت موفق نشد و شرکت برای یک سال ایده‌های مختلف را آزمایش کرد. او توضیح می‌دهد که هنگام کار روی حوزه سلامت، متوجه استفاده گسترده پزشکان از voice AI scribes شد؛ ابزارهایی که گفت‌وگوی پزشک و بیمار را ثبت و برای مراحل بعدی فایل و یادداشت تولید می‌کنند. بازخورد مثبت پزشکان نسبت به این ابزارها، بنیان‌گذاران Willow را به سمت ساخت یک ابزار مبتنی بر voice AI برای کارکنان دانشی و کاربران عمومی هدایت کرد.

اپلیکیشن جدید Willow برای iOS تایپ صوتی را متحول می کند

Guo تأکید می‌کند که ساخت یک AI notetaker دیگر در برنامه شرکت نبود، چرا که بازار این دسته از محصولات به‌شدت شلوغ شده است. او به‌جای آن، حوزه دیکته‌گویی را آینده‌دارتر می‌بیند، چرا که بخش بزرگی از ارتباطات حرفه‌ای خارج از جلسات رسمی انجام می‌شود. او می‌گوید که Willow از مجموعه‌ مدل‌ها استفاده می‌کند و بخش زیادی از انرژی خود را روی تنظیم pipeline متن‌به‌متن مبتنی بر مدل‌های Llama می‌گذارد تا شخصی‌سازی و قالب‌بندی متن به بهترین شکل انجام شود.

به گزارش تک کرانچ، شرکت Willow برای عرضه اپلیکیشن نهایی تایپ صوتی، دوره YC خود را به Spring 2025 منتقل کرد و اعلام کرده است که از زمان لانچ، رشد پنجاه درصدی ماهانه را در تعداد کاربران تجربه کرده است. این شرکت چند مشتری سازمانی مانند Uber، Heidi Health و Zeg دارد، که از سرویس Willow برای دیکته‌گویی حرفه‌ای استفاده می‌کنند و قابلیت واژگان سفارشی تیمی برای آنها اهمیت زیادی دارد.

این شرکت تاکنون ۴.۵ میلیون دلار سرمایه از سرمایه‌گذاران مطرحی از جمله Box Group، Y Combinator، Burst Capital و چند سرمایه‌گذار شناخته‌شده دیگر جذب کرده است. Max Mullen، یکی از سرمایه‌گذاران می‌گوید که آینده رابط‌های کاربری مبتنی بر صدا شکل خواهد گرفت و از چشم‌انداز بلندمدت Willow برای ساخت یک رابط کنترل رایانه بسیار تحت تأثیر قرار گرفته است. او معتقد است که هنگام استفاده از Willow نیاز به ویرایش‌های بسیار کمتری نسبت به سیستم دیکته داخلی کامپیوتر دارد و یکی از قابلیت‌های محبوب او، استفاده از دستیار «Hey Willow» روی دسکتاپ برای نوشتن پاسخ ایمیل با لحن شخصی کاربر است.

تایپ صوتی حرفه‌ای با اپلیکیشن جدید Willow

شرکت Willow اکنون در بازاری رقابتی حضور دارد که بازیگرانی مانند Wispr Flow، Monologue، Aqua، Talktastic، Superwhisper و Betterdication نیز در آن فعال‌ هستند. با وجود این رقابت، مدیران شرکت اعلام کرده‌اند که در ماه‌های آینده قصد دارند پلتفرم‌های ویندوز و اندروید را نیز پشتیبانی کنند و با افزایش سطح شخصی‌سازی، تعداد ویرایش‌های دستی کاربران را پس از دیکته به حداقل ممکن برسانند.