شرکت Willow با عرضه اپلیکیشن جدید خود برای iOS، قابلیت تایپ صوتی را وارد مرحله تازهای کرده است.
به گزارش سرویس کامپیوتر و موبایل تکناک، اکنون کاربران iOS میتوانند در تمام اپلیکیشنهای خود تنها با صحبت کردن، تایپ کنند و حتی متن گفتهشده را به صورت مستقیم ویرایش نمایند. این حرکت در زمانی صورت میگیرد که مدلهای مدرن هوش مصنوعی توانایی درک صدای انسان را با دقتی بسیار بالاتر نسبت به گذشته پیدا کردهاند و ابزارهای دیکتهگویی یکی از کاربردهای پربازده این پیشرفت به حساب میآیند.
اپلیکیشن جدید Willow که پیشتر بهعنوان یک ابزار روی Mac شناخته میشد، حالا یک کیبورد کامل iOS را در اختیار کاربر قرار میدهد که عملکردی مشابه Wispr Flow دارد، اما با یک مزیت مهم همراه است. این کیبورد برخلاف Wispr Flow که تنها کیبورد عددی ارائه میدهد، یک کیبورد کامل برای تایپ دارد و به کاربر امکان میدهد هنگام تبدیل صدا به متن، بهراحتی کلمات یا جملههای اشتباه را ویرایش کند. به این ترتیب، کاربر نیازی ندارد که میان کیبوردهای مختلف جابهجا شود و فرایند اصلاح متن بسیار سریعتر انجام میشود. این اپ از صد زبان پشتیبانی میکند و قابلیت تعریف واژگان سفارشی یا ساخت سبکهای نوشتاری مخصوص برای کار، پیامرسانی، ایمیل و سایر دستهها را نیز ارائه میدهد.
شرکت Willow توسط Allan Guo و Lawrence Liu تأسیس شده است؛ دو بنیانگذاری که تحصیلات خود را در Stanford رها کردند تا استارتآپی با تمرکز بر ابزارهای مبتنی بر صدا بسازند. Guo در ابتدا سال ۲۰۲۴ با تیم و ایدهای متفاوت وارد Y Combinator شد؛ ایدهای در حوزه سلامت برای مدیریت مراکز مراقبتی، که در نهایت موفق نشد و شرکت برای یک سال ایدههای مختلف را آزمایش کرد. او توضیح میدهد که هنگام کار روی حوزه سلامت، متوجه استفاده گسترده پزشکان از voice AI scribes شد؛ ابزارهایی که گفتوگوی پزشک و بیمار را ثبت و برای مراحل بعدی فایل و یادداشت تولید میکنند. بازخورد مثبت پزشکان نسبت به این ابزارها، بنیانگذاران Willow را به سمت ساخت یک ابزار مبتنی بر voice AI برای کارکنان دانشی و کاربران عمومی هدایت کرد.

Guo تأکید میکند که ساخت یک AI notetaker دیگر در برنامه شرکت نبود، چرا که بازار این دسته از محصولات بهشدت شلوغ شده است. او بهجای آن، حوزه دیکتهگویی را آیندهدارتر میبیند، چرا که بخش بزرگی از ارتباطات حرفهای خارج از جلسات رسمی انجام میشود. او میگوید که Willow از مجموعه مدلها استفاده میکند و بخش زیادی از انرژی خود را روی تنظیم pipeline متنبهمتن مبتنی بر مدلهای Llama میگذارد تا شخصیسازی و قالببندی متن به بهترین شکل انجام شود.
به گزارش تک کرانچ، شرکت Willow برای عرضه اپلیکیشن نهایی تایپ صوتی، دوره YC خود را به Spring 2025 منتقل کرد و اعلام کرده است که از زمان لانچ، رشد پنجاه درصدی ماهانه را در تعداد کاربران تجربه کرده است. این شرکت چند مشتری سازمانی مانند Uber، Heidi Health و Zeg دارد، که از سرویس Willow برای دیکتهگویی حرفهای استفاده میکنند و قابلیت واژگان سفارشی تیمی برای آنها اهمیت زیادی دارد.
این شرکت تاکنون ۴.۵ میلیون دلار سرمایه از سرمایهگذاران مطرحی از جمله Box Group، Y Combinator، Burst Capital و چند سرمایهگذار شناختهشده دیگر جذب کرده است. Max Mullen، یکی از سرمایهگذاران میگوید که آینده رابطهای کاربری مبتنی بر صدا شکل خواهد گرفت و از چشمانداز بلندمدت Willow برای ساخت یک رابط کنترل رایانه بسیار تحت تأثیر قرار گرفته است. او معتقد است که هنگام استفاده از Willow نیاز به ویرایشهای بسیار کمتری نسبت به سیستم دیکته داخلی کامپیوتر دارد و یکی از قابلیتهای محبوب او، استفاده از دستیار «Hey Willow» روی دسکتاپ برای نوشتن پاسخ ایمیل با لحن شخصی کاربر است.

شرکت Willow اکنون در بازاری رقابتی حضور دارد که بازیگرانی مانند Wispr Flow، Monologue، Aqua، Talktastic، Superwhisper و Betterdication نیز در آن فعال هستند. با وجود این رقابت، مدیران شرکت اعلام کردهاند که در ماههای آینده قصد دارند پلتفرمهای ویندوز و اندروید را نیز پشتیبانی کنند و با افزایش سطح شخصیسازی، تعداد ویرایشهای دستی کاربران را پس از دیکته به حداقل ممکن برسانند.

















