کاربرد هوش مصنوعی در توسعه نرم‌افزار اپل: از پیش‌بینی باگ تا اصلاح خودکار خطاها

کاربرد هوش مصنوعی در توسعه نرم‌افزار اپل شامل پیش‌بینی خطا و نوشتن تست و اصلاح خودکار کدها می‌شود و سرعت عرضه به بازار را افزایش می‌دهد.

به گزارش تک‌ناک، اپل در تازه‌ترین اقدام پژوهشی خود سه مطالعه مهم درزمینه کاربرد هوش مصنوعی در توسعه نرم‌افزار منتشر کرده است. این پژوهش‌ها نشان می‌دهند که هوش مصنوعی می‌تواند نه‌تنها باگ‌ها را پیش‌بینی کند؛ بلکه تست‌های نرم‌افزاری را نیز بنویسد و حتی به‌صورت خودکار خطاهای کد را اصلاح کند. این مطالعات تصویری از آینده تولید نرم‌افزار را ترسیم می‌کنند که در آن عامل‌های هوشمند به‌عنوان دستیارهای فعال در کنار توسعه‌دهندگان فعالیت خواهند کرد.

9to5mac می‌نویسد که در نخستین پژوهش با عنوان «پیش‌بینی خطاهای نرم‌افزاری با مدل Autoencoder Transformer»، اپل مدلی نوآورانه با نام ADE-QVAE-T معرفی کرده است. این مدل برای غلبه بر مشکلات رایج در مدل‌های زبانی بزرگ مانند توهم‌زایی و ضعف در درک زمینه و ازدست‌رفتن روابط حیاتی میان داده‌ها طراحی شده است.

پژوهشگران اپل چهار فناوری هوش مصنوعی را در این مدل ترکیب کرده‌اند: Adaptive Differential Evolution (ADE) برای بهینه‌سازی روند یادگیری، Quantum Variational Autoencoder (QVAE) برای شناسایی الگوهای عمیق‌تر در داده‌ها، یک لایه Transformer برای درک ارتباطات بین الگوها و روش Adaptive Noise Reduction and Augmentation (ANRA) برای پاک‌سازی و متعادل‌سازی داده‌ها.

ویژگی جالب این مدل آن است که به‌جای تحلیل مستقیم کد، داده‌هایی مانند پیچیدگی و اندازه و ساختار کد را بررسی می‌کند تا الگوهایی را بیابد که احتمال بروز باگ را نشان می‌دهند. در آزمون انجام‌شده با مجموعه‌داده Kaggle، مدل ADE-QVAE-T دقتی معادل ۹۸٫۰۸ درصد، صحت ۹۲٫۴۵ درصد، یادآوری ۹۴٫۶۷ درصد و امتیاز F1 برابر ۹۸٫۱۲ درصد را کسب کرده است. این نتایج نشان می‌دهد که مدل مذکور توانسته است با دقت بسیار زیاد خطاها را تشخیص دهد و از هشدارهای اشتباه جلوگیری کند.

در دومین پژوهش با عنوان «Agentic RAG برای تست خودکار نرم‌افزار»، تیم تحقیقاتی اپل بر مشکل بزرگ دیگری در فرایند توسعه تمرکز کرده‌اند: صرف زمان زیاد مهندسان کیفیت برای ساخت و نگه‌داری تست‌های نرم‌افزاری. آنان سیستمی را طراحی کرده‌اند که با استفاده از مدل‌های زبانی بزرگ (LLM) و عامل‌های خودکار (AI Agents) می‌تواند به‌طور مستقل برنامه‌های تست و گزارش‌های اعتبارسنجی و مستندات مرتبط را تولید و مدیریت کند؛ درحالی‌که ارتباط کامل میان الزامات و منطق تجاری و نتایج حفظ می‌شود.

سیستم مذکور می‌تواند فرایند طراحی تست را خودکار و تا ۴۰ درصد از زمان مهندسان کیفیت را آزاد کند. نتایج اولیه این پژوهش بسیار امیدوارکننده بود؛ دقت سیستم از ۶۵ درصد به ۹۴٫۸ درصد افزایش یافت، زمان تست تا ۸۵ درصد کاهش پیدا کرد، کارایی مجموعه تست‌ها نیز ۸۵ درصد بهبود یافت و درنهایت صرفه‌جویی ۳۵ درصدی در هزینه‌ها حاصل شد که به تسریع دوماهه در زمان عرضه به بازار منجر شد.

با‌این‌حال، پژوهشگران تأکید کردند که این چهارچوب فعلاً فقط در حوزه سیستم‌های کارمندان و مالی و محیط‌های SAP آزمایش شده است و برای تعمیم آن به حوزه‌های دیگر به تحقیقات بیشتر نیاز است.

در سومین پژوهش، اپل بلندپروازانه‌ترین پروژه خود را معرفی کرده است: سامانه‌ای به نام SWE-Gym که برای آموزش عامل‌های هوشمند طراحی شده است تا بتوانند کد را بخوانند و ویرایش و خطاها را به‌صورت خودکار برطرف کنند. SWE-Gym شامل ۲٬۴۳۸ وظیفه واقعی پایتون از یازده مخزن متن‌باز است و هر وظیفه محیط اجرایی و مجموعه‌تست اختصاصی دارد تا عامل‌ها بتوانند در شرایطی نزدیک به واقعیت، کدنویسی و اشکال‌زدایی را تمرین کنند.

نسخه‌ای سبک‌تر به نام SWE-Gym Lite نیز با ۲۳۰ وظیفه ساده‌تر ساخته شده است تا فرایند آموزش سریع‌تر و کم‌هزینه‌تر انجام شود. نتایج نشان می‌دهد عامل‌هایی که با SWE-Gym آموزش دیده‌اند، توانسته‌اند ۷۲٫۵ درصد از وظایف را با موفقیت حل کنند که بیش از ۲۰ واحد درصد بهتر از بهترین مدل‌های قبلی است. SWE-Gym Lite نیز زمان آموزش را تقریباً نصف کرده است؛ هرچند به‌دلیل سادگی وظایف، برای آزمایش مدل‌ها در پروژه‌های پیچیده‌تر مناسب نیست.

این سه پژوهش نشان می‌دهد که اپل درحال ترسیم آینده‌ای است که در آن توسعه‌ نرم‌افزار با کمک هوش مصنوعی متحول می‌شود؛ آینده‌ای که در آن پیش‌بینی باگ‌ها و نوشتن تست‌ها و حتی رفع خودکار خطاها به بخشی طبیعی از چرخه مهندسی نرم‌افزار تبدیل خواهد شد.