کاربرد هوش مصنوعی در توسعه نرمافزار اپل شامل پیشبینی خطا و نوشتن تست و اصلاح خودکار کدها میشود و سرعت عرضه به بازار را افزایش میدهد.
به گزارش تکناک، اپل در تازهترین اقدام پژوهشی خود سه مطالعه مهم درزمینه کاربرد هوش مصنوعی در توسعه نرمافزار منتشر کرده است. این پژوهشها نشان میدهند که هوش مصنوعی میتواند نهتنها باگها را پیشبینی کند؛ بلکه تستهای نرمافزاری را نیز بنویسد و حتی بهصورت خودکار خطاهای کد را اصلاح کند. این مطالعات تصویری از آینده تولید نرمافزار را ترسیم میکنند که در آن عاملهای هوشمند بهعنوان دستیارهای فعال در کنار توسعهدهندگان فعالیت خواهند کرد.
9to5mac مینویسد که در نخستین پژوهش با عنوان «پیشبینی خطاهای نرمافزاری با مدل Autoencoder Transformer»، اپل مدلی نوآورانه با نام ADE-QVAE-T معرفی کرده است. این مدل برای غلبه بر مشکلات رایج در مدلهای زبانی بزرگ مانند توهمزایی و ضعف در درک زمینه و ازدسترفتن روابط حیاتی میان دادهها طراحی شده است.
پژوهشگران اپل چهار فناوری هوش مصنوعی را در این مدل ترکیب کردهاند: Adaptive Differential Evolution (ADE) برای بهینهسازی روند یادگیری، Quantum Variational Autoencoder (QVAE) برای شناسایی الگوهای عمیقتر در دادهها، یک لایه Transformer برای درک ارتباطات بین الگوها و روش Adaptive Noise Reduction and Augmentation (ANRA) برای پاکسازی و متعادلسازی دادهها.
ویژگی جالب این مدل آن است که بهجای تحلیل مستقیم کد، دادههایی مانند پیچیدگی و اندازه و ساختار کد را بررسی میکند تا الگوهایی را بیابد که احتمال بروز باگ را نشان میدهند. در آزمون انجامشده با مجموعهداده Kaggle، مدل ADE-QVAE-T دقتی معادل ۹۸٫۰۸ درصد، صحت ۹۲٫۴۵ درصد، یادآوری ۹۴٫۶۷ درصد و امتیاز F1 برابر ۹۸٫۱۲ درصد را کسب کرده است. این نتایج نشان میدهد که مدل مذکور توانسته است با دقت بسیار زیاد خطاها را تشخیص دهد و از هشدارهای اشتباه جلوگیری کند.

در دومین پژوهش با عنوان «Agentic RAG برای تست خودکار نرمافزار»، تیم تحقیقاتی اپل بر مشکل بزرگ دیگری در فرایند توسعه تمرکز کردهاند: صرف زمان زیاد مهندسان کیفیت برای ساخت و نگهداری تستهای نرمافزاری. آنان سیستمی را طراحی کردهاند که با استفاده از مدلهای زبانی بزرگ (LLM) و عاملهای خودکار (AI Agents) میتواند بهطور مستقل برنامههای تست و گزارشهای اعتبارسنجی و مستندات مرتبط را تولید و مدیریت کند؛ درحالیکه ارتباط کامل میان الزامات و منطق تجاری و نتایج حفظ میشود.
سیستم مذکور میتواند فرایند طراحی تست را خودکار و تا ۴۰ درصد از زمان مهندسان کیفیت را آزاد کند. نتایج اولیه این پژوهش بسیار امیدوارکننده بود؛ دقت سیستم از ۶۵ درصد به ۹۴٫۸ درصد افزایش یافت، زمان تست تا ۸۵ درصد کاهش پیدا کرد، کارایی مجموعه تستها نیز ۸۵ درصد بهبود یافت و درنهایت صرفهجویی ۳۵ درصدی در هزینهها حاصل شد که به تسریع دوماهه در زمان عرضه به بازار منجر شد.
بااینحال، پژوهشگران تأکید کردند که این چهارچوب فعلاً فقط در حوزه سیستمهای کارمندان و مالی و محیطهای SAP آزمایش شده است و برای تعمیم آن به حوزههای دیگر به تحقیقات بیشتر نیاز است.
در سومین پژوهش، اپل بلندپروازانهترین پروژه خود را معرفی کرده است: سامانهای به نام SWE-Gym که برای آموزش عاملهای هوشمند طراحی شده است تا بتوانند کد را بخوانند و ویرایش و خطاها را بهصورت خودکار برطرف کنند. SWE-Gym شامل ۲٬۴۳۸ وظیفه واقعی پایتون از یازده مخزن متنباز است و هر وظیفه محیط اجرایی و مجموعهتست اختصاصی دارد تا عاملها بتوانند در شرایطی نزدیک به واقعیت، کدنویسی و اشکالزدایی را تمرین کنند.
نسخهای سبکتر به نام SWE-Gym Lite نیز با ۲۳۰ وظیفه سادهتر ساخته شده است تا فرایند آموزش سریعتر و کمهزینهتر انجام شود. نتایج نشان میدهد عاملهایی که با SWE-Gym آموزش دیدهاند، توانستهاند ۷۲٫۵ درصد از وظایف را با موفقیت حل کنند که بیش از ۲۰ واحد درصد بهتر از بهترین مدلهای قبلی است. SWE-Gym Lite نیز زمان آموزش را تقریباً نصف کرده است؛ هرچند بهدلیل سادگی وظایف، برای آزمایش مدلها در پروژههای پیچیدهتر مناسب نیست.
این سه پژوهش نشان میدهد که اپل درحال ترسیم آیندهای است که در آن توسعه نرمافزار با کمک هوش مصنوعی متحول میشود؛ آیندهای که در آن پیشبینی باگها و نوشتن تستها و حتی رفع خودکار خطاها به بخشی طبیعی از چرخه مهندسی نرمافزار تبدیل خواهد شد.