محققان مدل هوش مصنوعی جدیدی به نام The AI Scientist توسعه دادهاند که میتواند بهطور خودکار ایدههای پژوهشی تولید کند و آزمایشها را انجام دهد و مقالههای علمی بنویسد.
بهگزارش تکناک، پژوهشگرانی از شرکت Sakana AI، مؤسسهی FLAIR، دانشگاه آکسفورد، دانشگاه بریتیش کلمبیا، مؤسسهی وکتور و CIFAR کانادا، سیستمی توسعه دادهاند که به خودکارسازی کامل کشف علمی میپردازد.
این سیستم با استفاده از مدلهای زبانی بزرگ (LLMs) ایدههای تحقیقاتی را بهطور خودکار تولید میکند و آزمایشها را انجام میدهد و مقالههای علمی را مینویسد. The AI Scientist پیشرفتی مهم در جستوجوی تحقیقات مستقل است که تمام جنبههای فرایند علمی را در جریان کاری یکپارچه ادغام و افزایش کارایی و دسترسی عمومی به تحقیقات علمی و امکان انجام مطالعات پیشرفته را میسر میکند.
The AI Scientist در سه مرحله عمل میکند:
- تولید ایده
- تکرار آزمایشها
- نوشتن مقاله
هوش مصنوعی یادشده با تولید ایدههای تحقیقاتی متنوع با استفاده از LLMها که از اصول محاسبات تکاملی الهام گرفتهاند، شروع میکند. این ایدهها پس از مرور ادبیات و ارزیابی نوآوری فیلتر میشوند تا اصالت و قابلیت اجرای آنها تضمین شود.
پس از انتخاب ایده، The AI Scientist از دستیار کدنویسی به نام Aider استفاده میکند تا تغییرات کد لازم را اعمال و آزمایشها را اجرا کند. Aider کد را اجرا میکند و براساس نتایج آزمایشها آن را بهطور مداوم بهبود میبخشد که به استحکام و قابلیت اعتماد فرایند تحقیق کمک میکند.
درنهایت، The AI Scientist نتایج را با استفاده از LaTeX به مقالهی علمی تبدیل میکند و دادههای واقعی آزمایشگاهی و استنادها را برای تضمین دقت و مرتبطبودن نتایج بهکار میبرد.
عملکرد برجستهی The AI Scientist به تولید مقالههایی تحقیقاتی منجر شده است که استانداردهای کیفی کنفرانسهای برتر یادگیری ماشین را برآورده میکند یا حتی از آن فراتر میرود. بهعنوان مثال، این سیستم هر مقالهی علمی کامل را با هزینهی تقریبی ۱۵ دلار تولید میکند.
در ارزیابی این مقالهها، بازبین خودکار The AI Scientist که براساس مدل GPT-4o است، دقت متوازن ۷۰ درصدی را در ارزیابی کیفیت تحقیقات بهدست آورده که بسیار نزدیک به امتیازهای بازبینهای انسانی با امتیاز ۷۳ درصد است.
توانایی سیستم در تولید صدها مقالهی با کیفیت متوسط در یک هفته نشاندهندهی قابلیتهای فراوان آن برای تسریع فرایند تحقیق است. برای نمونه، یکی از نتایج برجسته نشان داد که در آزمایش مدلسازی انتشار، ۱۲/۸ درصد کاهش در KL divergence حاصل شده است که معیاری مهم برای ارزیابی کیفیت دادههای تولیدی است. این چهارچوب امکان تکرار مداوم ایدهها را فراهم کرد و خروجی تحقیقاتی بعدی را براساس بازخورد از آزمایشهای قبلی بهبود بخشید.
توسعهی The AI Scientist گامی حیاتی برای خودکارسازی تحقیقات علمی است. این چهارچوب با رفع محدودیتهای سیستمهای هوش مصنوعی سنتی، امکانات جدیدی برای نوآوری در زمینههای مختلف علمی فراهم میکند.
نسخهی فعلی The AI Scientist وعدههای بزرگی میدهد؛ ولی اصلاحات مداوم برای بهبود عملکرد آن، بهخصوص در برخورد با مسائل پیچیدهتر دنیای واقعی، ضروری خواهد بود. بااینحال، The AI Scientist نمایانگر مسیری پیشگامانه بهسمت تحقیقات کاملاً مستقل و مبتنیبر هوش مصنوعی است و نگاهی به آیندهای ارائه میدهد که در آن ماشینها میتوانند بهطور مستقل پیشرفتهای علمی را در سطح جهانی هدایت کنند.