دانشمندان به تازگی یک مدل زبان بزرگ به نام “Evo” طراحی کردهاند تا دادههای توالی زیستی یا کدهای ژنتیکی را تفسیر کند.
به گزارش تکناک، دانشمندان مؤسسه Arc، نسخه 1.0 این مدل را بر اساس اطلاعات ژنومی آموزش دادهاند، همچنین به جای کلمات، با میلیونها میکروب کار میکند. ژنوم شامل توالیهایی از DNA، RNA و پروتئینها است.
این مدل هوش مصنوعی که مشابه مدلهای زبان بزرگ مثل Google Gemini و ChatGPT عمل میکند، قادر است دادههای زیستی زیادی را پردازش کند.
یکی از ویژگیهای جالب این است که پیشبینی میکند تغییرات کوچک در توالی DNA یا RNA چگونه میتواند روی عملکرد کلی یک موجود تأثیر بگذارد. این توانایی میتواند برای پژوهشگران بسیار مفید باشد.
اگرچه مدل زبان بزرگ Evo هنوز در مراحل ابتدایی قرار دارد و نمیتواند دادههای انسانی را پردازش کند، اما میتواند به دانشمندان کمک کند تا عملکرد توالیهای DNA و RNA را بهتر درک کنند و حتی ممکن است سرعت پیشرفت در زیستشناسی را بیشتر نماید.
به گفته محققان این پروژه، Evo یک گام بزرگ به جلو در درک و مهندسی زیستشناسی است.
فهرست مطالب
ورود هوش مصنوعی به زیستشناسی با Evo
دانشمندان توانستهاند با این مدل هوش مصنوعی سریع و دقیق، ۲.۷ میلیون ژنوم پروکاریوت (میکروبها) و فاژها را تجزیه و تحلیل کنند. این مدل میتواند پیشبینی نماید و حتی توالیهای ژنتیکی جدید بسازد.
بر اساس مقالهای که در مجله Science منتشر شده است، حتی سادهترین ژنومهای میکروبی هم بسیار پیچیده هستند. این پیچیدگی میتواند چالش بزرگی برای استفاده از هوش مصنوعی در زیستشناسی باشد.
با وجود این، محققان میگویند که این مدل توانسته است درک خوبی از کد ژنتیکی پیچیده موجودات زنده از DNA تا کل ژنومها به دست آورد و این کار را با استفاده از میکروبها به عنوان نقطه شروع انجام داده است.
این مدل هوش مصنوعی میتواند پیشبینی کند که تغییرات کوچک در DNA چگونه روی تناسب یک ارگانیسم تأثیر میگذارد، همچنین توالیهای واقعی مشابه ژنوم تولید کند و سیستمهای بیولوژیکی جدید طراحی نماید.
به عنوان مثال، میتواند سیستمهای CRISPR مصنوعی و ترانسپوزونهای IS200/IS605 را در آزمایشگاه تأیید کند.
هر جفت باز DNA در ژنومها مانند یک کلمه عمل میکند. Evo با استفاده از آموزشهای قبلی خود این توالیها را تحلیل مینماید و میتواند نتایج را پیشبینی کند یا حتی توالیهای جدیدی بنویسد.
مهندسان، مدل زبان بزرگ Evo را به شکلی طراحی کردهاند که دو جنبه پیچیده و اساسی زیستشناسی را پوشش دهد. یکی ترکیب DNA، RNA و پروتئینها در یک کد واحد و قابل پیشبینی است، که جریان اطلاعات زیستی را توضیح میدهد و دیگری درک مقیاسهای مختلف تکامل میباشد.
این به معنای بررسی عملکردهای زیستی در مقیاسهای مختلف است، از مولکولها و مسیرهای بیوشیمیایی گرفته تا سلولها و ارگانیسمها، که همگی حجم زیادی از اطلاعات را به همراه دارند.
دسترسی به زیستشناسی هوشمند با مدل زبان بزرگ Evo
نتایجی که این تحقیق به دست آورده است، امیدوارکننده به نظر میرسد. به عنوان مثال، محققان به کمک مدل Evo توانستهاند مجموعهای از اجزای پروتئینی و RNA تولید نمایند، که از بدن در برابر عفونتهای ویروسی محافظت میکنند.
البته برخی از توالیهای DNA که تولید شدهاند، منطقی نیستند و به نظر میرسد شبیه به یک عکس تار ایجاد کردهاند.
اما این فقط شروع کار است، چون مدل زبان بزرگ Evo نسخه ۱.۰ هنوز به سطح پیچیدگی ژنتیک انسانی نرسیده است.
هرچند این سیستم میتواند یاد بگیرد و حالا که مؤسسه Arc یک روش جدید برای یادگیری ماشینی پیدا کرده است، Evo سریعتر یاد خواهد گرفت. این یک مسیر جدید و نوآورانه برای پیشرفت هوش مصنوعی است.
دیدگاهها 1