استارتآپ SandboxAQ با پشتیبانی انویدیا، روز چهارشنبه مجموعه دادهای بزرگ شامل ۵.۲ میلیون ساختار ترکیبی از پروتئین و دارو توسط هوش مصنوعی منتشر کرده است که میتواند نقشه دارویی برای کشف سریعتر درمانها باشد.
به گزارش تکناک، این مجموعه که SAIR نام دارد، شامل دادههای واقعی است و به صورت رایگان در اختیار پژوهشگران قرار میگیرد. این کار میتواند کشف دارو را در مراحل اولیه، سریعتر و دقیقتر کند.
در این مجموعه برای هر ترکیب، اطلاعات واقعی درباره میزان اثربخشی دارو ثبت شده است. این اطلاعات میتوانند به پژوهشگران کمک کنند تا روند کشف داروهای جدید را سریعتر و دقیقتر پیش ببرند.

فهرست مطالب
پیشبینی دقیقتر اتصال دارو به پروتئین هدف
پیش از ورود یک داروی جدید به مراحل بالینی، یکی از چالشهای اصلی برای دانشمندان این است که آیا مولکول دارویی مورد نظر بهدرستی به پروتئین هدف خود میچسبد یا خیر.
این اتصال تعیین میکند که دارو قادر به مهار یا اصلاح فرایند زیستی خاصی مانند گسترش بیماری میباشد یا خیر.
کاهش هزینه و زمان با نقشه دارویی هوش مصنوعی
این بررسی در روشهای سنتی، با استفاده از ساختارهای سهبعدی پروتئین و آزمایش هزاران مولکول در آزمایشگاه انجام میشود؛ فرایندی که بسیار زمانبر و پرهزینه است.
دانشمندان برای رفع این چالش، با بهرهگیری از چیپهای قدرتمند انویدیا، ساختارهای ترکیبی را به صورت محاسباتی و مبتنی بر دادههای واقعی تولید کردهاند. این ساختارها از طریق مدل جدید Boltz-1x co-folding بهدست آمدهاند و از مشاهدات مستقیم آزمایشگاهی نیستند.
برای هر جفت پروتئین-دارو، پنج حالت سهبعدی مختلف تولید شده است و فقط دقیقترین حالتها وارد نسخه نهایی مجموعه داده SAIR شدهاند.
پشتوانهای برای آموزش مدلهای هوش مصنوعی جدید
مدلهای هوش مصنوعی مانند AlphaFold2 و نسخههای جدیدتر مثل AlphaFold3 و Boltz-2 در پیشبینی ساختار سهبعدی و حالت اتصال پیشرفت زیادی داشتهاند، اما در مواجهه با پروتئینها یا مولکولهایی که خارج از دادههای آموزشی هستند، هنوز ضعفهایی دارند.
ایجاد دادههای جدید به صورت آزمایشگاهی بسیار پرهزینه است. اینجا است که SAIR با تولید دادههای مصنوعی از منابع عمومی مانند ChEMBL و BindingDB، جایگزینی کارآمد و در دسترس ارائه میدهد.

دسترسی رایگان پژوهشگران به نقشه دارویی هوش مصنوعی
استارتآپ SandboxAQ اعلام کرده است که مجموعه داده SAIR را به صورت رایگان در اختیار پژوهشگران قرار میدهد. همزمان، مدلهای اختصاصی آموزشدیده بر پایه این دادهها را به صورت تجاری عرضه خواهد کرد.
این ابزارها میتوانند به صورت مجازی، با دقت دنیای واقعی، عملکرد آزمایشگاهها را شبیهسازی کند و فرایند کشف دارو را سرعت بخشند.