فهرست مطالب
پژوهشگران مؤسسه ETH زوریخ از توسعه ابزاری نوین به نام MetaGraph خبر دادهاند که میتواند در عرض چند ثانیه میان پایگاههای عظیم دادههای عمومی DNA و RNA جستوجو کند.
به گزارش تکناک، توالییابی DNA در سالهای اخیر، دگرگونی بزرگی در زیستپزشکی ایجاد کرده است. این فناوری امکان شناسایی اختلالات ارثی نادر، جهشهای ژنتیکی در سلولهای سرطانی و تحلیل دقیق بیماریها را فراهم کرده است. فناوریهای نسل جدید توالییابی، بهویژه در سالهای ۲۰۲۰ و ۲۰۲۱، نقشی حیاتی در رمزگشایی سریع ژنوم ویروس SARS-CoV-2 و کنترل جهانی پاندمی کرونا داشتند.
با گسترش روند انتشار عمومی دادههای توالییابی توسط پژوهشگران، حجم بیسابقهای از دادههای ژنتیکی در پایگاههایی مانند: Sequence Read Archive (SRA) در آمریکا و European Nucleotide Archive (ENA) در اروپا گرد آمده است. این منابع اکنون بیش از ۱۰۰ پتابایت داده را در خود جای دادهاند؛ رقمی معادل کل حجم متون موجود در اینترنت، در حالی که هر پتابایت برابر با یک میلیون گیگابایت است.
اما جستوجو در چنین آرشیو عظیمی برای یافتن یا مقایسه توالیهای ژنتیکی تا همین اواخر نیازمند منابع محاسباتی بسیار سنگینی بود، که اغلب از توان مراکز تحقیقاتی خارج بود. اکنون گروهی از دانشمندان ETH زوریخ راهحلی نوآورانه برای این چالش یافتهاند.
01
از 03جستوجوی تماممتن در دادههای ژنتیکی

ابزار MetaGraph با تکیه بر روشهای پیشرفته محاسباتی، فرایند جستوجو را دگرگون کرده است. این سامانه قادر است دادههای خام DNA و RNA را به صورت مستقیم، همانند موتورهای جستوجوی اینترنتی بررسی کند. کاربران تنها با وارد کردن توالی مورد نظر خود در کادر جستوجو میتوانند در عرض چند ثانیه یا دقیقه بفهمند که آن توالی در کدام پایگاهها یا پروژهها ثبت شده است.
پروفسور گونار رتش، دانشمند علوم داده در ETH زوریخ بیان کرد: «این ابزار در واقع نوعی گوگل برای DNA است». او توضیح داد که پیشتر پژوهشگران میتوانستند فقط در میان توضیحات جانبی دادهها (متادیتا) جستوجو کنند و برای دسترسی به دادههای خام ناچار به دانلود مجموعههای کامل بودند، که فرایندی طولانی، ناقص و پرهزینه بود.
تیم تحقیقاتی در گزارش خود تأکید کرده است که MetaGraph علاوه بر دقت بالا، از نظر اقتصادی نیز مقرونبهصرفه است. برآوردها نشان میدهد که هزینه انجام پرسوجوهای بزرگ در این سامانه، کمتر از یک دلار برای هر مگابیس داده خواهد بود.
به دلیل کارایی بالا و قابلیت پردازش دقیق، این موتور جستوجو میتواند نقش مهمی در تسریع تحقیقات ژنتیکی، بهویژه در بررسی عوامل بیماریزا یا مقابله با مقاومتهای آنتیبیوتیکی ایفا کند. به عنوان مثال، MetaGraph میتواند ژنهای مقاوم به دارو یا ویروسهای مفید (فاژها) که توان نابودی باکتریها را دارند، در میان پایگاههای جهانی شناسایی کند.
02
از 03فشردهسازی دادهها تا ۳۰۰ برابر

در مقالهای که ۸ اکتبر ۲۰۲۵ در نشریه Nature منتشر شده است، پژوهشگران ETH نشان دادهاند که ابزار MetaGraph چگونه دادههای عظیم زیستی را با استفاده از ساختارهای ریاضی پیچیده، نمایهسازی و فشرده میکند.
پروفسور رتش عنوان کرد: «از نظر ریاضی، این ابزار همانند یک ماتریس غولپیکر با میلیونها ستون و تریلیونها ردیف عمل میکند.» نوآوری اصلی پروژه در پیوند هوشمندانه دادههای خام با متادیتا و فشردهسازی دادهها با ضریب ۳۰۰ برابر نهفته است؛ رویکردی که اطلاعات حیاتی را حفظ میکند، اما حجم داده را به شدت کاهش میدهد.
دکتر آندره کاهلس، از اعضای گروه انفورماتیک زیستپزشکی ETH گفت: «ما تا حد امکان دادهها را فشرده کردهایم بدون آنکه هیچ بخش مهمی از اطلاعات از بین برود.» او تأکید کرد که رویکرد ETH نسبت به سایر ابزارهای مشابه، مقیاسپذیرتر است؛ بهگونهای که با افزایش حجم داده، نیاز به قدرت محاسباتی اضافی کمتر میشود.
03
از 03دسترسی عمومی و آینده ابزار MetaGraph
نسخه اولیه MetaGraph نخستینبار در سال ۲۰۲۰ معرفی شد و از آن زمان تاکنون به طور مداوم ارتقا یافته است. این ابزار در حال حاضر به صورت عمومی در دسترس است و امکان جستوجوی کامل در میان میلیونها توالی DNA، RNA و حتی پروتئینهای ویروسها، باکتریها، قارچها، گیاهان، جانوران و انسان را فراهم میکند.
طبق اعلام ETH زوریخ، تاکنون حدود نیمی از دادههای جهانی در این سامانه ایندکس شدهاند و انتظار میرود که مابقی تا پایان سال اضافه شود. از آنجا که MetaGraph به صورت متنباز (Open Source) منتشر شده است، شرکتهای داروسازی نیز میتوانند از آن برای تحلیل دادههای تحقیقاتی خود استفاده کنند.
دکتر کاهلس با نگاهی به آینده بیان کرد: «در روزهای نخست، حتی گوگل هم نمیدانست موتور جستوجو دقیقاً به چه کار خواهد آمد. اگر روند پیشرفت در توالییابی DNA با همین سرعت ادامه یابد، شاید در آینده هر فرد بتواند از این ابزار برای شناسایی دقیق گیاهان یا ارگانیسمهای اطراف خود استفاده کند.»