گوگل با ایجاد نسل جدیدی از مدلهای هوش مصنوعی تحت نام Med-Gemini، قابلیتهای چشمگیری در تشخیص بالینی به دست آورده است.
به گزارش تکناک، این مدلها در آزمایشهای پزشکی نسبت به مدلهای قبلی عملکرد بهتری داشته و میتوانند با استفاده از جستجوی وب، دقت پاسخدهی خود را در مواقع عدم قطعیت افزایش دهند. Med-Gemini در نهایت به عنوان یک ابزار کمکی برای پزشکان در نظر گرفته شده تا از طریق تجزیه و تحلیل دقیق دادههای بیمار، به آنها در ارائه مراقبتهای پزشکی بهتر کمک کند.
Google Research و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل یعنی DeepMind، دسترسی چشمگیر هوش مصنوعی Med-Gemini که خانوادهای از مدلهای پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح دادهاند.
پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده درمان میکنند. برای ارائه درمان موثر، آنها باید با پرونده سلامت هر بیمار آشنا باشند و به جدیدترین روشها و درمانها آگاه باشند. سپس یک رابطه بسیار مهم بین پزشک و بیمار شکل میگیرد که بر پایه همدلی، اعتماد و ارتباط بنا شده است. برای اینکه یک هوش مصنوعی به تقلید از یک پزشک واقعی نزدیک شود، باید بتواند همه این کارها را انجام دهد.
امروزه مرز بین هوش مصنوعی و پزشکی واقعاً کم شده است. در شش ماه گذشته، نیواطلس در مورد مدلهای هوش مصنوعی گزارش داده است که به پزشکان کمتر باتجربه در شناسایی پیشسازهای سرطان روده بزرگ، تشخیص اوتیسم دوران کودکی از روی تصاویر چشمها و پیشبینی آنی اینکه جراح تمام بافتهای سرطانی را در طول سرطان سینه برداشته است یا خیر، کمک میکند. اما Med-Gemini چیز دیگری است.
Med-Gemini گوگل نسل جدیدی از مدلهای هوش مصنوعی چندوجهی است، به این معنی که میتواند اطلاعات را از حالتهای مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کند. مدلهای هوش مصنوعی در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیدهاند و آنچه که استدلال با زمینه طولانی یا استدلال از مقادیر زیادی داده مانند ساعتها ویدیو یا دهها ساعت صدا نامیده میشود، مهارت دارند.
Med-Gemini تمام مزایای مدلهای پایه Gemini را دارد اما آنها را به خوبی تنظیم کرده است. محققان ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در یک مقاله گنجاندند. این مقاله 58 صفحه شده است که ما مهمترین نکات آن را در این مطلب آوردهایم.
فهرست مطالب
قابلیتهای خودآموزی و جستجوی وب
تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعهای از اطلاعات مرتبط دیگر ترکیب کنند، مانند: علائم بیمار، تاریخچه پزشکی، جراحی، نتایج آزمایشگاهی و نتایج سایر آزمایشهای تحقیقاتی، و پاسخ بیمار به درمانهای قبلی. با تکیه بر این اطلاعات درمانهای موجود بهروزرسانی شده و درمانهای جدید معرفی میشوند. همه این موارد بر استدلال بالینی پزشک تأثیر میگذارند.
به همین دلیل است که با Med-Gemini، گوگل دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفتهتر فراهم کرده است. مانند بسیاری از مدلهای زبان بزرگ (LLM) متمرکز بر پزشکی، Med-Gemini در MedQA آموزش دید که یک سری سؤالات چند گزینهای هستند که نماینده سؤالات آزمون مجوز پزشکی ایالات متحده (USMLE) هستند که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شدهاند.
با این حال، گوگل دو مجموعه داده جدید دیگر را برای مدل خود توسعه داد. اولی، MedQA-R (استدلال) نام دارد که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام زنجیره افکار (CoTs) گسترش میدهد.
دومی که MedQA-RS (استدلال و جستجو) نام دارد، دستورالعملهایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه میدهد. اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته میشود تا یک جستجو در وب برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت، انجام دهد.
Med-Gemini بر روی 14 معیار پزشکی آزمایش شد و عملکرد جدید (SoTA) جدیدی را روی 10 معیار ایجاد کرد که در هر معیاری که میتوان مقایسه کرد، از خانواده مدل GPT-4 پیشی گرفت. در معیار MedQA (USMLE)، Med-Gemini با استفاده از استراتژی جستجوی هدایتشده با عدم قطعیت به دقت 91.1% دست یافت و با میزان 4.5% از مدل زبان بزرگ پزشکی قبلی گوگل یعنیMed-PaLM 2 پیشی گرفت.
در هفت معیار چندوجهی از جمله چالش تصویری مجله پزشکی نیوانگلند (NEJM) که یک سری تصاویر موارد چالش برانگیز بالینی است که از یک لیست 10 تایی تشخیص داده میشود، Med-Gemini با یک حاشیه نسبی متوسط با میزان 44.5٪ بهتر از GPT-4 عمل کرد.
محققان گفتند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال، ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستجو و کیفیت استنادها را در نظر نگرفتهایم. علاوه بر این، باید دید که آیا میتوان به LLM های کوچکتر نیز استفاده از جستجوی وب را آموزش داد. ما این اکتشافات را به تحقیقات آینده واگذار میکنیم.
بازیابی اطلاعات خاص از پروندههای الکترونیکی طولانی سلامت
پرونده الکترونیک سلامت (EHR) ممکن است طولانی باشد، اما پزشکان باید از محتوای آنها آگاه باشند. برای پیچیدهتر کردن مسائل، آنها معمولاً حاوی شباهتهای متنی (دیابت شیرین در مقابل نفروپاتی دیابتی)، املای اشتباه، کلمات اختصاری (Rx در مقابل نسخه) و مترادفها (حادثه عروق مغزی در مقابل سکته مغزی) هستند که اینها چیزهایی هستند که ممکن است هوش مصنوعی را گیج کنند.
برای آزمایش توانایی Med-Gemini برای درک و استدلال از اطلاعات پزشکی طولانی مدت، محققان با استفاده از یک پایگاه داده بزرگ و در دسترس عموم به نام Medical Information Mart for Intensive Care استفاده کردند که حاوی دادههای بهداشتی شناسایی نشده بیماران بستری در مراقبتهای ویژه است.
هدف این بود که مدل، ذکر مربوط به یک وضعیت، علامت، یا روش پزشکی نادر و ظریف را بر روی مجموعه بزرگی از یادداشتهای بالینی در پرونده الکترونیک سلامت بازیابی کند.
دویست نمونه انتخاب شدند و هر نمونه شامل مجموعهای از یادداشتهایی در پرونده الکترونیک سلامت شناسایی نشده از 44 بیمار ICU با سابقه پزشکی طولانی بود. آنها باید معیارهای زیر را داشته باشند:
- بیش از 100 یادداشت پزشکی، با طول هر نمونه از 200000 تا 700000 کلمه
- در هر مثال، بیماری فقط یک بار ذکر شده باشد
- هر نمونه یک بیماری داشته باشد
دو مرحله دشوار وجود داشت. اول اینکه Med-Gemini مجبور شد همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی کند. دوم، مدل باید ارتباط همه ذکرها را ارزیابی میکرد، آنها را دستهبندی میکرد و نتیجه میگرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه میکرد.
در مقایسه با روش SoTA، Med-Gemini در این وظیفه دشوار و ظریف عملکرد خوبی داشت. در مقایسه با روش SoTA (0.85) از نظر دقت 0.77 امتیاز داشت و در فراخوان از روش SoTA برتری داشت: 0.76 در مقابل 0.73.
محققان میگویند: شاید برجستهترین جنبه Med-Gemini، قابلیتهای پردازش با زمینه طولانی باشد، زیرا امروزه محققان مرزهای عملکردی جدیدی را باز میکنند و امکانات کاربردی جدیدی که قبلاً غیرممکن بود را برای سیستمهای هوش مصنوعی پزشکی فراهم میکنند. این وظایف حساس منعکس کننده چالشی در دنیای واقعی هستند که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیتهای پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از دادههای بیمار نشان میدهد.
گفتگو با Med-Gemini
در یک آزمایش برای سنجش این هوش مصنوعی برای مفید بودن در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی خارشدار سوال پرسید. پس از درخواست تصویر، مدل در مرحله بعد سؤالات مناسبی را پرسید و ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.
همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که میتوان آن را در اختیار بیمار قرار داد.
محققان گفتند: قابلیتهای مکالمه چندوجهی Med-Gemini-M 1.5 با توجه به اینکه بدون تنظیم دقیق گفتگوی پزشکی به دست میآیند، امیدوارکننده است. چنین قابلیتهایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستمهای هوش مصنوعی را فراهم میکند.
با این حال، محققان به این نتیجه رسیدند که کار بیشتری لازم است.
آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی از جمله کمک به پزشکان و بیماران است، اما قطعا خطرات بسیار قابل توجهی نیز به دنبال دارد. در حالی که ما پتانسیل تحقیقات آینده در این حوزه را برجسته میکنیم، تواناییهای مکالمه بالینی را در این هوش مصنوعی، به دقت بررسی نکردهایم.
چشماندازهای آینده
محققان اذعان میکنند که کارهای بسیار بیشتری برای انجام دادن وجود دارد، اما قابلیتهای اولیه مدل Med-Gemini مطمئنا امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی از جمله حریم خصوصی و انصاف را در سراسر فرآیند توسعه مدل بگنجانند.
محققان میگویند: ملاحظات حریم خصوصی باید بهطور ویژهای در سیاستها و مقررات مراقبتهای درمانی موجود که بر اطلاعات بیمار حاکم و محافظت میکنند، ریشه داشته باشد. انصاف حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که ممکن است سیستمهای هوش مصنوعی در مراقبتهای درمانی ناخواسته سوگیریها و نابرابریهای تاریخی را منعکس یا تقویت کنند و این مسئله بهطور بالقوه منجر به عملکرد متفاوت مدل و نتایج مضر شود.
اما در نهایت Med-Gemini به عنوان یک ابزار خوب در نظر گرفته میشود.
محققان میگویند: مدلهای زبان بزرگ در حال آغاز دوره جدیدی از امکانات سلامت و پزشکی هستند. قابلیتهای نشاندادهشده توسط Gemini و Med-Gemini نشاندهنده جهشی قابل توجه در این زمینه و وسعت فرصتها برای تسریع اکتشافات زیستپزشکی و کمک به ارائه مراقبتهای درمانی مناسب است. با این حال، بسیار مهم است که پیشرفت در قابلیتهای مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستمها همراه باشد. با اولویتبندی هر دو جنبه، میتوانیم با مسئولیتپذیری آیندهای را متصور شویم که در آن قابلیتهای سیستمهای هوش مصنوعی شتابدهندههای معنادار و ایمن پیشرفت علمی و مراقبت در پزشکی باشند.
این مطالعه از طریق وبسایت arXiv در دسترس است.