هوش مصنوعی Med-Gemini گوگل یک ابزار کارآمد برای پزشکان

گوگل با ایجاد نسل جدیدی از مدل‌های هوش مصنوعی تحت نام Med-Gemini، قابلیت‌های چشمگیری در تشخیص بالینی به دست آورده است.

به گزارش تکناک، این مدل‌ها در آزمایش‌های پزشکی نسبت به مدل‌های قبلی عملکرد بهتری داشته و می‌توانند با استفاده از جستجوی وب، دقت پاسخ‌دهی خود را در مواقع عدم قطعیت افزایش دهند. Med-Gemini در نهایت به عنوان یک ابزار کمکی برای پزشکان در نظر گرفته شده تا از طریق تجزیه و تحلیل دقیق داده‌های بیمار، به آنها در ارائه مراقبت‌های پزشکی بهتر کمک کند.

Google Research و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل یعنی DeepMind، دسترسی چشمگیر هوش مصنوعی Med-Gemini که خانواده‌ای از مدل‌های پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح داده‌اند.

پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده درمان می‌کنند. برای ارائه درمان موثر، آنها باید با پرونده سلامت هر بیمار آشنا باشند و به جدیدترین روش‌ها و درمان‌ها آگاه باشند. سپس یک رابطه بسیار مهم بین پزشک و بیمار شکل می‌گیرد که بر پایه همدلی، اعتماد و ارتباط بنا شده است. برای اینکه یک هوش مصنوعی به تقلید از یک پزشک واقعی نزدیک شود، باید بتواند همه این کارها را انجام دهد.

امروزه مرز بین هوش مصنوعی و پزشکی واقعاً کم شده است. در شش ماه گذشته، نیواطلس در مورد مدل‌های هوش مصنوعی گزارش داده است که به پزشکان کمتر باتجربه در شناسایی پیش‌سازهای سرطان روده بزرگ، تشخیص اوتیسم دوران کودکی از روی تصاویر چشم‌ها و پیش‌بینی آنی اینکه جراح تمام بافت‌های سرطانی را در طول سرطان سینه برداشته است یا خیر، کمک می‌کند. اما Med-Gemini چیز دیگری است.

Med-Gemini گوگل نسل جدیدی از مدل‌های هوش مصنوعی چندوجهی است، به این معنی که می‌تواند اطلاعات را از حالت‌های مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کند. مدل‌های هوش مصنوعی در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیده‌اند و آنچه که استدلال با زمینه طولانی یا استدلال از مقادیر زیادی داده مانند ساعت‌ها ویدیو یا ده‌ها ساعت صدا نامیده می‌شود، مهارت دارند.

Med-Gemini تمام مزایای مدل‌های پایه Gemini را دارد اما آنها را به خوبی تنظیم کرده است. محققان ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در یک مقاله گنجاندند. این مقاله 58 صفحه شده است که ما مهم‌ترین نکات آن را در این مطلب آورده‌ایم.

فهرست مطالب

قابلیت‌های خودآموزی و جستجوی وب

تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعه‌ای از اطلاعات مرتبط دیگر ترکیب کنند، مانند: علائم بیمار، تاریخچه پزشکی، جراحی، نتایج آزمایشگاهی و نتایج سایر آزمایش‌های تحقیقاتی، و پاسخ بیمار به درمان‌های قبلی. با تکیه بر این اطلاعات درمان‌های موجود به‌روزرسانی شده و درمان‌های جدید معرفی می‌شوند. همه این موارد بر استدلال بالینی پزشک تأثیر می‌گذارند.

به همین دلیل است که با Med-Gemini، گوگل دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفته‌تر فراهم کرده است. مانند بسیاری از مدل‌های زبان بزرگ (LLM) متمرکز بر پزشکی، Med-Gemini در MedQA آموزش دید که یک سری سؤالات چند گزینه‌ای هستند که نماینده سؤالات آزمون مجوز پزشکی ایالات متحده (USMLE) هستند که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شد‌ه‌اند.

نحوه کار خودآموزی و ابزار جستجوی وب در Med-Gemini

با این حال، گوگل دو مجموعه داده جدید دیگر را برای مدل خود توسعه داد. اولی، MedQA-R (استدلال) نام دارد که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام زنجیره افکار (CoTs) گسترش می‌دهد.

دومی که MedQA-RS (استدلال و جستجو) نام دارد، دستورالعمل‌هایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه می‌دهد. اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته می‌شود تا یک جستجو در وب برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت، انجام دهد.

Med-Gemini بر روی 14 معیار پزشکی آزمایش شد و عملکرد جدید (SoTA) جدیدی را روی 10 معیار ایجاد کرد که در هر معیاری که می‌توان مقایسه کرد، از خانواده مدل GPT-4 پیشی گرفت. در معیار MedQA (USMLE)، Med-Gemini با استفاده از استراتژی جستجوی هدایت‌شده با عدم قطعیت به دقت 91.1% دست یافت و با میزان 4.5% از مدل زبان بزرگ پزشکی قبلی گوگل یعنیMed-PaLM 2 پیشی گرفت.

در هفت معیار چندوجهی از جمله چالش تصویری مجله پزشکی نیوانگلند (NEJM) که یک سری تصاویر موارد چالش برانگیز بالینی است که از یک لیست 10 تایی تشخیص داده می‌شود، Med-Gemini با یک حاشیه نسبی متوسط با میزان 44.5٪ بهتر از GPT-4 عمل کرد.

محققان گفتند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال، ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستجو و کیفیت استنادها را در نظر نگرفته‌ایم. علاوه بر این، باید دید که آیا می‌توان به LLM های کوچکتر نیز استفاده از جستجوی وب را آموزش داد. ما این اکتشافات را به تحقیقات آینده واگذار می‌کنیم.

بازیابی اطلاعات خاص از پرونده‌های الکترونیکی طولانی سلامت

پرونده الکترونیک سلامت (EHR) ممکن است طولانی باشد، اما پزشکان باید از محتوای آنها آگاه باشند. برای پیچیده‌تر کردن مسائل، آنها معمولاً حاوی شباهت‌های متنی (دیابت شیرین در مقابل نفروپاتی دیابتی)، املای اشتباه، کلمات اختصاری (Rx در مقابل نسخه) و مترادف‌ها (حادثه عروق مغزی در مقابل سکته مغزی) هستند که اینها چیزهایی هستند که ممکن است هوش مصنوعی را گیج کنند.

برای آزمایش توانایی Med-Gemini برای درک و استدلال از اطلاعات پزشکی طولانی مدت، محققان با استفاده از یک پایگاه داده بزرگ و در دسترس عموم به نام Medical Information Mart for Intensive Care استفاده کردند که حاوی داده‌های بهداشتی شناسایی نشده بیماران بستری در مراقبت‌های ویژه است.

هدف این بود که مدل، ذکر مربوط به یک وضعیت، علامت، یا روش پزشکی نادر و ظریف را بر روی مجموعه بزرگی از یادداشت‌های بالینی در پرونده الکترونیک سلامت بازیابی کند.

دویست نمونه انتخاب شدند و هر نمونه شامل مجموعه‌ای از یادداشت‌هایی در پرونده الکترونیک سلامت شناسایی نشده از 44 بیمار ICU با سابقه پزشکی طولانی بود. آنها باید معیارهای زیر را داشته باشند:

بیش از 100 یادداشت پزشکی، با طول هر نمونه از 200000 تا 700000 کلمه
در هر مثال، بیماری فقط یک بار ذکر شده باشد
هر نمونه یک بیماری داشته باشد

دو مرحله دشوار وجود داشت. اول اینکه Med-Gemini مجبور شد همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی کند. دوم، مدل باید ارتباط همه ذکرها را ارزیابی می‌کرد، آنها را دسته‌بندی می‌کرد و نتیجه می‌گرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه می‌کرد.

در مقایسه با روش SoTA، Med-Gemini در این وظیفه دشوار و ظریف عملکرد خوبی داشت. در مقایسه با روش SoTA (0.85) از نظر دقت 0.77 امتیاز داشت و در فراخوان از روش SoTA برتری داشت: 0.76 در مقابل 0.73.

محققان می‌گویند: شاید برجسته‌ترین جنبه Med-Gemini، قابلیت‌های پردازش با زمینه طولانی باشد، زیرا امروزه محققان مرزهای عملکردی جدیدی را باز می‌کنند و امکانات کاربردی جدیدی که قبلاً غیرممکن بود را برای سیستم‌های هوش مصنوعی پزشکی فراهم می‌کنند. این وظایف حساس منعکس کننده چالشی در دنیای واقعی هستند که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیت‌های پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از داده‌های بیمار نشان می‌دهد.

گفتگو با Med-Gemini

در یک آزمایش برای سنجش این هوش مصنوعی برای مفید بودن در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی خارش‌دار سوال پرسید. پس از درخواست تصویر، مدل در مرحله بعد سؤالات مناسبی را پرسید و ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.

همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که می‌توان آن را در اختیار بیمار قرار داد.

نمونه‌ای از گفتگوی تشخیصی Med-Gemini در زمینه مشکل پوستی

محققان گفتند: قابلیت‌های مکالمه چندوجهی Med-Gemini-M 1.5 با توجه به اینکه بدون تنظیم دقیق گفتگوی پزشکی به دست می‌آیند، امیدوارکننده است. چنین قابلیت‌هایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستم‌های هوش مصنوعی را فراهم می‌کند.

با این حال، محققان به این نتیجه رسیدند که کار بیشتری لازم است.

آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی از جمله کمک به پزشکان و بیماران است، اما قطعا خطرات بسیار قابل توجهی نیز به دنبال دارد. در حالی که ما پتانسیل تحقیقات آینده در این حوزه را برجسته می‌کنیم، توانایی‌های مکالمه بالینی را در این هوش مصنوعی، به دقت بررسی نکرده‌ایم.

چشم‌اندازهای آینده

محققان اذعان می‌کنند که کارهای بسیار بیشتری برای انجام دادن وجود دارد، اما قابلیت‌های اولیه مدل Med-Gemini مطمئنا امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی از جمله حریم خصوصی و انصاف را در سراسر فرآیند توسعه مدل بگنجانند.

محققان می‌گویند: ملاحظات حریم خصوصی باید به‌طور ویژه‌ای در سیاست‌ها و مقررات مراقبت‌های درمانی موجود که بر اطلاعات بیمار حاکم و محافظت می‌کنند، ریشه داشته باشد. انصاف حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که ممکن است سیستم‌های هوش مصنوعی در مراقبت‌های درمانی ناخواسته سوگیری‌ها و نابرابری‌های تاریخی را منعکس یا تقویت کنند و این مسئله به‌طور بالقوه منجر به عملکرد متفاوت مدل و نتایج مضر شود.

اما در نهایت Med-Gemini به عنوان یک ابزار خوب در نظر گرفته می‌شود.

محققان می‌گویند: مدل‌های زبان بزرگ در حال آغاز دوره جدیدی از امکانات سلامت و پزشکی هستند. قابلیت‌های نشان‌داده‌شده توسط Gemini و Med-Gemini نشان‌دهنده جهشی قابل توجه در این زمینه و وسعت فرصت‌ها برای تسریع اکتشافات زیست‌پزشکی و کمک به ارائه مراقبت‌های درمانی مناسب است. با این حال، بسیار مهم است که پیشرفت در قابلیت‌های مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستم‌ها همراه باشد. با اولویت‌بندی هر دو جنبه، می‌توانیم با مسئولیت‌پذیری آینده‌ای را متصور شویم که در آن قابلیت‌های سیستم‌های هوش مصنوعی شتاب‌دهنده‌های معنادار و ایمن پیشرفت علمی و مراقبت در پزشکی باشند.

این مطالعه از طریق وب‌سایت arXiv در دسترس است.