مایکروسافت ابزار پزشکی مبتنی بر هوش مصنوعی را ساخته است که ادعا میکند چهار برابر موفقتر از پزشکان انسانی در تشخیص بیماریهای پیچیده است. این شرکت فناوری، پژوهشی را رونمایی کرده که به باور آنها میتواند روند درمان را سرعت بخشد.
«هماهنگکننده تشخیص هوش مصنوعی مایکروسافت» (Microsoft AI Diagnostic Orchestrator) اولین ابتکاری است که از واحد بهداشت هوش مصنوعی بیرون آمده است. این واحد سال گذشته توسط مصطفی سلیمان با کارکنانی که از دیپمایند (DeepMind)، آزمایشگاه تحقیقاتی که او یکی از بنیانگذاران آن بود و اکنون متعلق به رقیب گوگل است، تشکیل شد.
مدیرعامل مایکروسافت اِیآی (Microsoft AI) در مصاحبهای با فایننشال تایمز گفت که این آزمایش گامی در مسیر «فرا هوشمندی پزشکی» (medical superintelligence) است که میتواند به حل بحرانهای نیروی انسانی و زمانهای انتظار طولانی در سیستمهای بهداشتی تحت فشار کمک کند.
سیستم جدید مایکروسافت بر پایه یک «هماهنگکننده» (orchestrator) استوار است که پنلهای مجازی متشکل از پنج عامل هوش مصنوعی را ایجاد میکند که نقش «پزشک» را ایفا میکنند. هر یک از این عوامل نقش متمایزی دارد، مانند ارائه فرضیهها یا انتخاب آزمایشهای تشخیصی، و با یکدیگر تعامل و «بحث» میکنند تا یک مسیر عملی را انتخاب کنند.
برای آزمایش قابلیتهای خود، "MAI-DxO" با 304 مطالعه از مجله پزشکی نیوانگلند (New England Journal of Medicine - NEJM) تغذیه شد که چگونگی حل برخی از پیچیدهترین موارد توسط پزشکان را شرح میدهند.
این امر به محققان اجازه داد تا آزمایش کنند که آیا این برنامه میتواند تشخیص صحیح را تعیین کرده و فرآیند تصمیمگیری خود را با استفاده از یک تکنیک جدید به نام «زنجیره بحث» (chain of debate) گزارش دهد. این تکنیک باعث میشود مدلهای استدلال هوش مصنوعی یک حساب گام به گام از چگونگی حل مشکلات خود ارائه دهند.
مایکروسافت از مدلهای زبان بزرگ (LLM) پیشرو از OpenAI، متا، انتروپیک، گوگل، xAI و دیپسیک (DeepSeek) استفاده کرد. هماهنگکننده باعث شد که تمامی LLMها عملکرد بهتری داشته باشند، اما با مدل استدلال OpenAI (o3) بهترین عملکرد را داشت و 85.5 درصد از موارد NEJM را به درستی حل کرد.
این رقم در مقایسه با حدود 20 درصد توسط پزشکان انسانی با تجربه بود، اما در این آزمایش، به پزشکان اجازه دسترسی به کتابهای درسی یا مشورت با همکاران داده نشد که میتوانست نرخ موفقیت آنها را افزایش دهد.
نسخهای از این فناوری به زودی میتواند در چتبات هوش مصنوعی Copilot و موتور جستجوی بینگ مایکروسافت نیز مستقر شود که روزانه 50 میلیون پرسش سلامت را مدیریت میکنند.
سلیمان گفت که مایکروسافت در حال نزدیک شدن به «مدلهای هوش مصنوعی است که نه تنها کمی بهتر، بلکه به طور چشمگیری بهتر از عملکرد انسانی هستند: سریعتر، ارزانتر و چهار برابر دقیقتر.»
او افزود: «این واقعاً تحولآفرین خواهد بود.»
تلاش جدید سلیمان پس از آن صورت میگیرد که دیپمایند در پیشرفتهای هوش مصنوعی مرتبط با مراقبتهای بهداشتی پیشگام بوده است. سر دیمیس هاسابیس (Demis Hassabis)، رئیس آزمایشگاه گوگل، سال گذشته به طور مشترک برنده جایزه نوبل شیمی شد، به دلیل استفاده از هوش مصنوعی برای کشف اسرار بیولوژیکی پروتئینهایی که اساس حیات هستند.
مایکروسافت تقریباً 14 میلیارد دلار در OpenAI سرمایهگذاری کرده و حقوق انحصاری استفاده و فروش فناوری آن را دارد. با این حال، این غول فناوری درگیر یک کشمکش پرخطر با این استارتاپ است که تلاش میکند به یک نهاد انتفاعی تبدیل شود و هر دو طرف بر سر شرایط آینده شراکت خود با یکدیگر درگیر هستند.
سلیمان گفت در حالی که مدل OpenAI بهترین عملکرد را داشت، مایکروسافت نسبت به اینکه MAI-DxO از کدام یک از چهار «مدل در سطح جهانی» استفاده کند، «خنثی» است.
او گفت: «ما مدتهاست معتقدیم که آنها به کالاهای عمومی تبدیل خواهند شد... به نظر من، این هماهنگکننده کلی است که وجه تمایز را ایجاد میکند.»
دومینیک کینگ (Dominic King)، رئیس سابق واحد بهداشت دیپمایند که اواخر سال گذشته به مایکروسافت پیوست، گفت که این برنامه «عملکردی بهتر از هر چیزی که تا به حال دیدهایم» داشته و «امروزه فرصتی برای عمل کردن تقریباً به عنوان یک دروازه جدید به مراقبتهای بهداشتی وجود دارد.»
او گفت که مدلهای هوش مصنوعی همچنین به گونهای طراحی شده بودند که صرفهجویی در هزینه را در نظر بگیرند، که به طور قابل توجهی تعداد آزمایشهای لازم برای رسیدن به تشخیص صحیح در این آزمایش را کاهش داد و در برخی موارد صدها هزار دلار صرفهجویی به همراه داشت.
با این حال، کینگ تأکید کرد که این فناوری هنوز در مراحل اولیه خود است، مورد بازبینی همتا قرار نگرفته و هنوز برای محیط بالینی آماده نیست.
اریک تاپول (Eric Topol)، متخصص قلب و عروق و بنیانگذار و مدیر مؤسسه تحقیقاتی ترنزلیشنال اسکریپس (Scripps Research Translational Institute)، گفت: «این یک مطالعه برجسته است.» او افزود: «در حالی که این کار در محیط واقعی پزشکی انجام نشده است، اما اولین مطالعهای است که شواهدی برای پتانسیل کارایی هوش مصنوعی مولد در پزشکی — دقت و صرفهجویی در هزینه — ارائه میدهد.»