مصطفی سلیمان اظهار داشت که مدل‌های هوش مصنوعی به نقطه‌ای رسیده‌اند که «نه تنها کمی بهتر، بلکه به طور چشمگیری بهتر از عملکرد انسانی هستند: سریع‌تر، ارزان‌تر و چهار برابر دقیق‌تر.» © Stephen Brashear/Getty Images
مصطفی سلیمان اظهار داشت که مدل‌های هوش مصنوعی به نقطه‌ای رسیده‌اند که «نه تنها کمی بهتر، بلکه به طور چشمگیری بهتر از عملکرد انسانی هستند: سریع‌تر، ارزان‌تر و چهار برابر دقیق‌تر.» © Stephen Brashear/Getty Images

مایکروسافت ابزار تشخیص مبتنی بر هوش مصنوعی را در راستای تحول پزشکی رونمایی کرد

این پژوهش اولین ابتکار از واحد بهداشت هوش مصنوعی گروه فناوری بزرگ است که توسط مصطفی سلیمان، یکی از بنیان‌گذاران سابق دیپ‌مایند، ایجاد شده است

مایکروسافت ابزار پزشکی مبتنی بر هوش مصنوعی را ساخته است که ادعا می‌کند چهار برابر موفق‌تر از پزشکان انسانی در تشخیص بیماری‌های پیچیده است. این شرکت فناوری، پژوهشی را رونمایی کرده که به باور آن‌ها می‌تواند روند درمان را سرعت بخشد.

«هماهنگ‌کننده تشخیص هوش مصنوعی مایکروسافت» (Microsoft AI Diagnostic Orchestrator) اولین ابتکاری است که از واحد بهداشت هوش مصنوعی بیرون آمده است. این واحد سال گذشته توسط مصطفی سلیمان با کارکنانی که از دیپ‌مایند (DeepMind)، آزمایشگاه تحقیقاتی که او یکی از بنیان‌گذاران آن بود و اکنون متعلق به رقیب گوگل است، تشکیل شد.

مدیرعامل مایکروسافت اِی‌آی (Microsoft AI) در مصاحبه‌ای با فایننشال تایمز گفت که این آزمایش گامی در مسیر «فرا هوشمندی پزشکی» (medical superintelligence) است که می‌تواند به حل بحران‌های نیروی انسانی و زمان‌های انتظار طولانی در سیستم‌های بهداشتی تحت فشار کمک کند.

سیستم جدید مایکروسافت بر پایه یک «هماهنگ‌کننده» (orchestrator) استوار است که پنل‌های مجازی متشکل از پنج عامل هوش مصنوعی را ایجاد می‌کند که نقش «پزشک» را ایفا می‌کنند. هر یک از این عوامل نقش متمایزی دارد، مانند ارائه فرضیه‌ها یا انتخاب آزمایش‌های تشخیصی، و با یکدیگر تعامل و «بحث» می‌کنند تا یک مسیر عملی را انتخاب کنند.

برای آزمایش قابلیت‌های خود، "MAI-DxO" با 304 مطالعه از مجله پزشکی نیوانگلند (New England Journal of Medicine - NEJM) تغذیه شد که چگونگی حل برخی از پیچیده‌ترین موارد توسط پزشکان را شرح می‌دهند.

این امر به محققان اجازه داد تا آزمایش کنند که آیا این برنامه می‌تواند تشخیص صحیح را تعیین کرده و فرآیند تصمیم‌گیری خود را با استفاده از یک تکنیک جدید به نام «زنجیره بحث» (chain of debate) گزارش دهد. این تکنیک باعث می‌شود مدل‌های استدلال هوش مصنوعی یک حساب گام به گام از چگونگی حل مشکلات خود ارائه دهند.

مایکروسافت از مدل‌های زبان بزرگ (LLM) پیشرو از OpenAI، متا، انتروپیک، گوگل، xAI و دیپ‌سیک (DeepSeek) استفاده کرد. هماهنگ‌کننده باعث شد که تمامی LLMها عملکرد بهتری داشته باشند، اما با مدل استدلال OpenAI (o3) بهترین عملکرد را داشت و 85.5 درصد از موارد NEJM را به درستی حل کرد.

این رقم در مقایسه با حدود 20 درصد توسط پزشکان انسانی با تجربه بود، اما در این آزمایش، به پزشکان اجازه دسترسی به کتاب‌های درسی یا مشورت با همکاران داده نشد که می‌توانست نرخ موفقیت آن‌ها را افزایش دهد.

نسخه‌ای از این فناوری به زودی می‌تواند در چت‌بات هوش مصنوعی Copilot و موتور جستجوی بینگ مایکروسافت نیز مستقر شود که روزانه 50 میلیون پرسش سلامت را مدیریت می‌کنند.

سلیمان گفت که مایکروسافت در حال نزدیک شدن به «مدل‌های هوش مصنوعی است که نه تنها کمی بهتر، بلکه به طور چشمگیری بهتر از عملکرد انسانی هستند: سریع‌تر، ارزان‌تر و چهار برابر دقیق‌تر.»

او افزود: «این واقعاً تحول‌آفرین خواهد بود.»

تلاش جدید سلیمان پس از آن صورت می‌گیرد که دیپ‌مایند در پیشرفت‌های هوش مصنوعی مرتبط با مراقبت‌های بهداشتی پیشگام بوده است. سر دیمیس هاسابیس (Demis Hassabis)، رئیس آزمایشگاه گوگل، سال گذشته به طور مشترک برنده جایزه نوبل شیمی شد، به دلیل استفاده از هوش مصنوعی برای کشف اسرار بیولوژیکی پروتئین‌هایی که اساس حیات هستند.

مایکروسافت تقریباً 14 میلیارد دلار در OpenAI سرمایه‌گذاری کرده و حقوق انحصاری استفاده و فروش فناوری آن را دارد. با این حال، این غول فناوری درگیر یک کشمکش پرخطر با این استارتاپ است که تلاش می‌کند به یک نهاد انتفاعی تبدیل شود و هر دو طرف بر سر شرایط آینده شراکت خود با یکدیگر درگیر هستند.

سلیمان گفت در حالی که مدل OpenAI بهترین عملکرد را داشت، مایکروسافت نسبت به اینکه MAI-DxO از کدام یک از چهار «مدل در سطح جهانی» استفاده کند، «خنثی» است.

او گفت: «ما مدت‌هاست معتقدیم که آنها به کالاهای عمومی تبدیل خواهند شد... به نظر من، این هماهنگ‌کننده کلی است که وجه تمایز را ایجاد می‌کند.»

دومینیک کینگ (Dominic King)، رئیس سابق واحد بهداشت دیپ‌مایند که اواخر سال گذشته به مایکروسافت پیوست، گفت که این برنامه «عملکردی بهتر از هر چیزی که تا به حال دیده‌ایم» داشته و «امروزه فرصتی برای عمل کردن تقریباً به عنوان یک دروازه جدید به مراقبت‌های بهداشتی وجود دارد.»

او گفت که مدل‌های هوش مصنوعی همچنین به گونه‌ای طراحی شده بودند که صرفه‌جویی در هزینه را در نظر بگیرند، که به طور قابل توجهی تعداد آزمایش‌های لازم برای رسیدن به تشخیص صحیح در این آزمایش را کاهش داد و در برخی موارد صدها هزار دلار صرفه‌جویی به همراه داشت.

با این حال، کینگ تأکید کرد که این فناوری هنوز در مراحل اولیه خود است، مورد بازبینی همتا قرار نگرفته و هنوز برای محیط بالینی آماده نیست.

اریک تاپول (Eric Topol)، متخصص قلب و عروق و بنیان‌گذار و مدیر مؤسسه تحقیقاتی ترنزلیشنال اسکریپس (Scripps Research Translational Institute)، گفت: «این یک مطالعه برجسته است.» او افزود: «در حالی که این کار در محیط واقعی پزشکی انجام نشده است، اما اولین مطالعه‌ای است که شواهدی برای پتانسیل کارایی هوش مصنوعی مولد در پزشکی — دقت و صرفه‌جویی در هزینه — ارائه می‌دهد.»