هوش مصنوعی AlphaGeometry2 گوگل DeepMind در مسائل المپیاد بین‌المللی ریاضی عالی عمل کرد. اعتبار: Sebastien Bozon/AFP via Getty
هوش مصنوعی AlphaGeometry2 گوگل DeepMind در مسائل المپیاد بین‌المللی ریاضی عالی عمل کرد. اعتبار: Sebastien Bozon/AFP via Getty

هوش مصنوعی DeepMind مسائل سخت ریاضی را در حد بهترین حل‌کننده‌های انسانی حل می‌کند

AlphaGeometry2 این شرکت به سطح دانش‌آموزان مدال طلای المپیاد بین‌المللی ریاضی می‌رسد.

یک سال پیش، AlphaGeometry، یک حل‌کننده مسائل هوش مصنوعی (AI) که توسط Google DeepMind ایجاد شده بود، با عملکردی در سطح مدال‌آوران نقره‌ای در المپیاد بین‌المللی ریاضی (IMO)، یک مسابقه که مسائل سخت ریاضی را برای دانش‌آموزان با استعداد دبیرستانی تعیین می‌کند، جهان را شگفت‌زده کرد.

اکنون تیم DeepMind می‌گوید که عملکرد سیستم ارتقا یافته خود، AlphaGeometry2، از سطح میانگین مدال‌آوران طلا فراتر رفته است. نتایج در پیش‌انتشار در arXiv شرح داده شده است1.

کوین بازارد، ریاضیدان کالج امپریال لندن می‌گوید: «تصور می‌کنم مدت زیادی طول نکشد که کامپیوترها نمره کامل را در IMO کسب کنند.»

حل مسائل در هندسه اقلیدسی یکی از چهار موضوعی است که در مسائل IMO پوشش داده می‌شود — بقیه شاخه‌های نظریه اعداد، جبر و ترکیبیات را پوشش می‌دهند. هندسه نیازمند مهارت‌های خاصی از یک هوش مصنوعی است، زیرا شرکت‌کنندگان باید اثبات دقیق برای یک گزاره در مورد اشیاء هندسی روی صفحه ارائه دهند. در ماه جولای، AlphaGeometry2 اولین حضور عمومی خود را در کنار یک سیستم تازه رونمایی شده، AlphaProof، انجام داد که DeepMind برای حل سؤالات غیر هندسی در مجموعه‌های مسائل IMO توسعه داده بود.

زبان ریاضی

AlphaGeometry ترکیبی از اجزایی است که شامل یک مدل زبان تخصصی و یک مدل «عصبی-نمادین» است - مدلی که با یادگیری از داده‌ها مانند یک شبکه عصبی آموزش نمی‌بیند، اما استدلال انتزاعی توسط انسان‌ها در آن کدگذاری شده است. این تیم مدل زبان را آموزش دادند تا به یک زبان رسمی ریاضی صحبت کند، که امکان بررسی خودکار خروجی آن را برای دقت منطقی فراهم می‌کند — و «توهمات»، اظهارات ناهماهنگ یا نادرستی را که ربات‌های چت هوش مصنوعی مستعد انجام آن هستند، از بین ببرد.

برای AlphaGeometry2، این تیم چندین بهبود ایجاد کرد، از جمله ادغام مدل زبان بزرگ پیشرفته گوگل، Gemini. این تیم همچنین توانایی استدلال با جابجایی اشیاء هندسی در اطراف صفحه را معرفی کرد — مانند جابجایی یک نقطه در امتداد یک خط برای تغییر ارتفاع یک مثلث — و حل معادلات خطی.

این سیستم توانست 84 درصد از تمام مسائل هندسه داده شده در IMO را در 25 سال گذشته حل کند، در مقایسه با 54 درصد برای اولین AlphaGeometry. (تیم‌هایی در هند و چین سال گذشته از رویکردهای مختلفی برای دستیابی به عملکرد در سطح مدال طلا در هندسه استفاده کردند، اما در زیرمجموعه کوچکتری از مسائل هندسه IMO2,3.)

نویسندگان مقاله DeepMind می‌نویسند که بهبودهای آینده AlphaGeometry شامل برخورد با مسائل ریاضی است که شامل نابرابری‌ها و معادلات غیرخطی است، که برای «حل کامل هندسه» مورد نیاز خواهد بود.

پیشرفت سریع

اولین سیستم هوش مصنوعی که برای آزمون کلی نمره مدال طلا را کسب کند، می‌تواند جایزه 5 میلیون دلاری به نام جایزه المپیاد ریاضی هوش مصنوعی را از آن خود کند — اگرچه این رقابت مستلزم این است که سیستم‌ها منبع باز باشند، که در مورد DeepMind اینطور نیست.

بازارد می‌گوید که از پیشرفت سریع انجام شده توسط DeepMind و تیم‌های هندی و چینی شگفت‌زده نشده است. اما، او اضافه می‌کند، اگرچه مسائل سخت هستند، اما موضوع هنوز از نظر مفهومی ساده است، و چالش‌های بسیار بیشتری برای غلبه بر آن وجود دارد قبل از اینکه هوش مصنوعی بتواند مسائل را در سطح ریاضیات تحقیقاتی حل کند.

محققان هوش مصنوعی مشتاقانه منتظر تکرار بعدی IMO در ساحل سان‌شاین، استرالیا، در ماه جولای خواهند بود. هنگامی که مسائل آن برای شرکت‌کنندگان انسانی برای حل عمومی می‌شود، سیستم‌های مبتنی بر هوش مصنوعی نیز می‌توانند آنها را حل کنند. (به نمایندگان هوش مصنوعی اجازه شرکت در مسابقه داده نمی‌شود و بنابراین واجد شرایط دریافت مدال نیستند.) مسائل جدید به عنوان مطمئن‌ترین آزمایش برای سیستم‌های مبتنی بر یادگیری ماشینی تلقی می‌شوند، زیرا هیچ خطری وجود ندارد که مسائل یا راه‌حل آنها به صورت آنلاین وجود داشته باشد و ممکن است به «نشت» در مجموعه‌های داده‌های آموزشی، تحریف نتایج، تبدیل شود.