یک سال پیش، AlphaGeometry، یک حلکننده مسائل هوش مصنوعی (AI) که توسط Google DeepMind ایجاد شده بود، با عملکردی در سطح مدالآوران نقرهای در المپیاد بینالمللی ریاضی (IMO)، یک مسابقه که مسائل سخت ریاضی را برای دانشآموزان با استعداد دبیرستانی تعیین میکند، جهان را شگفتزده کرد.
اکنون تیم DeepMind میگوید که عملکرد سیستم ارتقا یافته خود، AlphaGeometry2، از سطح میانگین مدالآوران طلا فراتر رفته است. نتایج در پیشانتشار در arXiv شرح داده شده است1.
کوین بازارد، ریاضیدان کالج امپریال لندن میگوید: «تصور میکنم مدت زیادی طول نکشد که کامپیوترها نمره کامل را در IMO کسب کنند.»
حل مسائل در هندسه اقلیدسی یکی از چهار موضوعی است که در مسائل IMO پوشش داده میشود — بقیه شاخههای نظریه اعداد، جبر و ترکیبیات را پوشش میدهند. هندسه نیازمند مهارتهای خاصی از یک هوش مصنوعی است، زیرا شرکتکنندگان باید اثبات دقیق برای یک گزاره در مورد اشیاء هندسی روی صفحه ارائه دهند. در ماه جولای، AlphaGeometry2 اولین حضور عمومی خود را در کنار یک سیستم تازه رونمایی شده، AlphaProof، انجام داد که DeepMind برای حل سؤالات غیر هندسی در مجموعههای مسائل IMO توسعه داده بود.
زبان ریاضی
AlphaGeometry ترکیبی از اجزایی است که شامل یک مدل زبان تخصصی و یک مدل «عصبی-نمادین» است - مدلی که با یادگیری از دادهها مانند یک شبکه عصبی آموزش نمیبیند، اما استدلال انتزاعی توسط انسانها در آن کدگذاری شده است. این تیم مدل زبان را آموزش دادند تا به یک زبان رسمی ریاضی صحبت کند، که امکان بررسی خودکار خروجی آن را برای دقت منطقی فراهم میکند — و «توهمات»، اظهارات ناهماهنگ یا نادرستی را که رباتهای چت هوش مصنوعی مستعد انجام آن هستند، از بین ببرد.
برای AlphaGeometry2، این تیم چندین بهبود ایجاد کرد، از جمله ادغام مدل زبان بزرگ پیشرفته گوگل، Gemini. این تیم همچنین توانایی استدلال با جابجایی اشیاء هندسی در اطراف صفحه را معرفی کرد — مانند جابجایی یک نقطه در امتداد یک خط برای تغییر ارتفاع یک مثلث — و حل معادلات خطی.
این سیستم توانست 84 درصد از تمام مسائل هندسه داده شده در IMO را در 25 سال گذشته حل کند، در مقایسه با 54 درصد برای اولین AlphaGeometry. (تیمهایی در هند و چین سال گذشته از رویکردهای مختلفی برای دستیابی به عملکرد در سطح مدال طلا در هندسه استفاده کردند، اما در زیرمجموعه کوچکتری از مسائل هندسه IMO2,3.)
نویسندگان مقاله DeepMind مینویسند که بهبودهای آینده AlphaGeometry شامل برخورد با مسائل ریاضی است که شامل نابرابریها و معادلات غیرخطی است، که برای «حل کامل هندسه» مورد نیاز خواهد بود.
پیشرفت سریع
اولین سیستم هوش مصنوعی که برای آزمون کلی نمره مدال طلا را کسب کند، میتواند جایزه 5 میلیون دلاری به نام جایزه المپیاد ریاضی هوش مصنوعی را از آن خود کند — اگرچه این رقابت مستلزم این است که سیستمها منبع باز باشند، که در مورد DeepMind اینطور نیست.
بازارد میگوید که از پیشرفت سریع انجام شده توسط DeepMind و تیمهای هندی و چینی شگفتزده نشده است. اما، او اضافه میکند، اگرچه مسائل سخت هستند، اما موضوع هنوز از نظر مفهومی ساده است، و چالشهای بسیار بیشتری برای غلبه بر آن وجود دارد قبل از اینکه هوش مصنوعی بتواند مسائل را در سطح ریاضیات تحقیقاتی حل کند.
محققان هوش مصنوعی مشتاقانه منتظر تکرار بعدی IMO در ساحل سانشاین، استرالیا، در ماه جولای خواهند بود. هنگامی که مسائل آن برای شرکتکنندگان انسانی برای حل عمومی میشود، سیستمهای مبتنی بر هوش مصنوعی نیز میتوانند آنها را حل کنند. (به نمایندگان هوش مصنوعی اجازه شرکت در مسابقه داده نمیشود و بنابراین واجد شرایط دریافت مدال نیستند.) مسائل جدید به عنوان مطمئنترین آزمایش برای سیستمهای مبتنی بر یادگیری ماشینی تلقی میشوند، زیرا هیچ خطری وجود ندارد که مسائل یا راهحل آنها به صورت آنلاین وجود داشته باشد و ممکن است به «نشت» در مجموعههای دادههای آموزشی، تحریف نتایج، تبدیل شود.