تصویر: استفانی آرنت/MIT Technology Review | rawpixel
تصویر: استفانی آرنت/MIT Technology Review | rawpixel

عامل هوش مصنوعی جدید گوگل دیپ‌مایند مسائل دنیای واقعی را بهتر از انسان‌ها حل می‌کند

آلفاایوالو از مدل‌های زبان بزرگ برای یافتن الگوریتم‌های جدیدی استفاده می‌کند که عملکردی بهتر از بهترین راه‌حل‌های ساخته دست بشر برای مدیریت مراکز داده، طراحی تراشه و موارد دیگر دارند.

گوگل دیپ‌مایند بار دیگر از مدل‌های زبان بزرگ برای کشف راه‌حل‌های جدید برای مسائل دیرینه در ریاضیات و علوم کامپیوتر استفاده کرده است. این بار شرکت نشان داده که رویکرد آن نه تنها می‌تواند پازل‌های نظری حل‌نشده را حل کند، بلکه مجموعه‌ای از فرآیندهای مهم دنیای واقعی را نیز بهبود بخشد.

ابزار جدید گوگل دیپ‌مایند، با نام آلفاایوالو (AlphaEvolve)، از خانواده مدل‌های زبان بزرگ (LLM) جِمینی ۲.۰ (Gemini 2.0) برای تولید کد برای طیف گسترده‌ای از وظایف مختلف استفاده می‌کند. LLMها به دلیل کارایی متغیر در کدنویسی شناخته شده‌اند. نکته کلیدی در اینجا این است که آلفاایوالو هر پیشنهاد جِمینی را امتیازدهی می‌کند، موارد بد را دور می‌اندازد و موارد خوب را در یک فرآیند تکراری اصلاح می‌کند، تا زمانی که بهترین الگوریتم ممکن را تولید کند. در بسیاری از موارد، نتایج کارآمدتر یا دقیق‌تر از بهترین راه‌حل‌های موجود (نوشته شده توسط انسان) هستند.

پوشمیت کُلی (Pushmeet Kohli)، نایب رئیس گوگل دیپ‌مایند که تیم‌های هوش مصنوعی برای علم (AI for Science) این شرکت را رهبری می‌کند، می‌گوید: «می‌توانید آن را نوعی عامل کدنویسی فوق‌العاده در نظر بگیرید. این ابزار فقط یک قطعه کد یا یک ویرایش پیشنهاد نمی‌دهد، بلکه در واقع نتیجه‌ای را تولید می‌کند که شاید هیچ‌کس از آن آگاه نبوده است.»

به‌طور خاص، آلفاایوالو راهی برای بهبود نرم‌افزاری که گوگل برای تخصیص وظایف به میلیون‌ها سرور خود در سراسر جهان استفاده می‌کند، ارائه داد. گوگل دیپ‌مایند ادعا می‌کند که این شرکت بیش از یک سال است که از این نرم‌افزار جدید در تمام مراکز داده خود استفاده می‌کند و ۰.۷ درصد از کل منابع محاسباتی گوگل را آزاد کرده است. این ممکن است زیاد به نظر نرسد، اما در مقیاس گوگل رقم بسیار بزرگی است.

یاکوب موسباوئر (Jakob Moosbauer)، ریاضی‌دانی در دانشگاه وارویک (University of Warwick) انگلستان، تحت تاثیر قرار گرفته است. او می‌گوید شیوه‌ای که آلفاایوالو برای یافتن الگوریتم‌هایی که راه‌حل‌های خاصی تولید می‌کنند — به جای جستجوی خود راه‌حل‌ها — استفاده می‌کند، آن را به ابزاری فوق‌العاده قدرتمند تبدیل کرده است. او می‌گوید: «این رویکرد را برای طیف وسیعی از مسائل قابل استفاده می‌کند. هوش مصنوعی در حال تبدیل شدن به ابزاری است که در ریاضیات و علوم کامپیوتر ضروری خواهد بود.»

آلفاایوالو ادامه خط کاری است که گوگل دیپ‌مایند سال‌هاست دنبال می‌کند. دیدگاه آن این است که هوش مصنوعی می‌تواند به پیشرفت دانش بشر در ریاضیات و علم کمک کند. در سال ۲۰۲۲، این شرکت آلفاتِنسور (AlphaTensor) را توسعه داد، مدلی که راه سریع‌تری برای حل ضرب ماتریس‌ها پیدا کرد – مسئله‌ای اساسی در علوم کامپیوتر – و رکورد ۵۰ ساله را شکست. در سال ۲۰۲۳، از آلفادِو (AlphaDev) رونمایی کرد که راه‌های سریع‌تری برای انجام تعدادی محاسبات پایه که کامپیوترها تریلیون‌ها بار در روز انجام می‌دهند، کشف کرد. آلفاتنسور و آلفادِو هر دو مسائل ریاضی را به نوعی بازی تبدیل می‌کنند و سپس به دنبال مجموعه‌ای از حرکت‌های برنده می‌گردند.

فان‌سرچ (FunSearch)، که در اواخر سال ۲۰۲۳ معرفی شد، هوش مصنوعی مبتنی بر بازی را کنار گذاشت و به جای آن از LLMهایی استفاده کرد که می‌توانند کد تولید کنند. از آنجایی که LLMها می‌توانند طیف وسیعی از وظایف را انجام دهند، فان‌سرچ می‌تواند مسائل متنوع‌تری را نسبت به نسخه‌های قبلی خود که فقط برای انجام یک نوع بازی آموزش دیده بودند، بر عهده گیرد. این ابزار برای حل یک مسئله مشهور و حل‌نشده در ریاضیات محض به کار رفت.

آلفاایوالو نسل بعدی فان‌سرچ است. این ابزار به جای تولید قطعات کوتاه کد برای حل یک مسئله خاص، همانطور که فان‌سرچ انجام می‌داد، می‌تواند برنامه‌هایی به طول صدها خط تولید کند. این ویژگی، آن را برای طیف بسیار گسترده‌تری از مسائل قابل استفاده می‌کند.

ماتِی بالوگ (Matej Balog)، پژوهشگری در گوگل دیپ‌مایند که تیم کشف الگوریتم را رهبری می‌کند، می‌گوید: «در تئوری، آلفاایوالو می‌تواند برای هر مسئله‌ای که بتوان آن را در قالب کد توصیف کرد و راه‌حل‌های آن قابل ارزیابی توسط کامپیوتر باشند، به کار رود. الگوریتم‌ها دنیای اطراف ما را اداره می‌کنند، بنابراین تاثیر آن بسیار عظیم است.»

بقاء اصلح

نحوه عملکرد به این صورت است: آلفاایوالو مانند هر LLM دیگری می‌تواند با دریافت دستور (prompt) کار کند. شرح مسئله و هرگونه راهنمایی اضافی که می‌خواهید، مانند راه‌حل‌های قبلی، را به آن بدهید، و آلفاایوالو جِمینی ۲.۰ فلش (Gemini 2.0 Flash) (کوچکترین و سریعترین نسخه از LLM اصلی گوگل دیپ‌مایند) را به کار می‌گیرد تا چندین بلوک کد برای حل مسئله تولید کند.

سپس این راه‌حل‌های کاندید را می‌گیرد، آن‌ها را اجرا می‌کند تا ببیند چقدر دقیق یا کارآمد هستند، و بر اساس مجموعه‌ای از معیارهای مرتبط به آن‌ها امتیاز می‌دهد. آیا این کد نتیجه صحیح را تولید می‌کند؟ آیا سریعتر از راه‌حل‌های قبلی اجرا می‌شود؟ و غیره.

آلفاایوالو سپس بهترین راه‌حل‌ها از دسته فعلی را انتخاب می‌کند و از جِمینی می‌خواهد تا آن‌ها را بهبود بخشد. گاهی اوقات آلفاایوالو یک راه‌حل قبلی را دوباره به ترکیب باز می‌گرداند تا از رسیدن جِمینی به بن‌بست جلوگیری کند.

هنگامی که گیر می‌کند، آلفاایوالو می‌تواند از جِمینی ۲.۰ پرو (Gemini 2.0 Pro)، قدرتمندترین LLM گوگل دیپ‌مایند، نیز کمک بگیرد. ایده این است که با فلش سریعتر راه‌حل‌های زیادی تولید شود، اما در صورت نیاز راه‌حل‌هایی نیز از پرو کندتر اضافه شود.

این دوره‌های تولید، امتیازدهی و بازتولید تا زمانی ادامه می‌یابند که جِمینی نتواند چیزی بهتر از آنچه قبلاً دارد، ارائه دهد.

بازی اعداد

تیم آلفاایوالو را بر روی طیف وسیعی از مسائل مختلف آزمایش کرد. به عنوان مثال، آن‌ها بار دیگر به ضرب ماتریس‌ها نگاه کردند تا ببینند یک ابزار همه‌منظوره مانند آلفاایوالو در مقایسه با آلفاتنسور تخصصی چگونه عمل می‌کند. ماتریس‌ها شبکه‌هایی از اعداد هستند. ضرب ماتریس یک محاسبه پایه است که زیربنای بسیاری از برنامه‌ها، از هوش مصنوعی گرفته تا گرافیک کامپیوتری است، اما هنوز کسی نمی‌داند سریعترین راه برای انجام آن چیست. بالوگ می‌گوید: «نوعی باورنکردنی است که این مسئله هنوز باز است.»

تیم شرح مسئله و نمونه‌ای از یک الگوریتم استاندارد برای حل آن را به آلفاایوالو داد. این ابزار نه تنها الگوریتم‌های جدیدی تولید کرد که می‌توانست ۱۴ اندازه مختلف از ماتریس‌ها را سریعتر از هر رویکرد موجود محاسبه کند، بلکه نتیجه رکوردشکن آلفاتنسور برای ضرب دو ماتریس چهار در چهار را نیز بهبود بخشید.

بالوگ می‌گوید آلفاایوالو ۱۶۰۰۰ کاندید پیشنهادی جِمینی را برای یافتن راه‌حل برنده امتیازدهی کرد، اما این هنوز کارآمدتر از آلفاتنسور است. راه‌حل آلفاتنسور نیز تنها زمانی کار می‌کرد که ماتریس با ۰ و ۱ پر شده بود. آلفاایوالو این مسئله را با اعداد دیگر نیز حل می‌کند.

موسباوئر می‌گوید: «نتیجه در مورد ضرب ماتریس بسیار چشمگیر است. این الگوریتم جدید پتانسیل تسریع محاسبات در عمل را دارد.»

مانوئل کائوئرز (Manuel Kauers)، ریاضی‌دانی در دانشگاه یوهانس کپلر (Johannes Kepler University) در لینتس، اتریش، موافق است: «بهبود برای ماتریس‌ها احتمالاً دارای اهمیت عملی است.»

از قضا، کائوئرز و همکارش اخیراً از یک تکنیک محاسباتی متفاوت برای یافتن برخی از سرعت‌بخشی‌هایی که آلفاایوالو به دست آورده بود، استفاده کرده‌اند. این دو هفته گذشته مقاله‌ای آنلاین منتشر کردند که نتایج خود را گزارش می‌دهد.

کائوئرز می‌گوید: «دیدن پیشرفت در درک ضرب ماتریس بسیار عالی است. هر تکنیکی که کمک کند، مشارکت ارزشمندی در این تلاش است.»

مسائل دنیای واقعی

ضرب ماتریس فقط یک پیشرفت بود. در مجموع، گوگل دیپ‌مایند آلفاایوالو را بر روی بیش از ۵۰ نوع مختلف از پازل‌های شناخته شده ریاضی آزمایش کرد، از جمله مسائل در تحلیل فوریه (ریاضیات پشت فشرده‌سازی داده، ضروری برای برنامه‌هایی مانند پخش ویدئو)، مسئله حداقل همپوشانی (مسئله‌ای باز در نظریه اعداد که توسط ریاضی‌دان پاول اِردوش (Paul Erdos) در سال ۱۹۵۵ پیشنهاد شد)، و اعداد بوسه‌زنی (kissing numbers) (مسئله‌ای که توسط آیزاک نیوتن (Isaac Newton) مطرح شد و کاربردهایی در علم مواد، شیمی و رمزنگاری دارد). آلفاایوالو در ۷۵% موارد با بهترین راه‌حل‌های موجود مطابقت داشت و در ۲۰% موارد راه‌حل‌های بهتری یافت.

سپس گوگل دیپ‌مایند آلفاایوالو را بر روی چند مسئله دنیای واقعی به کار برد. این ابزار علاوه بر ارائه یک الگوریتم کارآمدتر برای مدیریت منابع محاسباتی در مراکز داده، راهی برای کاهش مصرف برق تراشه‌های واحد پردازش تانسور تخصصی گوگل پیدا کرد.

آلفاایوالو حتی راهی برای سرعت بخشیدن به آموزش خودِ جِمینی نیز یافت، با تولید یک الگوریتم کارآمدتر برای مدیریت نوع خاصی از محاسبات مورد استفاده در فرآیند آموزش.

گوگل دیپ‌مایند قصد دارد به بررسی کاربردهای بالقوه ابزار خود ادامه دهد. یکی از محدودیت‌ها این است که آلفاایوالو نمی‌تواند برای مسائلی که راه‌حل‌های آن‌ها باید توسط یک شخص امتیازدهی شوند، مانند آزمایش‌های آزمایشگاهی که تابع تفسیر هستند، استفاده شود.

موسباوئر همچنین اشاره می‌کند که در حالی که آلفاایوالو ممکن است نتایج جدید چشمگیری در طیف وسیعی از مسائل تولید کند، بینش نظری کمی در مورد چگونگی رسیدن به آن راه‌حل‌ها ارائه می‌دهد. این یک نقطه ضعف در زمینه پیشبرد درک انسانی است.

با این وجود، ابزارهایی مانند آلفاایوالو قرار است روش کار پژوهشگران را تغییر دهند. کُلی می‌گوید: «فکر نمی‌کنم کارمان تمام شده باشد. می‌توانیم در مورد میزان قدرت این نوع رویکرد، بسیار فراتر برویم.»