- یک مطالعه جدید نشان میدهد که مدلهای هوش مصنوعی در رفع خرابیهای برنامه در iOS بهتر از اندروید عمل میکنند.
- حتی مدل Gemini خود گوگل نیز در اندروید عملکرد ضعیفتری داشت.
- تنوع اکوسیستم اندروید و تغییرپذیری زبان ممکن است عملکرد مدلهای هوش مصنوعی را مختل کند.
وقتی برنامه تلفن همراه شما خراب میشود، اغلب یک تلاش دیوانهوار برای ردیابی باگ نرمافزاری و رفع سریع آن وجود دارد.
اکنون هوش مصنوعی برای این کار وجود دارد. اما طبق مطالعهای که روز پنجشنبه منتشر شد، این فناوری با پلتفرم iOS اپل بسیار بهتر از اندروید گوگل کار میکند.
یک شرکت نرمافزاری به نام Instabug ابزاری به نام SmartResolve ساخته است که از مدلهای پیشرو هوش مصنوعی برای خودکارسازی فرآیند شناسایی خرابیهای برنامه، تشخیص مشکل و تولید اصلاحات کد نرمافزاری قابل استفاده استفاده میکند.
آنها از مدلهای OpenAI، Anthropic، Google و Meta در برابر مجموعه دادهای از خرابیهای واقعی برنامه استفاده کردند. هر رفع بر اساس صحت، شباهت به رفعهای انسانی، عمق تحلیل علت اصلی، ارتباط و انسجام کلی امتیازدهی شد.
نتیجه مهم: مدلهای هوش مصنوعی به طور مداوم در iOS بهتر از اندروید عمل میکنند. Instabug دریافت که در پلتفرم اپل، رفع خرابیها دقیقتر، منسجمتر و خوشساختارتر در تقریباً هر مدلی که آزمایش شده بود، بود.
حتی مدل هوش مصنوعی گوگل هم در اندروید عملکرد بدتری داشت
به عنوان مثال، مدلهای OpenAI نتایج بسیار بهتری را در iOS ارائه دادند. GPT-4o در iOS امتیاز 60٪ در مقابل 49٪ در اندروید کسب کرد. با مدل o1 OpenAI، این تفاوت حتی چشمگیرتر بود: در iOS به 62٪ رسید اما در اندروید به 26٪ کاهش یافت و اغلب در تستهای اندروید به طور کامل پاسخ نمیداد.
مدلهای دیگر نیز از الگوی مشابهی پیروی کردند. Claude Sonnet 3.5 V1 از Anthropic در iOS امتیاز 58٪ و در اندروید 56٪ کسب کرد - شکاف کوچکتری، اما همچنان پیشتازی iOS.
حتی Gemini 1.5 Pro خود گوگل نیز در اندروید (51٪) بدتر از iOS (59٪) عمل کرد. Instabug دریافت که هنگام استفاده از پنجره زمینه بزرگتر خود نیز با مشکلات توهم بیشتری روبرو است.
چرا اندروید عقب مانده است؟
این اختلاف ممکن است ناشی از اکوسیستم پراکنده اندروید باشد. در مقایسه با iOS، که یک محیط یکنواختتر ارائه میدهد، طیف گستردهتری از دستگاهها و انواع خرابی اندروید میتواند تعمیم اصلاحات را برای مدلهای هوش مصنوعی دشوارتر کند.
کنی جانستون، مدیر ارشد تولید Instabug، گفت: «عملکرد قویتر در iOS تا حدی به دلیل ساختار زبانهای بومی iOS مانند Swift و Objective-C است. نحو آنها قابل پیشبینیتر و به شدت تایپ شده است، که تولید اصلاحات دقیق را برای LLMها آسانتر میکند.»
جانستون گفت زبانهای اندروید - جاوا و کاتلین - به همراه تغییرپذیری فرمت خرابی به معنای پیچیدگی بالاتر برای اصلاحات است.
اپل و گوگل به درخواستهای Business Insider برای اظهار نظر پاسخ ندادند.