اشکالات!
اشکالات!

مدل‌های هوش مصنوعی تمایل بیشتری به کار با پلتفرم موبایل اپل نسبت به گوگل دارند

  • یک مطالعه جدید نشان می‌دهد که مدل‌های هوش مصنوعی در رفع خرابی‌های برنامه در iOS بهتر از اندروید عمل می‌کنند.
  • حتی مدل Gemini خود گوگل نیز در اندروید عملکرد ضعیف‌تری داشت.
  • تنوع اکوسیستم اندروید و تغییرپذیری زبان ممکن است عملکرد مدل‌های هوش مصنوعی را مختل کند.

وقتی برنامه تلفن همراه شما خراب می‌شود، اغلب یک تلاش دیوانه‌وار برای ردیابی باگ نرم‌افزاری و رفع سریع آن وجود دارد.

اکنون هوش مصنوعی برای این کار وجود دارد. اما طبق مطالعه‌ای که روز پنجشنبه منتشر شد، این فناوری با پلتفرم iOS اپل بسیار بهتر از اندروید گوگل کار می‌کند.

یک شرکت نرم‌افزاری به نام Instabug ابزاری به نام SmartResolve ساخته است که از مدل‌های پیشرو هوش مصنوعی برای خودکارسازی فرآیند شناسایی خرابی‌های برنامه، تشخیص مشکل و تولید اصلاحات کد نرم‌افزاری قابل استفاده استفاده می‌کند.

آنها از مدل‌های OpenAI، Anthropic، Google و Meta در برابر مجموعه داده‌ای از خرابی‌های واقعی برنامه استفاده کردند. هر رفع بر اساس صحت، شباهت به رفع‌های انسانی، عمق تحلیل علت اصلی، ارتباط و انسجام کلی امتیازدهی شد.

نتیجه مهم: مدل‌های هوش مصنوعی به طور مداوم در iOS بهتر از اندروید عمل می‌کنند. Instabug دریافت که در پلتفرم اپل، رفع خرابی‌ها دقیق‌تر، منسجم‌تر و خوش‌ساختارتر در تقریباً هر مدلی که آزمایش شده بود، بود.

حتی مدل هوش مصنوعی گوگل هم در اندروید عملکرد بدتری داشت

به عنوان مثال، مدل‌های OpenAI نتایج بسیار بهتری را در iOS ارائه دادند. GPT-4o در iOS امتیاز 60٪ در مقابل 49٪ در اندروید کسب کرد. با مدل o1 OpenAI، این تفاوت حتی چشمگیرتر بود: در iOS به 62٪ رسید اما در اندروید به 26٪ کاهش یافت و اغلب در تست‌های اندروید به طور کامل پاسخ نمی‌داد.

مدل‌های دیگر نیز از الگوی مشابهی پیروی کردند. Claude Sonnet 3.5 V1 از Anthropic در iOS امتیاز 58٪ و در اندروید 56٪ کسب کرد - شکاف کوچکتری، اما همچنان پیشتازی iOS.

حتی Gemini 1.5 Pro خود گوگل نیز در اندروید (51٪) بدتر از iOS (59٪) عمل کرد. Instabug دریافت که هنگام استفاده از پنجره زمینه بزرگتر خود نیز با مشکلات توهم بیشتری روبرو است.

چرا اندروید عقب مانده است؟

این اختلاف ممکن است ناشی از اکوسیستم پراکنده اندروید باشد. در مقایسه با iOS، که یک محیط یکنواخت‌تر ارائه می‌دهد، طیف گسترده‌تری از دستگاه‌ها و انواع خرابی اندروید می‌تواند تعمیم اصلاحات را برای مدل‌های هوش مصنوعی دشوارتر کند.

کنی جانستون، مدیر ارشد تولید Instabug، گفت: «عملکرد قوی‌تر در iOS تا حدی به دلیل ساختار زبان‌های بومی iOS مانند Swift و Objective-C است. نحو آنها قابل پیش‌بینی‌تر و به شدت تایپ شده است، که تولید اصلاحات دقیق را برای LLMها آسان‌تر می‌کند.»

جانستون گفت زبان‌های اندروید - جاوا و کاتلین - به همراه تغییرپذیری فرمت خرابی به معنای پیچیدگی بالاتر برای اصلاحات است.

اپل و گوگل به درخواست‌های Business Insider برای اظهار نظر پاسخ ندادند.