- اپل در حوزه هوش مصنوعی با چالشهایی روبرو است، زیرا فاقد فناوریهای بنیادی کلیدی است.
- گوگل طی دههها بلوکهای ساختاری قدرتمندی در هوش مصنوعی ایجاد کرده است.
- اپل ممکن است برای جبران عقبماندگی در هوش مصنوعی، مجبور به همکاری با رقبا یا انجام خریدهای بزرگ شود.
هوش مصنوعی کمی شبیه به ساختن ساختمانهای اداری است.
ماهها یا سالهاست که زمین یک حفره بزرگ بوده و به نظر میرسد هیچ اتفاقی نمیافتد. سپس، ناگهان، اسکلت فولادی بالا میرود و به دنبال آن دیوارها و پنجرهها نصب میشوند. بخشی که همه ما میبینیم، اغلب زمان بسیار کمتری میبرد. کارهای فونداسیون زیر زمین سالها طول میکشد و بدون آن، ساختمان پابرجا نخواهد بود.
در هوش مصنوعی، بلوکهای ساختاری حیاتی، سالها یا حتی دههها طول میکشند تا ظهور کنند. بسیاری از اینها برای کاربران نهایی قابل مشاهده نیستند، اما بدون این زیربنای فنی، محصولات هوش مصنوعی کار نمیکنند.
گوگل تقریباً تمامی این بلوکهای ساختاری را در اختیار دارد. مایکروسافت، آمازون و متا نیز بسیاری از آنها را دارند. OpenAI به شدت در تلاش است تا آنها را پیادهسازی کند و راه درازی در پیش دارد. اپل تعداد بسیار کمی از این بلوکها را داراست و این یک مشکل بزرگ برای سازنده آیفون است.
از آنجا که این بلوکهای ساختاری در پسزمینه کار میکنند، ما اغلب مشکلات را به وضوح نمیبینیم. اما امسال، این مشکلات به طور کامل نمایان شدند، زمانی که اپل بهروزرسانی بزرگ سیری مبتنی بر هوش مصنوعی خود را به تعویق انداخت.
این شرکت در تلاش بود تا زیرساختهای فنی دستیار دیجیتال خود را برای عصر هوش مصنوعی مولد به طور اساسی ارتقا دهد. اما آماده عرضه عمومی نبود. رفع صحیح مشکل سیری ممکن است نیازمند یک بازسازی اساسی باشد—اساساً توسعه بلوکهای ساختاری حیاتی هوش مصنوعی تقریباً از صفر در برخی موارد. اگر این کار جواب ندهد، اپل ممکن است مجبور شود برای کمک به سایر غولهای فناوری (و رقبا) تکیه کند یا به دنبال یک خرید بزرگ و پرهزینه برود. من هفته گذشته از اپل در مورد همه اینها سؤال کردم و پاسخی دریافت نکردم.
بلوکهای ساختاری گوگل
اپل به بلوکهای ساختاری بسیاری در هوش مصنوعی نیاز دارد. برای درک بهتر، نگاهی بیندازید به آنچه گوگل در طول دههها برای اطمینان از آمادگی خود برای این لحظه هوش مصنوعی پیادهسازی کرده است.
به عنوان مثال، Flow وجود دارد، یک ابزار هوش مصنوعی مولد که گوگل هفته گذشته آن را رونمایی کرد و به سازندگان کمک میکند ویدیوهای حرفهای تولید کنند. بسیاری از بلوکهای ساختاری عظیم هوش مصنوعی زیربنای این محصول قرار دارند. در اینجا نگاهی اجمالی به برخی از آنها داریم:
Veo مدل هوش مصنوعی تولید ویدیو گوگل است که اکنون در نسخه سوم خود قرار دارد. این مدل بدون تمام آن ویدیوهای یوتیوب برای آموزش وجود نداشت. چه کسی مالک یوتیوب است؟ بله، گوگل.
Imagen مدل تولید تصویر گوگل است که اکنون در نسخه چهارم خود قرار دارد. جمینی (Gemini) پاسخ گوگل به ChatGPT است. معماری ترانسفورمر (Transformer) پیشرفت پژوهشی بود که هوش مصنوعی مولد را ممکن ساخت. این فناوری حدود سال ۲۰۱۷ در گوگل اختراع شد. واحدهای پردازش تانسور (TPU) نوعی تراشه هوش مصنوعی گوگل هستند (در ادامه بیشتر توضیح داده خواهد شد).
اما اینها فراتر از این است. گوگل همه چیز را در وب فهرستبندی کرده و این کار را برای دههها انجام داده است. این شرکت حجم عظیمی از اطلاعات دیگر را به طرق مختلف جمعآوری میکند. این اطلاعات میتواند به عنوان داده آموزشی برای توسعه مدلهای قدرتمند هوش مصنوعی استفاده شود.
چشمانداز هوش مصنوعی لری پیج
لری پیج، یکی از بنیانگذاران گوگل، در مصاحبهای در سال ۲۰۰۰ درباره این موضوع صحبت کرد، زمانی که بیشتر ما نگران سازگاری ماشینهای ظرفشویی خود با مشکل Y2K بودیم.
او زمانی که گوگل تنها دو سال داشت، گفت: "هوش مصنوعی، نسخه نهایی گوگل خواهد بود." "آنچه را که شما دقیقاً میخواهید، درک میکند و چیز درست را به شما میدهد. و این بدیهی است که هوش مصنوعی است. میتواند به هر سؤالی پاسخ دهد، زیرا تقریباً همه چیز در وب موجود است، درست است؟"
او گفت که گوگل حدود ۶۰۰۰ کامپیوتر برای ذخیره تقریباً ۱۰۰ کپی از وب در اختیار دارد. پیج که در آن زمان جوان و پرشور به نظر میرسید، گفت: "حجم زیادی از محاسبات، حجم زیادی از دادهها که قبلاً در دسترس نبودند. از دیدگاه مهندسی و علمی، ساختن چیزهایی برای استفاده از اینها یک تمرین فکری واقعاً جالب است. بنابراین انتظار داشتم که برای مدتی این کار را انجام دهم."
زمانی که گوگل در سال ۲۰۰۴ به عنوان ارائهدهنده موتور جستجو عمومی شد، از قبل یک شرکت هوش مصنوعی بود.
از الکسنت تا تنسورفلو
در سال ۲۰۱۲، محققان به یک پیشرفت بزرگ در هوش مصنوعی دست یافتند، زمانی که کامپیوترها را آموزش دادند تا فقط با "نگاه کردن" به اشیاء، آنها را تشخیص داده و دستهبندی کنند. الکس کریشفسکی (Alex Krizhevsky)، ایلیا سوتسکیور (Ilya Sutskever) و جفری هینتون (Geoffrey Hinton)، استاد راهنمای آنها در دانشگاه تورنتو، فناوری AlexNet را توسعه دادند و شرکتی به نام DNNresearch را تأسیس کردند. گوگل در سال ۲۰۱۳ این شرکت را خریداری کرد و تمام مالکیت فکری، از جمله کد منبع آن را به دست آورد.
اگر بخواهم یک بلوک ساختاری را برجسته کنم که منجر به محصول Flow گوگل شد، این لحظه است که حداقل ۱۲ سال پیش اتفاق افتاد.
در سال ۲۰۱۴، گوگل DeepMind، یک آزمایشگاه مخفی هوش مصنوعی را که توسط دمیس هاسابیس (Demis Hassabis) و مصطفی سلیمان (Mustafa Suleyman) اداره میشد، خریداری کرد. این بلوک ساختاری ایلان ماسک را تشویق کرد تا OpenAI را به عنوان یک وزنه تعادل در برابر قدرت رو به رشد هوش مصنوعی گوگل تأسیس کند. این اتفاق بیش از یک دهه پیش بود. هاسابیس و DeepMind اکنون بسیاری از چشمگیرترین خلاقیتهای هوش مصنوعی گوگل را رهبری میکنند. سلیمان بخشهای بزرگی از هوش مصنوعی مایکروسافت را مدیریت میکند.
قبل از کنفرانس بزرگ I/O گوگل در سال ۲۰۱۶، این شرکت من و تعدادی از روزنامهنگاران دیگر را دعوت کرد تا درباره "یادگیری ماشین" (Machine Learning)، شاخهای از هوش مصنوعی، اطلاعات کسب کنیم. هینتون و دیگر پیشگامان هوش مصنوعی ساعتها روی وایتبرد مینوشتند و تلاش میکردند نحوه کار این فناوری پیچیده را به مخاطبانی توضیح دهند که احتمالاً در ریاضیات دبیرستان نمرات B یا پایینتر گرفته بودند. دردناک بود، اما باز هم نشان میدهد که گوگل چقدر در هوش مصنوعی پیشتاز بوده است.
در همان سال، گوگل TPUs (واحد پردازش تانسور) را معرفی کرد، مجموعهای از تراشههای هوش مصنوعی ساخت خودش که با واحدهای پردازش گرافیکی انویدیا (Nvidia) رقابت میکنند. گوگل از TPUها در مراکز داده خود استفاده میکند و همچنین آنها را از طریق سرویس ابری خود به شرکتها و توسعهدهندگان دیگر اجاره میدهد. حتی یک فریمورک هوش مصنوعی به نام تنسورفلو (TensorFlow) برای پشتیبانی از توسعهدهندگان یادگیری ماشین توسعه داد، اگرچه PyTorch متنباز متا اخیراً در آنجا پیشرفت کرده است.
دنیای "هوش مصنوعی محور"
هفته گذشته، من دوباره در کنفرانس I/O شرکت کردم. ساندار پیچای (Sundar Pichai)، مدیرعامل گوگل، گفت که این شرکت به طور منحصر به فردی برای لحظه هوش مصنوعی مولد آماده است. این به نظر یک اظهارنظر گذرا میآید، اما نمایانگر یک ربع قرن کار است که با چشمانداز هوش مصنوعی پیج آغاز شد. تقریباً یک دهه پیش، پیچای گفت که گوگل به سمت دنیای محاسباتی "هوش مصنوعی محور" در حرکت است.
ایجاد و نگهداری تمامی این بلوکهای ساختاری بسیار پرهزینه است. برای مثال، گوگل قصد دارد امسال ۷۵ میلیارد دلار در هزینههای سرمایهای، عمدتاً برای مراکز داده هوش مصنوعی، سرمایهگذاری کند.
گوگل چگونه تمام این تأسیسات را تأمین میکند؟ خب، این شرکت یکی از بزرگترین خریداران انرژی تجدیدپذیر است و اخیراً قراردادهایی برای توسعه سه نیروگاه هستهای منعقد کرده است. بدون تمامی اینها، گوگل نمیتوانست در هوش مصنوعی رقابت کند.
وضعیت دشوار اپل
اپل بسیاری از این بلوکهای ساختاری را ندارد. برای مثال، این شرکت تعداد زیادی مرکز داده بزرگ را اداره نمیکند و گاهی اوقات حتی از امکانات گوگل برای پروژههای مهم استفاده میکند.
به عنوان مثال، زمانی که کاربران دستگاههای اپل از پشتیبانگیری iCloud استفاده میکنند، دادههای آنها اغلب در مراکز داده گوگل ذخیره میشود. وقتی نوبت به آموزش مدلهای هوش مصنوعی اپل رسید که قدرتبخش Apple Intelligence جدید سازنده آیفون هستند، این شرکت دسترسی اضافی به TPUهای گوگل برای اجرای آموزش درخواست کرد.
چرا به رقیبی مانند این تکیه کنیم؟ خب، اپل تنها در چند سال گذشته شروع به کار بر روی یک تراشه هوش مصنوعی داخلی برای مراکز داده کرده است. این تقریباً هفت سال پس از معرفی TPUهای گوگل است.
اپل دادههای زیادی دارد اما به دلیل نگرانیهای مربوط به حریم خصوصی کاربران، در استفاده از آنها برای توسعه هوش مصنوعی محتاط بوده است. این شرکت تلاش کرده تا پردازش هوش مصنوعی را در دستگاههایی مانند آیفون انجام دهد، اما این پروژهها به قدرت محاسباتی عظیمی نیاز دارند که تنها مراکز داده میتوانند آن را فراهم کنند.
اپل همچنین در جذب استعدادهای هوش مصنوعی کند عمل کرده است. این شرکت به محققان اجازه نمیداد مقالات خود را به صورت عمومی منتشر کنند یا محدودیتهایی در این زمینه اعمال میکرد. این یک عنصر اساسی برای جذب این استعدادهای حیاتی در طول سالیان متمادی بوده است. اپل در سال ۲۰۱۸ جان جیاناندریا (John Giannandrea)، پیشگام هوش مصنوعی را از گوگل استخدام کرد، اگرچه بلومبرگ گزارش داده که او در ایجاد تأثیر مشکل داشته است.
اگر هوش مصنوعی مولد دستگاههای محاسباتی مانند گوشیهای هوشمند را متحول کند، این کمبود بلوکهای ساختاری هوش مصنوعی میتواند به یک مشکل واقعی برای اپل تبدیل شود.
"اپل ناامید است!"
بن تامپسون (Ben Thompson)، وبلاگنویس فناوری، از طرفداران اپل است و حتی او نیز نگران این موضوع است. هفته گذشته، او راهحلهایی را پیشنهاد کرد که به نظر دشوار یا ناخوشایند میرسند.
به عنوان مثال، او پیشنهاد کرد که اپل اجازه دهد سیری با سایر هوشهای مصنوعی جایگزین شود. این گزینه جذاب است زیرا اپل از نیاز به صرف ۷۵ میلیارد دلار در سال برای رقابت با گوگل و دیگران در زمینه هوش مصنوعی پیشرو، اجتناب میکند.
بهترین گزینه در اینجا این است که ChatGPT جایگزین سیری شود. اما OpenAI اخیراً با جانی آیو (Jony Ive)، رئیس سابق بخش طراحی اپل، همکاری کرده است تا ابزارهایی را توسعه دهد که میتوانند با آیفون رقابت کنند، که نشان میدهد ChatGPT راهحل آسانی نیست.
همکاری دیگر با گوگل ممکن است تحت نظارت ضد انحصاری قرار گیرد. متا (Meta) میتواند یک شریک هوش مصنوعی باشد، مگر اینکه به نظر میرسد مارک زاکربرگ (Mark Zuckerberg)، مدیرعامل آن، واقعاً اپل را دوست ندارد. Anthropic ایده دیگری است، اگرچه آمازون بخش زیادی از این استارتاپ را در اختیار دارد و گوگل نیز سهمی از آن را داراست.
تامپسون نوشت: "به طور فزایندهای واضح است که فرصت سرمایهگذاری کمهزینه در حال از بین رفتن است و اپل باید به صرف پول جدی فکر کند."
این میتواند به شکل خریدهای بزرگ باشد. تامپسون پیشنهاد کرد که اپل شرکت SSI، یک استارتاپ که توسط سوتسکیور تأسیس شده است، را خریداری کند. اما این کار گران خواهد بود و در حال حاضر توسط آمازون حمایت میشود و ممکن است به طور فعال در حال مذاکره با گوگل برای سرمایهگذاری احتمالی باشد.
همه اینها به این معنی است که اپل، یک بار دیگر، باید از نظر هوش مصنوعی یک شرکت تازه تأسیس باشد. و با رقبایی مانند گوگل که یک چهارم قرن است مشغول توسعه این فناوری بودهاند، این یک نبرد دشوار برای اپل خواهد بود.