لری پیج (چپ) و سرگئی برین (راست) در حال صرف ناهار با کارمندان اولیه گوگل.
لری پیج (چپ) و سرگئی برین (راست) در حال صرف ناهار با کارمندان اولیه گوگل.

گوگل ۲۵ سال طول کشید تا برای این لحظه هوش مصنوعی آماده شود. اپل تازه شروع کرده است.

  • اپل در حوزه هوش مصنوعی با چالش‌هایی روبرو است، زیرا فاقد فناوری‌های بنیادی کلیدی است.
  • گوگل طی دهه‌ها بلوک‌های ساختاری قدرتمندی در هوش مصنوعی ایجاد کرده است.
  • اپل ممکن است برای جبران عقب‌ماندگی در هوش مصنوعی، مجبور به همکاری با رقبا یا انجام خریدهای بزرگ شود.

هوش مصنوعی کمی شبیه به ساختن ساختمان‌های اداری است.

ماه‌ها یا سال‌هاست که زمین یک حفره بزرگ بوده و به نظر می‌رسد هیچ اتفاقی نمی‌افتد. سپس، ناگهان، اسکلت فولادی بالا می‌رود و به دنبال آن دیوارها و پنجره‌ها نصب می‌شوند. بخشی که همه ما می‌بینیم، اغلب زمان بسیار کمتری می‌برد. کارهای فونداسیون زیر زمین سال‌ها طول می‌کشد و بدون آن، ساختمان پابرجا نخواهد بود.

در هوش مصنوعی، بلوک‌های ساختاری حیاتی، سال‌ها یا حتی دهه‌ها طول می‌کشند تا ظهور کنند. بسیاری از اینها برای کاربران نهایی قابل مشاهده نیستند، اما بدون این زیربنای فنی، محصولات هوش مصنوعی کار نمی‌کنند.

گوگل تقریباً تمامی این بلوک‌های ساختاری را در اختیار دارد. مایکروسافت، آمازون و متا نیز بسیاری از آن‌ها را دارند. OpenAI به شدت در تلاش است تا آن‌ها را پیاده‌سازی کند و راه درازی در پیش دارد. اپل تعداد بسیار کمی از این بلوک‌ها را داراست و این یک مشکل بزرگ برای سازنده آیفون است.

از آنجا که این بلوک‌های ساختاری در پس‌زمینه کار می‌کنند، ما اغلب مشکلات را به وضوح نمی‌بینیم. اما امسال، این مشکلات به طور کامل نمایان شدند، زمانی که اپل به‌روزرسانی بزرگ سیری مبتنی بر هوش مصنوعی خود را به تعویق انداخت.

این شرکت در تلاش بود تا زیرساخت‌های فنی دستیار دیجیتال خود را برای عصر هوش مصنوعی مولد به طور اساسی ارتقا دهد. اما آماده عرضه عمومی نبود. رفع صحیح مشکل سیری ممکن است نیازمند یک بازسازی اساسی باشد—اساساً توسعه بلوک‌های ساختاری حیاتی هوش مصنوعی تقریباً از صفر در برخی موارد. اگر این کار جواب ندهد، اپل ممکن است مجبور شود برای کمک به سایر غول‌های فناوری (و رقبا) تکیه کند یا به دنبال یک خرید بزرگ و پرهزینه برود. من هفته گذشته از اپل در مورد همه اینها سؤال کردم و پاسخی دریافت نکردم.

نموداری که فناوری پشتیبانی‌کننده سرویس ساخت ویدیوی Flow گوگل را نشان می‌دهد
نموداری که فناوری پشتیبانی‌کننده سرویس ساخت ویدیوی Flow گوگل را نشان می‌دهد.
گزارش BI/ChatGPT

بلوک‌های ساختاری گوگل

اپل به بلوک‌های ساختاری بسیاری در هوش مصنوعی نیاز دارد. برای درک بهتر، نگاهی بیندازید به آنچه گوگل در طول دهه‌ها برای اطمینان از آمادگی خود برای این لحظه هوش مصنوعی پیاده‌سازی کرده است.

به عنوان مثال، Flow وجود دارد، یک ابزار هوش مصنوعی مولد که گوگل هفته گذشته آن را رونمایی کرد و به سازندگان کمک می‌کند ویدیوهای حرفه‌ای تولید کنند. بسیاری از بلوک‌های ساختاری عظیم هوش مصنوعی زیربنای این محصول قرار دارند. در اینجا نگاهی اجمالی به برخی از آن‌ها داریم:

Veo مدل هوش مصنوعی تولید ویدیو گوگل است که اکنون در نسخه سوم خود قرار دارد. این مدل بدون تمام آن ویدیوهای یوتیوب برای آموزش وجود نداشت. چه کسی مالک یوتیوب است؟ بله، گوگل.

Imagen مدل تولید تصویر گوگل است که اکنون در نسخه چهارم خود قرار دارد. جمینی (Gemini) پاسخ گوگل به ChatGPT است. معماری ترانسفورمر (Transformer) پیشرفت پژوهشی بود که هوش مصنوعی مولد را ممکن ساخت. این فناوری حدود سال ۲۰۱۷ در گوگل اختراع شد. واحدهای پردازش تانسور (TPU) نوعی تراشه هوش مصنوعی گوگل هستند (در ادامه بیشتر توضیح داده خواهد شد).

اما اینها فراتر از این است. گوگل همه چیز را در وب فهرست‌بندی کرده و این کار را برای دهه‌ها انجام داده است. این شرکت حجم عظیمی از اطلاعات دیگر را به طرق مختلف جمع‌آوری می‌کند. این اطلاعات می‌تواند به عنوان داده آموزشی برای توسعه مدل‌های قدرتمند هوش مصنوعی استفاده شود.

چشم‌انداز هوش مصنوعی لری پیج

لری پیج، یکی از بنیان‌گذاران گوگل، در مصاحبه‌ای در سال ۲۰۰۰ درباره این موضوع صحبت کرد، زمانی که بیشتر ما نگران سازگاری ماشین‌های ظرفشویی خود با مشکل Y2K بودیم.

او زمانی که گوگل تنها دو سال داشت، گفت: "هوش مصنوعی، نسخه نهایی گوگل خواهد بود." "آنچه را که شما دقیقاً می‌خواهید، درک می‌کند و چیز درست را به شما می‌دهد. و این بدیهی است که هوش مصنوعی است. می‌تواند به هر سؤالی پاسخ دهد، زیرا تقریباً همه چیز در وب موجود است، درست است؟"

او گفت که گوگل حدود ۶۰۰۰ کامپیوتر برای ذخیره تقریباً ۱۰۰ کپی از وب در اختیار دارد. پیج که در آن زمان جوان و پرشور به نظر می‌رسید، گفت: "حجم زیادی از محاسبات، حجم زیادی از داده‌ها که قبلاً در دسترس نبودند. از دیدگاه مهندسی و علمی، ساختن چیزهایی برای استفاده از اینها یک تمرین فکری واقعاً جالب است. بنابراین انتظار داشتم که برای مدتی این کار را انجام دهم."

زمانی که گوگل در سال ۲۰۰۴ به عنوان ارائه‌دهنده موتور جستجو عمومی شد، از قبل یک شرکت هوش مصنوعی بود.

از الکس‌نت تا تنسورفلو

در سال ۲۰۱۲، محققان به یک پیشرفت بزرگ در هوش مصنوعی دست یافتند، زمانی که کامپیوترها را آموزش دادند تا فقط با "نگاه کردن" به اشیاء، آن‌ها را تشخیص داده و دسته‌بندی کنند. الکس کریشفسکی (Alex Krizhevsky)، ایلیا سوتسکیور (Ilya Sutskever) و جفری هینتون (Geoffrey Hinton)، استاد راهنمای آن‌ها در دانشگاه تورنتو، فناوری AlexNet را توسعه دادند و شرکتی به نام DNNresearch را تأسیس کردند. گوگل در سال ۲۰۱۳ این شرکت را خریداری کرد و تمام مالکیت فکری، از جمله کد منبع آن را به دست آورد.

اگر بخواهم یک بلوک ساختاری را برجسته کنم که منجر به محصول Flow گوگل شد، این لحظه است که حداقل ۱۲ سال پیش اتفاق افتاد.

در سال ۲۰۱۴، گوگل DeepMind، یک آزمایشگاه مخفی هوش مصنوعی را که توسط دمیس هاسابیس (Demis Hassabis) و مصطفی سلیمان (Mustafa Suleyman) اداره می‌شد، خریداری کرد. این بلوک ساختاری ایلان ماسک را تشویق کرد تا OpenAI را به عنوان یک وزنه تعادل در برابر قدرت رو به رشد هوش مصنوعی گوگل تأسیس کند. این اتفاق بیش از یک دهه پیش بود. هاسابیس و DeepMind اکنون بسیاری از چشمگیرترین خلاقیت‌های هوش مصنوعی گوگل را رهبری می‌کنند. سلیمان بخش‌های بزرگی از هوش مصنوعی مایکروسافت را مدیریت می‌کند.

قبل از کنفرانس بزرگ I/O گوگل در سال ۲۰۱۶، این شرکت من و تعدادی از روزنامه‌نگاران دیگر را دعوت کرد تا درباره "یادگیری ماشین" (Machine Learning)، شاخه‌ای از هوش مصنوعی، اطلاعات کسب کنیم. هینتون و دیگر پیشگامان هوش مصنوعی ساعت‌ها روی وایت‌برد می‌نوشتند و تلاش می‌کردند نحوه کار این فناوری پیچیده را به مخاطبانی توضیح دهند که احتمالاً در ریاضیات دبیرستان نمرات B یا پایین‌تر گرفته بودند. دردناک بود، اما باز هم نشان می‌دهد که گوگل چقدر در هوش مصنوعی پیشتاز بوده است.

در همان سال، گوگل TPUs (واحد پردازش تانسور) را معرفی کرد، مجموعه‌ای از تراشه‌های هوش مصنوعی ساخت خودش که با واحدهای پردازش گرافیکی انویدیا (Nvidia) رقابت می‌کنند. گوگل از TPUها در مراکز داده خود استفاده می‌کند و همچنین آن‌ها را از طریق سرویس ابری خود به شرکت‌ها و توسعه‌دهندگان دیگر اجاره می‌دهد. حتی یک فریم‌ورک هوش مصنوعی به نام تنسورفلو (TensorFlow) برای پشتیبانی از توسعه‌دهندگان یادگیری ماشین توسعه داد، اگرچه PyTorch متن‌باز متا اخیراً در آنجا پیشرفت کرده است.

ساندار پیچای، مدیرعامل گوگل، در کنفرانس توسعه‌دهندگان Google I/O در سال ۲۰۱۶ در Mountain View، کالیفرنیا، سخنرانی اصلی خود را ارائه می‌دهد.
ساندار پیچای، مدیرعامل گوگل، در سال ۲۰۱۶ در کنفرانس Google I/O سخنرانی اصلی را ارائه داد.
REUTERS/Stephen Lam

دنیای "هوش مصنوعی محور"

هفته گذشته، من دوباره در کنفرانس I/O شرکت کردم. ساندار پیچای (Sundar Pichai)، مدیرعامل گوگل، گفت که این شرکت به طور منحصر به فردی برای لحظه هوش مصنوعی مولد آماده است. این به نظر یک اظهارنظر گذرا می‌آید، اما نمایانگر یک ربع قرن کار است که با چشم‌انداز هوش مصنوعی پیج آغاز شد. تقریباً یک دهه پیش، پیچای گفت که گوگل به سمت دنیای محاسباتی "هوش مصنوعی محور" در حرکت است.

ایجاد و نگهداری تمامی این بلوک‌های ساختاری بسیار پرهزینه است. برای مثال، گوگل قصد دارد امسال ۷۵ میلیارد دلار در هزینه‌های سرمایه‌ای، عمدتاً برای مراکز داده هوش مصنوعی، سرمایه‌گذاری کند.

گوگل چگونه تمام این تأسیسات را تأمین می‌کند؟ خب، این شرکت یکی از بزرگترین خریداران انرژی تجدیدپذیر است و اخیراً قراردادهایی برای توسعه سه نیروگاه هسته‌ای منعقد کرده است. بدون تمامی اینها، گوگل نمی‌توانست در هوش مصنوعی رقابت کند.

وضعیت دشوار اپل

اپل بسیاری از این بلوک‌های ساختاری را ندارد. برای مثال، این شرکت تعداد زیادی مرکز داده بزرگ را اداره نمی‌کند و گاهی اوقات حتی از امکانات گوگل برای پروژه‌های مهم استفاده می‌کند.

به عنوان مثال، زمانی که کاربران دستگاه‌های اپل از پشتیبان‌گیری iCloud استفاده می‌کنند، داده‌های آنها اغلب در مراکز داده گوگل ذخیره می‌شود. وقتی نوبت به آموزش مدل‌های هوش مصنوعی اپل رسید که قدرت‌بخش Apple Intelligence جدید سازنده آیفون هستند، این شرکت دسترسی اضافی به TPUهای گوگل برای اجرای آموزش درخواست کرد.

چرا به رقیبی مانند این تکیه کنیم؟ خب، اپل تنها در چند سال گذشته شروع به کار بر روی یک تراشه هوش مصنوعی داخلی برای مراکز داده کرده است. این تقریباً هفت سال پس از معرفی TPUهای گوگل است.

اپل داده‌های زیادی دارد اما به دلیل نگرانی‌های مربوط به حریم خصوصی کاربران، در استفاده از آنها برای توسعه هوش مصنوعی محتاط بوده است. این شرکت تلاش کرده تا پردازش هوش مصنوعی را در دستگاه‌هایی مانند آیفون انجام دهد، اما این پروژه‌ها به قدرت محاسباتی عظیمی نیاز دارند که تنها مراکز داده می‌توانند آن را فراهم کنند.

اپل همچنین در جذب استعدادهای هوش مصنوعی کند عمل کرده است. این شرکت به محققان اجازه نمی‌داد مقالات خود را به صورت عمومی منتشر کنند یا محدودیت‌هایی در این زمینه اعمال می‌کرد. این یک عنصر اساسی برای جذب این استعدادهای حیاتی در طول سالیان متمادی بوده است. اپل در سال ۲۰۱۸ جان جیاناندریا (John Giannandrea)، پیشگام هوش مصنوعی را از گوگل استخدام کرد، اگرچه بلومبرگ گزارش داده که او در ایجاد تأثیر مشکل داشته است.

اگر هوش مصنوعی مولد دستگاه‌های محاسباتی مانند گوشی‌های هوشمند را متحول کند، این کمبود بلوک‌های ساختاری هوش مصنوعی می‌تواند به یک مشکل واقعی برای اپل تبدیل شود.

"اپل ناامید است!"

بن تامپسون (Ben Thompson)، وبلاگ‌نویس فناوری، از طرفداران اپل است و حتی او نیز نگران این موضوع است. هفته گذشته، او راه‌حل‌هایی را پیشنهاد کرد که به نظر دشوار یا ناخوشایند می‌رسند.

به عنوان مثال، او پیشنهاد کرد که اپل اجازه دهد سیری با سایر هوش‌های مصنوعی جایگزین شود. این گزینه جذاب است زیرا اپل از نیاز به صرف ۷۵ میلیارد دلار در سال برای رقابت با گوگل و دیگران در زمینه هوش مصنوعی پیشرو، اجتناب می‌کند.

بهترین گزینه در اینجا این است که ChatGPT جایگزین سیری شود. اما OpenAI اخیراً با جانی آیو (Jony Ive)، رئیس سابق بخش طراحی اپل، همکاری کرده است تا ابزارهایی را توسعه دهد که می‌توانند با آیفون رقابت کنند، که نشان می‌دهد ChatGPT راه‌حل آسانی نیست.

همکاری دیگر با گوگل ممکن است تحت نظارت ضد انحصاری قرار گیرد. متا (Meta) می‌تواند یک شریک هوش مصنوعی باشد، مگر اینکه به نظر می‌رسد مارک زاکربرگ (Mark Zuckerberg)، مدیرعامل آن، واقعاً اپل را دوست ندارد. Anthropic ایده دیگری است، اگرچه آمازون بخش زیادی از این استارتاپ را در اختیار دارد و گوگل نیز سهمی از آن را داراست.

تامپسون نوشت: "به طور فزاینده‌ای واضح است که فرصت سرمایه‌گذاری کم‌هزینه در حال از بین رفتن است و اپل باید به صرف پول جدی فکر کند."

این می‌تواند به شکل خریدهای بزرگ باشد. تامپسون پیشنهاد کرد که اپل شرکت SSI، یک استارتاپ که توسط سوتسکیور تأسیس شده است، را خریداری کند. اما این کار گران خواهد بود و در حال حاضر توسط آمازون حمایت می‌شود و ممکن است به طور فعال در حال مذاکره با گوگل برای سرمایه‌گذاری احتمالی باشد.

همه اینها به این معنی است که اپل، یک بار دیگر، باید از نظر هوش مصنوعی یک شرکت تازه تأسیس باشد. و با رقبایی مانند گوگل که یک چهارم قرن است مشغول توسعه این فناوری بوده‌اند، این یک نبرد دشوار برای اپل خواهد بود.