تصویرسازی توسط بن کوته / آتلانتیک
تصویرسازی توسط بن کوته / آتلانتیک

به اسلاپ‌ورس خوش آمدید

هوش مصنوعی مولد توهم‌زا نیست. بلکه چندجهانی است.

بیل لوری، مدیر اجرایی فروش، زمانی که همکارش می‌پرسد کجا باید دختری را برای "دایناسور" بیرون ببرد، گیج می‌شود. لوری می‌پرسد: «تو داری برنامه‌ریزی می‌کنی که این دختر را برای دایناسور بیرون ببری؟» همکارش کاملاً بی‌خیال پاسخ می‌دهد: «درست است.» لوری با عصبانیت اصرار می‌کند: «صبر کن. تو داری می‌گویی دایناسور؟ این چه جور اصطلاح موج نو یا چیزی است که به جای ناهار می‌گویی دایناسور؟» وقتی لوری در اواخر روز به خانه باز می‌گردد، همسرش در حالی که برشی نان را کره می‌مالد، درباره پسر بیمارشان گزارش می‌دهد. «او خیلی رنگ‌پریده و به شدت گرفته است - و وقتی من برایش بردم به دایناسورش دست نزد.» فروشنده عقلش را از دست می‌دهد.

این فرض «بازی با کلمات»، قسمتی از بازسازی سریال منطقه گرگ و میش (The Twilight Zone) در دهه ۱۹۸۰ است. با گذشت زمان، افراد اطراف لوری شروع به صحبت کردن به شیوه‌ای درهم‌وبرهم‌تر می‌کنند و از کلمات آشنا به روش‌های ناآشنا استفاده می‌کنند. سرانجام، لوری خود را به یادگیری مجدد زبان انگلیسی از کتاب الفبای پسرش تسلیم می‌کند. صحنه آخر او را در حال کشیدن دست‌هایش بر روی تصویر سگی نشان می‌دهد که زیر آن کلمه چهارشنبه چاپ شده است.

«بازی با کلمات» درسی درباره ماهیت خطا ارائه می‌دهد: تغییرات کوچک و نامحسوس در هنجارها می‌توانند گیج‌کننده و خطرناک‌تر از تغییرات عمده و کلی باشند. به همین دلیل، این قسمت همچنین درسی درباره حقیقت و نادرستی در ChatGPT و سایر محصولات هوش مصنوعی مولد دارد. اکنون همه می‌دانند که مدل‌های زبانی بزرگ — یا LLMها، سیستم‌های زیربنایی چت‌بات‌ها — تمایل به اختراع چیزها دارند. آن‌ها پرونده‌های حقوقی ساختگی ایجاد می‌کنند و نرم‌افزارهای غیرموجود را توصیه می‌کنند. مردم این‌ها را «توهم» می‌نامند، و در نگاه اول این استعاره‌ای معقول به نظر می‌رسد: چت‌بات به نظر می‌رسد دچار وهم است و با اطمینان چیزهای غیرواقعی را به عنوان واقعی مطرح می‌کند.

اما این تصور اشتباهی است. توهم به این معناست که خطایی تحت یک باور غلط رخ می‌دهد. اما یک LLM به اطلاعات «غلطی» که ارائه می‌دهد، باور ندارد که درست است. اصلاً هیچ چیز را «باور» نمی‌کند. در عوض، یک LLM کلمه بعدی در یک جمله را بر اساس الگوهایی که از مصرف مقادیر بسیار زیادی متن آموخته است، پیش‌بینی می‌کند. یک LLM فکر نمی‌کند، و چیزی نمی‌داند. این مدل، الگوی جدیدی را بر اساس تفسیر خود از الگوی قبلی تفسیر می‌کند. یک چت‌بات همیشه فقط حدس‌های معتبر را به هم زنجیر می‌کند.

در «بازی با کلمات»، لوری دیوانه می‌شود نه به این دلیل که به او دروغ گفته می‌شود — همکار و همسرش واقعاً فکر می‌کنند کلمه ناهار، دایناسور است، درست همانطور که یک چت‌بات گاهی اوقات ادعا می‌کند که چسب به پیتزا تعلق دارد. لوری دیوانه می‌شود زیرا دنیایی که در آن زندگی می‌کند ناگهان کمی متفاوت است، بسیار آشنا اما هر از گاهی با مزخرفاتی که همه اطرافیانش آن را عادی می‌دانند، تکان می‌خورد. کلمات قدیمی با معانی جدید ساخته می‌شوند.

هوش مصنوعی چیزهایی را اختراع می‌کند، اما نه به معنای توهم، یعنی دیدن چیزی که وجود ندارد. ساختگی (Fabrication) می‌تواند به معنای «دروغ گفتن» باشد، یا می‌تواند به معنای «ساخت و ساز» باشد. یک LLM مورد دوم را انجام می‌دهد. این مدل نثر جدیدی را از مواد خام آماری نثر قدیمی می‌سازد. پرونده حقوقی اختراعی و نرم‌افزار ساختگی، اشیای واقعی در جهان حقیقی نیستند، بلکه موجودیت‌هایی معتبر — و حتی باورپذیر — در یک جهان جایگزین هستند. به عبارت دیگر، آن‌ها تخیلی هستند.

چت‌بات‌ها قانع‌کننده هستند زیرا جهان‌های تخیلی که ارائه می‌دهند، بسیار باورپذیرند. و این باورپذیری به این دلیل است که کار پیش‌بینی یک LLM بسیار مؤثر است. این امر زمانی که چت‌بات‌ها خطاهای آشکار مرتکب می‌شوند، و همچنین زمانی که به درخواست‌های تخیلی پاسخ می‌دهند، صادق است. این مکانیزم متمایز نیازمند استعاره بهتری است: این توهم‌زا نیست بلکه چندجهانی است. وقتی هوش مصنوعی مولد اطلاعات ساختگی ارائه می‌دهد، مسیری را به واقعیتی دیگر برای کاربر باز می‌کند؛ این مدل به جای توهم‌زدایی، چندجهانی عمل می‌کند. داستان‌های تخیلی حاصله، که بسیاری از آن‌ها بسیار کوچک و بی‌معنی هستند، می‌توانند بدون مشکل زیادی پذیرفته شوند.

تم چندجهانی — که ایده نسخه‌های شاخه‌دار و جایگزین واقعیت را ارائه می‌دهد — زمانی به فیزیک نظری، داستان‌های علمی-تخیلی مبهم، و خرده‌فرهنگ پاپ محدود می‌شد. اما اکنون در رسانه‌های جمعی رایج شده است. چندجهانی‌ها در جهان سینمایی مارول (Marvel Cinematic Universe) همه جا هستند. ریک و مورتی (Rick and Morty) یکی دارد، همانطور که همه جا همه چیز در آن واحد (Everything Everywhere All at Once) و ماده تاریک (Dark Matter) نیز دارند. جهان‌های جایگزین به تصویر کشیده شده در داستان‌ها این انتظار را ایجاد می‌کنند که چندجهانی‌ها تماشایی هستند، شامل کرم‌چاله‌ها و پورتال‌ها به جهان‌های فیزیکی موازی واقعی. به نظر می‌رسد ما به جای آن، چت‌بات‌های احمقانه دریافت کرده‌ایم، اگرچه ایده اصلی همان است. پرونده حقوقی غیرموجودی که هوش مصنوعی پیشنهاد می‌دهد می‌توانست در یک جهان بسیار مشابه و موازی با جهان ما وجود داشته باشد. نرم‌افزار ساختگی نیز همینطور.

ماهیت چندجهانی متن‌های تولید شده توسط LLMها زمانی که از چت‌بات‌ها برای ترکیب مفاهیم، یعنی تلفیق نوآورانه موضوعات متفاوت، استفاده می‌کنید، به راحتی قابل مشاهده است. من می‌توانم از ChatGPT بخواهم که شعری از چارلز بوکوفسکی درباره لَبوبو (Labubu) بنویسد و این مدل به من خطوطی مانند «فروشنده گفت، به آن اسباب‌بازی هنری می‌گویند، / انگار که این توضیحی بود. / سی دلار برای یک گوبلین که پوزخند می‌زند / انگار که می‌داند دنیا از قبل تمام شده است.» حتی در حالی که با اطمینان می‌دانم بوک هرگز چنین شعری ننوشته است، نتیجه باورپذیر است؛ می‌توانم دنیای ممکنی را تصور کنم که در آن شاعر و اسباب‌بازی گوبلین با هم وجود داشته‌اند و این مطالب از برخورد آن‌ها حاصل شده است. اما بررسی و تأیید هر جمله یا ارجاعی که یک LLM ارائه می‌دهد، طاقت‌فرسا خواهد بود — به خصوص با توجه به اینکه افزایش کارایی یکی از دلایل اصلی استفاده از LLM است. چت‌بات‌ها منطقه را با جهان‌های ممکن — که شاید بتوانیم آن‌ها را «جهان‌های آشفته (slopworlds)» بنامیم، و همگی با هم یک اسلاپ‌ورس را تشکیل می‌دهند — پر می‌کنند.

اسلاپ‌ورس هر چه LLMها بهتر شوند، بدتر می‌شود. این را در قالب داستان‌های چندجهانی در نظر بگیرید: ترسناک‌ترین یا وهم‌انگیزترین جهان‌های جایگزین آن‌هایی هستند که به نظر می‌رسند بسیار شبیه به جهان شناخته شده‌اند، با تغییرات کوچک. در «بازی با کلمات»، زبان برای بیل لوری بسیار تهدیدآمیزتر است زیرا کلمات آشنا معانی خود را تغییر داده‌اند، نه اینکه زبان انگلیسی با زبانی کاملاً متفاوت جایگزین شده باشد. در ماده تاریک، یک نسخه از شیکاگو در جهان موازی به عنوان یک سرزمین بایر و متروک، آشکارا خلاف واقع — و بنابراین کمتر وهم‌انگیز — است تا یک جهان موازی که در آن همسر شخصیت اصلی حرفه خود را به عنوان هنرمند برای بچه‌دار شدن رها نکرده بود. جهان‌های موازی که به شدت از واقعیت پذیرفته شده منحرف می‌شوند، به راحتی به عنوان پوچ یا خارق‌العاده پردازش می‌شوند — مانند جهان در همه جا همه چیز در آن واحد که در آن افراد انگشتانی از هات‌داگ دارند — و جهان‌های آشنا درس‌های ظریف‌تری از احتمال، امکان و پشیمانی را منتقل می‌کنند.

جهان‌های نزدیک مانند آن که لوری در منطقه گرگ و میش در آن زندگی می‌کند، می‌توانند همدلی و بی‌قراری ایجاد کنند، این حقیقت وهم‌انگیز که زندگی می‌تواند تقریباً همان باشد اما عمیقاً متفاوت. اما این ترفند فقط به این دلیل کار می‌کند که مخاطب می‌داند آن جهان‌ها خلاف واقع هستند (و آن‌ها می‌دانند زیرا داستان‌ها مستقیماً به آن‌ها می‌گویند). برای چت‌بات‌های هوش مصنوعی چنین نیست، که این موضوع را به یک معما تبدیل می‌کنند. بدتر اینکه، LLMها چندجهانی‌های کارکردی هستند تا روایی — آن‌ها ایده‌ها، نمادها و راه‌حل‌هایی را تولید می‌کنند که واقعاً به کار گرفته می‌شوند.

اینترنت پیش از ظهور LLMها، کاربران را به این وضعیت عادت داده بود. وقتی کسی چیزی را در گوگل جستجو می‌کند، وب‌سایت‌های حاصل لزوماً بهترین یا دقیق‌ترین نیستند، بلکه محبوب‌ترین‌ها (همراه با برخی که برای تبلیغ توسط موتور جستجو پول پرداخت کرده‌اند) هستند. اطلاعات آن‌ها ممکن است درست باشد، اما برای رسیدن به صدر نیازی به درست بودن ندارند. جستجو برای کالاها در آمازون یا دیگر خرده‌فروشان آنلاین نتایجی از نوع خاصی را به دست می‌آورد، اما لزوماً نتایج صحیح نیستند. به همین ترتیب، سایت‌های شبکه‌های اجتماعی مانند فیس‌بوک، X و تیک‌تاک محتوایی را نمایش می‌دهند که ممکن است جذاب باشد اما لزوماً به هر طریقی، یا اصلاً، صحیح نیست.

البته مردم مدت‌ها قبل از اینترنت توسط رسانه‌ها گمراه می‌شدند، اما از زمان ورود آن بیشتر نیز شده‌اند. در دو دهه گذشته، تقریباً هر چیزی که مردم آنلاین می‌بینند، به طور بالقوه نادرست، غیرقابل اعتماد یا به نحوی از واقعیت جدا شده است. هر کاربر اینترنت مجبور بوده است که یک تحلیل احتمالی دست‌ساز از هر آنچه آنلاین دیده است، انجام دهد و اعتبار آن را برای خطرات فریب یا حقه بررسی کند. اسلاپ‌ورس صرفاً این وضعیت را — و به شدت، تا هر کلامی — گسترش می‌دهد.

در مواجهه با مشکلاتی که اسلاپ‌ورس ایجاد می‌کند، طرفداران هوش مصنوعی احتمالاً همان استدلالی را مطرح می‌کنند که در مورد توهمات می‌کنند: اینکه در نهایت، داده‌ها، فرآیندهای آموزشی و معماری بهبود خواهند یافت، دقت را افزایش داده و شکاف چندجهانی را کاهش می‌دهند. شاید چنین شود.

اما یک امکان بدتر و شاید محتمل‌تر وجود دارد: اینکه مهم نیست فناوری چقدر بهبود یابد، تنها به صورت مجانبی این کار را انجام خواهد داد و باعث می‌شود تشخیص جهان‌های متعددی که هر تعامل چت ایجاد می‌کند، از دنیای واقعی دشوارتر و دشوارتر شود. بدترین کابوس‌ها در داستان‌های چندجهانی زمانی فرا می‌آیند که یک واقعیت جایگزین دقیقاً همانند باشد، به جز یک چیز، که ممکن است اهمیت نداشته باشد، یا ممکن است همه چیز را به کلی تغییر دهد.