یک بوروکراسی دولتی کاغذبازی تولید میکند—و وقتی کامپیوتری میشود، کاغذبازی بیشتری هم تولید میکند. اما قضاوت انسانی پرهزینه است. چه میشد اگر یک رایانه میتوانست به جای انسانها این کاغذبازیها را انجام دهد؟
دولت کارگری بریتانیا معتقد است که این امر نه تنها ممکن است، بلکه حیاتی است. طرح اقدام فرصتهای هوش مصنوعی قصد دارد میلیاردها پوند بریتانیایی را برای قرار دادن هوش مصنوعی در هر گوشه از بخش دولتی هزینه کند، به امید کارایی بینظیر و صرفهجویی هنگفت در هزینههای پرسنلی. کاغذبازیهای اداری خستهکننده به ماشینها سپرده خواهد شد. نخست وزیر کییر استارمر وعده داده است که این طرح "دههای از نوسازی ملی" را به ارمغان خواهد آورد.
دولت کارگری تنها هفت ماه پس از پیروزی قاطع در انتخابات، از نظرسنجیهای ناامیدکننده رنج میبرد. به نظر میرسد کاملاً بیایده است و اکنون تمام تلاش خود را برای یک پاس ماری که وعده معجزه میدهد، به کار گرفته است. اما این معجزات کارساز نخواهند بود، زیرا وقتی جزئیات مهم باشند، این فناوری کار نمیکند.
مسئله این است که "هوش مصنوعی" یک کلمه مد روز است. این اصطلاح به ندرت به فناوری خاصی اشاره دارد. در عوض، این بازاریابی برای این وعده است که رویاهای علمی تخیلی خدمتکاران رباتیک هر روز به واقعیت تبدیل خواهند شد. هدف همیشه جایگزینی کارمندان انسانی با ماشینها بوده است.
طرح هوش مصنوعی از موسسه تونی بلر (TBI) سرچشمه میگیرد که به عنوان "یکی از معماران اندیشه استارمر" خوانده شده است. مقاله مه ۲۰۲۴ TBI، "حکومتداری در عصر هوش مصنوعی: مدلی جدید برای تحول دولت" و پیگیری جولای ۲۰۲۴، "تاثیر بالقوه هوش مصنوعی بر نیروی کار بخش دولتی"، طرحی را برای متحول کردن بوروکراسی بریتانیا با سپردن وظایف پیش پا افتاده به هوش مصنوعی تشریح میکند—صرفهجویی بیش از ۲۰۰ میلیارد دلار در طول پنج سال و کاهش ۱ میلیون کارمند دولتی. بسیاری از اصطلاحات در طرح هوش مصنوعی مستقیماً از مقالات TBI گرفته شده است.
طرح بریتانیا برای قرار دادن هوش مصنوعی در همه چیز شامل یادگیری ماشینی—مدلهای آماری است که یاد میگیرند الگوها را در دادهها تجزیه و تحلیل کنند. یادگیری ماشینی منبع موفقیتهای تبلیغاتی طرح هوش مصنوعی در سازمان خدمات بهداشت ملی (National Health Service) در کارهایی مانند بررسی اسکنهای رادیولوژی است. اما جوهر این طرح جایگزینی مدیران انسانی در سراسر بخش دولتی با مدلهای زبانی بزرگ—چتباتها، مانند ChatGPT—است. تبلیغ هوش مصنوعی تمایل دارد از یادگیری ماشینی، که میتواند به خوبی کار کند، برای بازاریابی مدلهای زبانی بزرگ (LLM) استفاده کند—که خوب کار نمیکنند.
یک LLM متن تولید میکند. این به طور آماری بر روی مقدار زیادی متن—تا کل اینترنت عمومی—آموزش داده میشود و تشخیص میدهد که کدام کلمات از کلمات دیگر پیروی میکنند. شما یک اعلان به LLM میدهید، که ممکن است یک جمله یا یک سند کامل باشد، و یک پاسخ احتمالاً آماری تولید میکند. یک LLM صرفاً آماری است و فقط در سطح قطعات کلمه کار میکند. یک LLM "حقایق" را نمیداند، فقط میداند کدام کلمات از کلمات دیگر پیروی میکنند. این یک فوقتکمیل خودکار است.
افراد بسیار کمی که سعی کردهاند از یک چتبات مبتنی بر LLM برای کار اداری عملی استفاده کنند، مشاغل خود را به یکی از آنها اعتماد میکنند، مگر اینکه جزئیات مهم نباشند. LLMها، بنا به ماهیت خود، به طور بدنامی مستعد جعل و توهم هستند. این سیستمها فقط چیزهایی را میسازند—زیرا حقایق یک نوع داده در LLMها نیستند، فقط فراوانی کلمات هستند.
بنابراین LLMها میتوانند نمایشهای بسیار چشمگیری ارائه دهند—آنها تکمیلکنندههای خودکار بسیار خوبی هستند—اما وقتی جزئیات مهم هستند، تمایل دارند به روشهای فعالانه خطرناکی شکست بخورند. یکی از سنگ بناهای پروژه هوش مصنوعی حزب کارگر، ربات پردازش مشاوره جدید دولت به نام هامفری است که مطالب ارسالی را میخواند و خلاصه ای ارائه میدهد. اما کمیسیون اوراق بهادار و سرمایهگذاری استرالیا آزمایش کور LLMها را برای خلاصه کردن مشاورهها انجام داد و آنها را از نظر تمام معیارها نسبت به انسانها پایینتر یافت. رباتها نکات کلیدی را از دست دادند، تحلیلهایی را اضافه کردند که در متن منبع یافت نشد و معانی را معکوس کردند.
اما باور اصلی در قلب تلاش حزب کارگر برای هوش مصنوعی به نظر میرسد این باور است که LLMها به طور مؤثری جادویی هستند—که شما میتوانید اسناد دلخواه را از طریق یک LLM اجرا کنید و تجزیه و تحلیل با کیفیت انسانی را با تنها چند خطا دریافت کنید. گزارشها و پذیرش دولت از آنها بر اساس این فرض است.
این باور به مصونیت از خطای LLMها آنقدر قوی است که TBI حداقل دو مورد از گزارشهای خود را با پرسیدن پاسخ از یک نسخه مایکروسافت GPT-4 OpenAI نوشت، و چتبات را به جای بیرون رفتن و تحقیق در مورد وضعیت امور در محل انتخاب کرد—آنها معتقد بودند که یک چتبات آنقدر مؤثر خواهد بود که پاسخهای کافی برای یک گزارش جدی به آنها ارائه دهد.
محققان در ژوئیه ۲۰۲۴ به مطبوعات گفتند که "پیشبینی بر اساس مصاحبه با کارشناسان بسیار دشوار خواهد بود." گزارش نوامبر ۲۰۲۴ TBI، "تاثیر هوش مصنوعی بر بازار کار"، شامل چندین صفحه نمودار و نمودار از اعدادی است که با افتخار اعلام میکند توسط یک چتبات سنتز شدهاند. در علم، این به عنوان تقلب ساده در دادهها تلقی میشود.
حتی زمانی که اسناد مختلف به یافتههای قبلی استناد میکنند، آنها بررسی نمیشوند. گزارش نوامبر ادعا میکند که "هوش مصنوعی در حال حاضر باعث افزایش دو رقمی بهرهوری برای پذیرندگان اولیه در وظایف فردی میشود" و به یک بیانیه مطبوعاتی والمارت درباره جمعآوری دادهها در مورد اینکه چه اقلامی در قفسههای آن وجود دارد، استناد میکند. ادعایی مبنی بر اینکه "هوش مصنوعی در حال حاضر برای بهبود کارایی بازار کار با تطبیق بهتر کارگران با کارفرمایان استفاده میشود" به یک گزارش از دفتر ملی تحقیقات اقتصادی درباره جستجوهای شغلی اینترنتی استناد میکند که اصلاً به هوش مصنوعی اشاره نمیکند.
بیانیه مطبوعاتی استارمر ادعا کرد که صندوق بینالمللی پول (IMF) تخمین میزند که هوش مصنوعی بهرهوری را سالانه ۱.۵ درصد بهبود میبخشد—اما این معلوم شد که از یک گزارش IMF است که نسبت به گزارش گلدمن ساکس که این ادعا را مطرح میکرد، تردید داشت. گزارش اصلی گلدمن ساکس میگوید که برق و رایانههای شخصی حدود این مقدار تولید ناخالص داخلی را افزایش دادهاند، بنابراین نویسندگان فقط فرض کردند که LLMها تقریباً همین کار را انجام میدهند—اگرچه آنها اعتراف میکنند که "بسیار نامشخص" است.
TBI و حزب کارگر هر دو کمکهای مالی قابل توجهی از شرکتهای فناوری دریافت کردهاند که پیشنهادات هوش مصنوعی برای فروش دارند. طرح دولت این است که به این فروشندگان پول بدهد تا LLMها را بسازند و به هر داده عمومی که ممکن است بخواهند روی آنها آموزش دهند، دسترسی پیدا کنند.
با توجه به حساسیت ذاتی LLMها به جعل، استقرار گسترده احتمالاً به یک سری فجایع ختم میشود. هیچ کدام از این چیزها به خوبی یا قابل اعتماد کار نمیکنند.
در آموزش و پرورش، برنامهریزی درسی و نمرهدهی تکالیف با چتباتها انجام خواهد شد. یک فروشنده هوش مصنوعی ناشناس مواد موجود را پردازش میکند تا یک LLM را برای انجام این کارها آموزش دهد. دولت به یک "نظرسنجی" در حمایت از این موضوع استناد میکند، که در واقع یک گروه متمرکز تبلیغاتی هوش مصنوعی بود که توسط یک فروشنده اجرا شد.
در راهاندازی مطبوعاتی خود، چتبات مبتنی بر LLM در وبسایت رسمی دولت بریتانیا گاهی اوقات به سؤالات انگلیسی به زبان ولزی پاسخ میداد. به این سؤال پاسخ نمیداد که "رژیم مالیات شرکت چیست؟" زیرا از کلمه "رژیم" خوشش نمیآمد. با این وجود این یک بهبود نسبت به نسخه قبلی چتبات بود که گاهی اوقات به طور اغواکنندهای رفتار میکرد.
بیانیه مطبوعاتی استارمر پیشنهاد کرد دوربینهای مجهز به هوش مصنوعی چالههایی را که نیاز به تعمیر دارند، شناسایی کنند. اما آنچه مانع تعمیر چالهها میشود، یافتن آنها نیست، بلکه این است که بودجه شورای محلی از سال ۲۰۱۰ تاکنون ۴۰ درصد کاهش یافته است.
توصیههای هوش مصنوعی دولت احتمالاً به اجبار اجرا میشود. "مناطق رشد" هوش مصنوعی محدودیتهای برنامهریزی را برای فروشندگان مرکز داده Vantage، Nscale و Kyndryl دور میزنند. در انعکاسی از وزارت بهرهوری دولت ایالات متحده، یک دفتر نوآوری نظارتی در بریتانیا "تغییرات رفتاری را در تنظیمکنندهها" اجبار خواهد کرد.
یک معافیت حق تکثیر پیشنهادی برای واگذاری آثار خلاقانه بریتانیایی به شرکتهای هوش مصنوعی برای آموزش، ظاهراً تا ۲۵ فوریه هنوز در حال مشاوره است—اما دولت اکنون اعلام میکند که این طرح بدون توجه به این موضوع پیش خواهد رفت.
LLMها از نظر اقتصادی پایدار نیستند—OpenAI برای هر ۱ دلار درآمد، ۲.۳۵ دلار هزینه میکند. حباب هوش مصنوعی توسط میلیاردها سرمایه خطرپذیر با جای دیگری برای رفتن، تلاش برای تبلیغ یک بازار به وجود آمده، و شرکتهایی که ناامیدانه به دنبال افزایش هزینههای سازمانی هستند، حمایت میشود.
هدف از طرح دولت بریتانیا پمپاژ حباب هوش مصنوعی با پول عمومی است. وقتی حباب بترکد، خزانهداری تخلیه شده و خدمات عمومی با ژنراتورهای غذای بیکیفیت هوش مصنوعی اداره میشوند. چالهها پر نشده باقی خواهند ماند.