گاوها در یک دامداری در مرسد، کالیفرنیا، در سال ۲۰۲۰. (ملینا مارا/واشنگتن پست)
گاوها در یک دامداری در مرسد، کالیفرنیا، در سال ۲۰۲۰. (ملینا مارا/واشنگتن پست)

آمارهای عجیب درباره جایگاه آمریکا در جهان، به‌علاوه آنچه مردم واقعاً از چت‌بات‌های هوش مصنوعی می‌پرسند

این هفته، عمیقاً در مجموعه‌داده‌های جدید از بانک جهانی و محققان هوش مصنوعی در آنتروپیک غواصی می‌کنیم.

آیا می‌دانستید رومانیایی‌ها در مصرف الکل در جهان پیشتاز هستند؟ یا اینکه دوستان ما در سنگاپور و چین شب‌ها هنگام بازگشت به خانه احساس امنیت بیشتری می‌کنند؟

ما این اطلاعات را به لطف محققان سخت‌کوشی می‌دانیم که مشغول مطالعه مهم مقایسه‌های جهانی هستند. اما باید اعتراف کنیم: فعالیت‌های کمی به اندازه سر و کله زدن با داده‌های خام بین‌المللی از حدود ۲۰۰ کشور جهان – بسته به اینکه چه کسی شمارش می‌کند – هر کدام با زبان، روش‌شناسی و ویژگی‌های داده‌ای خاص خود، برای ما دردسرساز هستند.

برای مقایسه کارآمد و دقیق ملت‌ها، شما به طور ایده‌آل به نوعی غول جهانی نیاز دارید که کارشناسانش در محل به جمع‌آوری داده‌ها در همه جا از آنگولا تا زامبیا کمک کنند.

به عبارت دیگر، شما به بانک جهانی نیاز دارید.

به لطف مجموعه شاخص‌های توسعه جهانی آن که سال‌هاست محبوب‌ترین صفحه وب‌سایت آن است، بانک جهانی یکی از بزرگترین عرضه‌کنندگان داده‌های جهانی است. اما سال‌هاست که بخش زیادی از توان داده‌ای عمیق‌تر آن، پنهان و بین یکی از بزرگترین نهادهای بین‌المللی زمین تقسیم شده بود.

تاکنون.

ماه گذشته، گروه داده بانک ما را به دفترشان در واشنگتن کشاندند – درود بر نگهبان امنیتی که ما را از وجود یک عنکبوت نگران‌کننده در کوله‌پشتی‌مان مطلع کرد! – تا نگاهی پنهانی به Data360 بیندازیم، که اوج تلاشی چندین ساله برای جمع‌آوری، استانداردسازی و بهبود مجموعه‌داده‌های جهانی از بانک و فراتر از آن است.

هایشان فو (Haishan Fu)، که به عنوان آمارشناس ارشد و مسئول داده بانک، تیم پشت Data360 را اداره می‌کند، گفت: «فناوری تکامل یافته است... برای مهار داده‌ها به عنوان یک نیروی تحول‌آفرین، باید ظرفیت خود را تقویت کنیم.»

و خدای من، واقعا تقویت شده است! بانک از حدود ۱,۵۰۰ مجموعه داده در مخزن مرکزی خود به نزدیک ۱۰,۰۰۰ مجموعه داده جهش کرده است، و آنها قصد دارند به افزودن ادامه دهند زیرا مجموعه‌داده‌های اضافی در کشوها و سرورها در پست‌های دورتر بانک پیدا می‌شوند. یا از طریق مشارکت‌های بانک با کشورهای عضو، که بر «تقویت تولید داده توسط کشورهای در حال توسعه و حمایت از دفاتر آمار ملی آنها» تمرکز دارد، تازه جمع‌آوری می‌شوند، گفت کریگ همر (Craig Hammer)، که به مدیریت دفتر فو و راه‌اندازی Data360 کمک می‌کند.

نتایج خیره‌کننده است. در طول یک شب هیجان‌انگیز که در ۶,۴۱۷ مجموعه داده شامل ایالات متحده پیمایش می‌کردیم، مدام با معیارهایی روبرو می‌شدیم که هرگز ندیده بودیم.

آیا می‌دانستید ایالات متحده عربستان سعودی آب‌های زیرزمینی تجدیدپذیر است و با ۶۷ درصد بیشتر از چین (که در جایگاه دوم قرار دارد) در جهان پیشتاز است (که تا حدی با نرخ برداشت آب شیرین ما که در جایگاه سوم جهان است، جبران می‌شود)؟

ما همچنین در زمینه پول ارسال شده توسط مهاجران به خانه در جهان پیشتاز هستیم و سالانه ۲.۲ برابر امارات متحده عربی یا عربستان سعودی، که تقریباً در جایگاه دوم قرار دارند، ارسال می‌کنیم.

و تنها نروژ در فراوانی چیزی به نام مرجان‌های آب سرد از ما عقب‌تر است، که حتی اگر هنوز اهمیت آن را درک نکنیم، احساس اطمینان‌بخشی می‌دهد – کارشناسان، لطفاً بنویسید! ما همچنین در رتبه ششم مرجان‌های آب گرم که بیشتر مورد مطالعه قرار گرفته‌اند، قرار داریم، حتی قبل از اینکه قلمروهایی مانند پورتوریکو را حساب کنیم.

آمریکا دارای قدرتمندترین سیستم‌های حمل و نقل هوایی مسافر و بار هوایی در جهان است و بار بیشتری را از طریق راه‌آهن نسبت به هر کشوری جز چین و روسیه جابجا می‌کند. اما وقتی صحبت از حمل و نقل ریلی مسافر می‌شود، با ایتالیا و اوکراین (قبل از جنگ) برای شانس ورود به ۱۰ رتبه برتر رقابت می‌کنیم. اگر بانک هنوز داده‌هایی برای مصر داشت، ممکن بود حتی پایین‌تر رتبه‌بندی شویم.

ما در تعداد ورزشگاه‌های بزرگ، جلوتر از چین، در رتبه اول قرار داریم. اما، در یک ضربه ویرانگر به خودانگاره گوشت‌خوار ما، تنها در رتبه ششم در تأمین پروتئین حیوانی به ازای هر نفر قرار داریم، پشت سر ایسلند، هنگ کنگ، مغولستان، ایرلند و لیتوانی.

ما در میان کشورهایی هستیم که کمترین آسیب‌پذیری در برابر ناامنی غذایی را داریم و سیزدهمین نرخ پایین سل را داریم. اما امید به زندگی ما از رتبه ۱۴ در سال ۱۹۷۹ به ۶۲ در سال ۲۰۲۲ کاهش یافته است. در همین حال، نرخ خودکشی ما از سال ۲۰۰۰ تا ۲۰۱۹ به طور چشمگیری افزایش یافته است، از رتبه ۶۶ به ۲۵ در میان مردان و از رتبه ۹۳ به ۲۹ در میان زنان.

فو و تیمش پایگاه داده را با در نظر گرفتن هوش مصنوعی طراحی کرده‌اند. ما می‌دانیم که عرضه‌کنندگان چت‌بات به هر حال داده‌های رایگان و باز را استفاده خواهند کرد، پس چرا احتمال بازتولید ایمن و دقیق آن را افزایش ندهیم؟

نگرش آنها بازتاب دهنده حکمت رایج در مورد تأمین کاندوم برای نوجوانان است – موضوعی که البته بانک داده‌هایی در مورد آن دارد!

آنچه وقتی کسی نگاه نمی‌کند به چت‌بات‌ها می‌گوییم

در مورد هوش مصنوعی صحبت شد، خوانندگان اغلب از ما می‌پرسند که مردم واقعاً در مورد چه چیزی با چت‌بات‌های هوش مصنوعی گفتگو می‌کنند. حالا ما پاسخی داریم.

محققان با شاخص اقتصادی آنتروپیک، یک میلیون پرسش (ناشناس) را که مردم در فوریه و مارس در دستیار هوش مصنوعی معروف به کلود (Claude) تایپ کرده بودند، تجزیه و تحلیل کردند و از یک ابزار هوش مصنوعی داخلی برای گروه‌بندی آنها در ۶۳۰ دسته استفاده کردند، که از «پیش‌نویس یک پیام رد مودبانه که روابط حرفه‌ای را حفظ کند» تا «نقش‌آفرینی به عنوان شخصیت‌های داستانی در سناریوهای روایی» را شامل می‌شود.

دسته‌های کلی به سمت سؤالات مرتبط با برنامه‌نویسی متمایل هستند، که یک حوزه تخصصی برای کلود به طور خاص و چت‌بات‌ها به طور کلی است. (واشنگتن پست با OpenAI همکاری محتوایی دارد که بر اساس یک خبرنامه، به این معنی است که «ChatGPT در پاسخ به سؤالات مرتبط، خلاصه‌ها، نقل‌قول‌ها و پیوندهایی به گزارش‌های اصلی واشنگتن پست را نمایش خواهد داد.»)

در مورد پرسش‌های فردی، مورد علاقه ما آن‌هایی بودند که از ربات خواستند در ژانرهای ادبی خاصی بنویسد و به ما امکان دادند یک رتبه‌بندی تقریبی از محبوبیت ایجاد کنیم. داستان عاشقانه در رتبه اول قرار دارد، سپس فانتزی جادویی یا ماوراء طبیعی، علمی تخیلی، و طنز یا هجو.

در مورد سؤالات مرتبط با سلامت چه؟ هامیش فریزر (Hamish Fraser)، در حال نوشتن از دانشگاه براون (Brown University)، کنجکاو بود که آیا مردم اغلب در مورد شرایط تهدیدکننده زندگی مانند حمله قلبی یا سپتیسمی می‌پرسند. دوستان درخشان ما جرمی بی. مریل (Jeremy B. Merrill) و ریچل لرمن (Rachel Lerman) سال گذشته یک تجزیه و تحلیل عالی از یک مجموعه داده پرسش باز ارائه کردند که جزئیات بیشتری را ارائه می‌دهد. اما شایع‌ترین مسائل پزشکی که مردم با کلود مطرح می‌کنند، به نظر ما تهدیدکننده زندگی نیستند.

اغلب، ما از ربات‌ها در مورد «درد، آسیب‌ها، و توانبخشی فیزیکی مرتبط با عضلات و اسکلت» می‌پرسیم. ما همچنین بسیار کنجکاو در مورد «خواص داروها و مباحث دارویی»، و همچنین «درمان‌های گیاهی و طب سنتی» هستیم.

مردم همچنین با مشکلات دندانپزشکی و مسائل بینایی مانند «پرش پلک، حساسیت به نور، و تاری دید» به چت‌بات مراجعه کردند. در خلوت آن اپلیکیشن یا پنجره مرورگر کوچک، ما همچنین در مورد اعتیاد، خواب، رویاها، رابطه جنسی و «مایعات بدنی و عملکردهای اندام‌ها» پرسیدیم.

اگر سؤالات مربوط به غذا و تناسب اندام را شامل شویم، می‌بینیم که آمریکایی‌ها از چت‌بات‌ها برای دستور پخت، برنامه‌ریزی وعده‌های غذایی و مشاوره تناسب اندام (به ویژه برای بدن‌های پیرتر) استفاده می‌کنند.

چه کسانی با ربات‌ها کار می‌کنند؟

یک خواننده اهل پنسیلوانیا می‌پرسد: «چه کسی بیشترین توجه را به هوش مصنوعی دارد؟» او کارگران خط مونتاژ، کتابداران – و «سیاستمدارانی که با سیستم بازی می‌کنند» را پیشنهاد می‌دهد.

سؤال عالی، پنسلوانایی ناشناس! از آنجا که ما قبلاً عمیقاً در مشاغلی که وظایف آنها به احتمال زیاد توسط هوش مصنوعی انجام می‌شود، کندوکاو کرده‌ایم، می‌توانیم با اطمینان پاسخ دهیم که برنامه‌نویسان و توسعه‌دهندگان پاسخ واضح و صحیح به سؤال شما هستند. اما یک نظرسنجی جدید یوگوو (YouGov) نشان می‌دهد که در حالی که حداقل ۶۳ درصد آمریکایی‌ها گهگاه از هوش مصنوعی استفاده می‌کنند، تنها حدود ۱ نفر از هر ۱۰ نفر ما از آن برای کدنویسی استفاده می‌کنیم. به عبارت دیگر، برنامه‌نویسان سهم بزرگی در استفاده از هوش مصنوعی دارند، اما سهم بزرگی در کاربران هوش مصنوعی ندارند.

برای گسترش دامنه، محبوب‌ترین انواع پرسش‌های هوش مصنوعی مرتبط با کار را بررسی کردیم. پس از بررسی کل لیست، نمی‌توانیم این حس را از خود دور کنیم که هیچ محل کاری از زیر نگاه هوش مصنوعی دور نمانده است.

ما «کمک به پیشرفت شغلم در حوزه سلامت»؛ «توضیح یا تحلیل تعرفه‌ها و سیاست‌های تجاری بین‌المللی»؛ و «ایجاد محتوای بازاریابی گردشگری و مواد استراتژی کسب و کار» را پیدا کردیم. و بله، حتی «ارائه راهنمایی در مورد فناوری‌ها و فرایندهای تولید صنعتی»، از جمله پرسش‌هایی که می‌توانیم فقط تصور کنیم توسط کارگران کارخانه ارسال شده‌اند.

مردم در مورد پیش‌نویس ایمیل‌ها و ویرایش ارتباطات تجاری سؤال می‌پرسند و برخی از درخواست‌های واضح مرتبط با کسب و کار مانند «توضیح اصول حسابداری و حل مسائل دفترداری»؛ «تحلیل معیارهای مالی»؛ یا توسعه طرح‌های استارتاپی را مطرح می‌کنند.

اما در میان تمام آن فناوری و کسب و کار، آموزش برجسته است. یکی از محبوب‌ترین دسته‌های پرسش، شامل ایجاد مواد آموزشی است، در حالی که دیگری شامل نوشتن یا پاسخ دادن به سؤالات چند گزینه‌ای است.

ممکن است آنتروپیک با این موضوع مخالفت کند، اما پرسش‌ها تصویری گیج‌کننده از جهانی ترسیم می‌کنند که در آن معلمان برای تولید مواد آموزشی به چت‌بات‌ها روی می‌آورند، دانش‌آموزان همان ربات‌ها را برای پاسخ دادن به همان مواد آموزشی به کار می‌گیرند، و سپس معلمان دوباره به چت‌بات‌ها برمی‌گردند تا سیستم‌ها و روبریک‌های نمره‌دهی آکادمیک ایجاد کنند و «نوشتار آکادمیک را ارزیابی و نمره‌دهی کنند.»

گزارش جداگانه‌ای از آنتروپیک که مکالمات مرتبط با دانشگاه را از حساب‌هایی با آدرس ایمیل دانشگاهی تجزیه و تحلیل کرد، نشان داد که ۳۹ درصد از چنین تعاملاتی شامل درخواست از چت‌بات‌ها برای ایجاد یا ویرایش مقالات یا مواد درسی بوده است، در حالی که یک سوم آنها شامل درخواست از ربات برای توضیح یا حل مسائل بوده است. بقیه زمان، دانشجویان یا اساتید بر تجزیه و تحلیل داده‌ها، نمودارها، دیاگرام‌ها، طرح‌های تحقیقاتی و ترجمه تمرکز کرده‌اند.

در همین حال – و این مشاوره حقوقی نیست – ما مطمئن نیستیم که بسیاری از مردم باید برای پیش‌نویس، تحلیل یا ویرایش اسناد حقوقی به چت‌بات‌ها مراجعه کنند. یا برای راهنمایی حقوقی در مورد ازدواج و طلاق.

شرایط خدمات آنتروپیک نیز موافق است.

درود. دپارتمان داده به جستجوی خود برای پرسش‌ها ادامه می‌دهد! چه چیزی کنجکاوی شما را برمی‌انگیزد؟ چه چیزی به احتمال زیاد ما را به گریه می‌اندازد؟ کدام رسم‌الخط‌های غیررومی در ایالات متحده رایج‌تر هستند؟ چرا نرخ خودکشی در آمریکا سریع‌تر از سایر کشورها در حال افزایش است؟ فقط بپرسید!

اگر سؤال شما در یک ستون ظاهر شود، یک نشان و کارت شناسایی رسمی دپارتمان داده برای شما ارسال خواهیم کرد. این هفته، آنها را برای هامیش فریزر و پل تیبتس (Paul Tibbits) در بثسدا، مریلند، پست خواهیم کرد.