آیا میدانستید رومانیاییها در مصرف الکل در جهان پیشتاز هستند؟ یا اینکه دوستان ما در سنگاپور و چین شبها هنگام بازگشت به خانه احساس امنیت بیشتری میکنند؟
ما این اطلاعات را به لطف محققان سختکوشی میدانیم که مشغول مطالعه مهم مقایسههای جهانی هستند. اما باید اعتراف کنیم: فعالیتهای کمی به اندازه سر و کله زدن با دادههای خام بینالمللی از حدود ۲۰۰ کشور جهان – بسته به اینکه چه کسی شمارش میکند – هر کدام با زبان، روششناسی و ویژگیهای دادهای خاص خود، برای ما دردسرساز هستند.
برای مقایسه کارآمد و دقیق ملتها، شما به طور ایدهآل به نوعی غول جهانی نیاز دارید که کارشناسانش در محل به جمعآوری دادهها در همه جا از آنگولا تا زامبیا کمک کنند.
به عبارت دیگر، شما به بانک جهانی نیاز دارید.
به لطف مجموعه شاخصهای توسعه جهانی آن که سالهاست محبوبترین صفحه وبسایت آن است، بانک جهانی یکی از بزرگترین عرضهکنندگان دادههای جهانی است. اما سالهاست که بخش زیادی از توان دادهای عمیقتر آن، پنهان و بین یکی از بزرگترین نهادهای بینالمللی زمین تقسیم شده بود.
تاکنون.
ماه گذشته، گروه داده بانک ما را به دفترشان در واشنگتن کشاندند – درود بر نگهبان امنیتی که ما را از وجود یک عنکبوت نگرانکننده در کولهپشتیمان مطلع کرد! – تا نگاهی پنهانی به Data360 بیندازیم، که اوج تلاشی چندین ساله برای جمعآوری، استانداردسازی و بهبود مجموعهدادههای جهانی از بانک و فراتر از آن است.
هایشان فو (Haishan Fu)، که به عنوان آمارشناس ارشد و مسئول داده بانک، تیم پشت Data360 را اداره میکند، گفت: «فناوری تکامل یافته است... برای مهار دادهها به عنوان یک نیروی تحولآفرین، باید ظرفیت خود را تقویت کنیم.»
و خدای من، واقعا تقویت شده است! بانک از حدود ۱,۵۰۰ مجموعه داده در مخزن مرکزی خود به نزدیک ۱۰,۰۰۰ مجموعه داده جهش کرده است، و آنها قصد دارند به افزودن ادامه دهند زیرا مجموعهدادههای اضافی در کشوها و سرورها در پستهای دورتر بانک پیدا میشوند. یا از طریق مشارکتهای بانک با کشورهای عضو، که بر «تقویت تولید داده توسط کشورهای در حال توسعه و حمایت از دفاتر آمار ملی آنها» تمرکز دارد، تازه جمعآوری میشوند، گفت کریگ همر (Craig Hammer)، که به مدیریت دفتر فو و راهاندازی Data360 کمک میکند.
نتایج خیرهکننده است. در طول یک شب هیجانانگیز که در ۶,۴۱۷ مجموعه داده شامل ایالات متحده پیمایش میکردیم، مدام با معیارهایی روبرو میشدیم که هرگز ندیده بودیم.
آیا میدانستید ایالات متحده عربستان سعودی آبهای زیرزمینی تجدیدپذیر است و با ۶۷ درصد بیشتر از چین (که در جایگاه دوم قرار دارد) در جهان پیشتاز است (که تا حدی با نرخ برداشت آب شیرین ما که در جایگاه سوم جهان است، جبران میشود)؟
ما همچنین در زمینه پول ارسال شده توسط مهاجران به خانه در جهان پیشتاز هستیم و سالانه ۲.۲ برابر امارات متحده عربی یا عربستان سعودی، که تقریباً در جایگاه دوم قرار دارند، ارسال میکنیم.
و تنها نروژ در فراوانی چیزی به نام مرجانهای آب سرد از ما عقبتر است، که حتی اگر هنوز اهمیت آن را درک نکنیم، احساس اطمینانبخشی میدهد – کارشناسان، لطفاً بنویسید! ما همچنین در رتبه ششم مرجانهای آب گرم که بیشتر مورد مطالعه قرار گرفتهاند، قرار داریم، حتی قبل از اینکه قلمروهایی مانند پورتوریکو را حساب کنیم.
آمریکا دارای قدرتمندترین سیستمهای حمل و نقل هوایی مسافر و بار هوایی در جهان است و بار بیشتری را از طریق راهآهن نسبت به هر کشوری جز چین و روسیه جابجا میکند. اما وقتی صحبت از حمل و نقل ریلی مسافر میشود، با ایتالیا و اوکراین (قبل از جنگ) برای شانس ورود به ۱۰ رتبه برتر رقابت میکنیم. اگر بانک هنوز دادههایی برای مصر داشت، ممکن بود حتی پایینتر رتبهبندی شویم.
ما در تعداد ورزشگاههای بزرگ، جلوتر از چین، در رتبه اول قرار داریم. اما، در یک ضربه ویرانگر به خودانگاره گوشتخوار ما، تنها در رتبه ششم در تأمین پروتئین حیوانی به ازای هر نفر قرار داریم، پشت سر ایسلند، هنگ کنگ، مغولستان، ایرلند و لیتوانی.
ما در میان کشورهایی هستیم که کمترین آسیبپذیری در برابر ناامنی غذایی را داریم و سیزدهمین نرخ پایین سل را داریم. اما امید به زندگی ما از رتبه ۱۴ در سال ۱۹۷۹ به ۶۲ در سال ۲۰۲۲ کاهش یافته است. در همین حال، نرخ خودکشی ما از سال ۲۰۰۰ تا ۲۰۱۹ به طور چشمگیری افزایش یافته است، از رتبه ۶۶ به ۲۵ در میان مردان و از رتبه ۹۳ به ۲۹ در میان زنان.
فو و تیمش پایگاه داده را با در نظر گرفتن هوش مصنوعی طراحی کردهاند. ما میدانیم که عرضهکنندگان چتبات به هر حال دادههای رایگان و باز را استفاده خواهند کرد، پس چرا احتمال بازتولید ایمن و دقیق آن را افزایش ندهیم؟
نگرش آنها بازتاب دهنده حکمت رایج در مورد تأمین کاندوم برای نوجوانان است – موضوعی که البته بانک دادههایی در مورد آن دارد!
آنچه وقتی کسی نگاه نمیکند به چتباتها میگوییم
در مورد هوش مصنوعی صحبت شد، خوانندگان اغلب از ما میپرسند که مردم واقعاً در مورد چه چیزی با چتباتهای هوش مصنوعی گفتگو میکنند. حالا ما پاسخی داریم.
محققان با شاخص اقتصادی آنتروپیک، یک میلیون پرسش (ناشناس) را که مردم در فوریه و مارس در دستیار هوش مصنوعی معروف به کلود (Claude) تایپ کرده بودند، تجزیه و تحلیل کردند و از یک ابزار هوش مصنوعی داخلی برای گروهبندی آنها در ۶۳۰ دسته استفاده کردند، که از «پیشنویس یک پیام رد مودبانه که روابط حرفهای را حفظ کند» تا «نقشآفرینی به عنوان شخصیتهای داستانی در سناریوهای روایی» را شامل میشود.
دستههای کلی به سمت سؤالات مرتبط با برنامهنویسی متمایل هستند، که یک حوزه تخصصی برای کلود به طور خاص و چتباتها به طور کلی است. (واشنگتن پست با OpenAI همکاری محتوایی دارد که بر اساس یک خبرنامه، به این معنی است که «ChatGPT در پاسخ به سؤالات مرتبط، خلاصهها، نقلقولها و پیوندهایی به گزارشهای اصلی واشنگتن پست را نمایش خواهد داد.»)
در مورد پرسشهای فردی، مورد علاقه ما آنهایی بودند که از ربات خواستند در ژانرهای ادبی خاصی بنویسد و به ما امکان دادند یک رتبهبندی تقریبی از محبوبیت ایجاد کنیم. داستان عاشقانه در رتبه اول قرار دارد، سپس فانتزی جادویی یا ماوراء طبیعی، علمی تخیلی، و طنز یا هجو.
در مورد سؤالات مرتبط با سلامت چه؟ هامیش فریزر (Hamish Fraser)، در حال نوشتن از دانشگاه براون (Brown University)، کنجکاو بود که آیا مردم اغلب در مورد شرایط تهدیدکننده زندگی مانند حمله قلبی یا سپتیسمی میپرسند. دوستان درخشان ما جرمی بی. مریل (Jeremy B. Merrill) و ریچل لرمن (Rachel Lerman) سال گذشته یک تجزیه و تحلیل عالی از یک مجموعه داده پرسش باز ارائه کردند که جزئیات بیشتری را ارائه میدهد. اما شایعترین مسائل پزشکی که مردم با کلود مطرح میکنند، به نظر ما تهدیدکننده زندگی نیستند.
اغلب، ما از رباتها در مورد «درد، آسیبها، و توانبخشی فیزیکی مرتبط با عضلات و اسکلت» میپرسیم. ما همچنین بسیار کنجکاو در مورد «خواص داروها و مباحث دارویی»، و همچنین «درمانهای گیاهی و طب سنتی» هستیم.
مردم همچنین با مشکلات دندانپزشکی و مسائل بینایی مانند «پرش پلک، حساسیت به نور، و تاری دید» به چتبات مراجعه کردند. در خلوت آن اپلیکیشن یا پنجره مرورگر کوچک، ما همچنین در مورد اعتیاد، خواب، رویاها، رابطه جنسی و «مایعات بدنی و عملکردهای اندامها» پرسیدیم.
اگر سؤالات مربوط به غذا و تناسب اندام را شامل شویم، میبینیم که آمریکاییها از چتباتها برای دستور پخت، برنامهریزی وعدههای غذایی و مشاوره تناسب اندام (به ویژه برای بدنهای پیرتر) استفاده میکنند.
چه کسانی با رباتها کار میکنند؟
یک خواننده اهل پنسیلوانیا میپرسد: «چه کسی بیشترین توجه را به هوش مصنوعی دارد؟» او کارگران خط مونتاژ، کتابداران – و «سیاستمدارانی که با سیستم بازی میکنند» را پیشنهاد میدهد.
سؤال عالی، پنسلوانایی ناشناس! از آنجا که ما قبلاً عمیقاً در مشاغلی که وظایف آنها به احتمال زیاد توسط هوش مصنوعی انجام میشود، کندوکاو کردهایم، میتوانیم با اطمینان پاسخ دهیم که برنامهنویسان و توسعهدهندگان پاسخ واضح و صحیح به سؤال شما هستند. اما یک نظرسنجی جدید یوگوو (YouGov) نشان میدهد که در حالی که حداقل ۶۳ درصد آمریکاییها گهگاه از هوش مصنوعی استفاده میکنند، تنها حدود ۱ نفر از هر ۱۰ نفر ما از آن برای کدنویسی استفاده میکنیم. به عبارت دیگر، برنامهنویسان سهم بزرگی در استفاده از هوش مصنوعی دارند، اما سهم بزرگی در کاربران هوش مصنوعی ندارند.
برای گسترش دامنه، محبوبترین انواع پرسشهای هوش مصنوعی مرتبط با کار را بررسی کردیم. پس از بررسی کل لیست، نمیتوانیم این حس را از خود دور کنیم که هیچ محل کاری از زیر نگاه هوش مصنوعی دور نمانده است.
ما «کمک به پیشرفت شغلم در حوزه سلامت»؛ «توضیح یا تحلیل تعرفهها و سیاستهای تجاری بینالمللی»؛ و «ایجاد محتوای بازاریابی گردشگری و مواد استراتژی کسب و کار» را پیدا کردیم. و بله، حتی «ارائه راهنمایی در مورد فناوریها و فرایندهای تولید صنعتی»، از جمله پرسشهایی که میتوانیم فقط تصور کنیم توسط کارگران کارخانه ارسال شدهاند.
مردم در مورد پیشنویس ایمیلها و ویرایش ارتباطات تجاری سؤال میپرسند و برخی از درخواستهای واضح مرتبط با کسب و کار مانند «توضیح اصول حسابداری و حل مسائل دفترداری»؛ «تحلیل معیارهای مالی»؛ یا توسعه طرحهای استارتاپی را مطرح میکنند.
اما در میان تمام آن فناوری و کسب و کار، آموزش برجسته است. یکی از محبوبترین دستههای پرسش، شامل ایجاد مواد آموزشی است، در حالی که دیگری شامل نوشتن یا پاسخ دادن به سؤالات چند گزینهای است.
ممکن است آنتروپیک با این موضوع مخالفت کند، اما پرسشها تصویری گیجکننده از جهانی ترسیم میکنند که در آن معلمان برای تولید مواد آموزشی به چتباتها روی میآورند، دانشآموزان همان رباتها را برای پاسخ دادن به همان مواد آموزشی به کار میگیرند، و سپس معلمان دوباره به چتباتها برمیگردند تا سیستمها و روبریکهای نمرهدهی آکادمیک ایجاد کنند و «نوشتار آکادمیک را ارزیابی و نمرهدهی کنند.»
گزارش جداگانهای از آنتروپیک که مکالمات مرتبط با دانشگاه را از حسابهایی با آدرس ایمیل دانشگاهی تجزیه و تحلیل کرد، نشان داد که ۳۹ درصد از چنین تعاملاتی شامل درخواست از چتباتها برای ایجاد یا ویرایش مقالات یا مواد درسی بوده است، در حالی که یک سوم آنها شامل درخواست از ربات برای توضیح یا حل مسائل بوده است. بقیه زمان، دانشجویان یا اساتید بر تجزیه و تحلیل دادهها، نمودارها، دیاگرامها، طرحهای تحقیقاتی و ترجمه تمرکز کردهاند.
در همین حال – و این مشاوره حقوقی نیست – ما مطمئن نیستیم که بسیاری از مردم باید برای پیشنویس، تحلیل یا ویرایش اسناد حقوقی به چتباتها مراجعه کنند. یا برای راهنمایی حقوقی در مورد ازدواج و طلاق.
شرایط خدمات آنتروپیک نیز موافق است.
درود. دپارتمان داده به جستجوی خود برای پرسشها ادامه میدهد! چه چیزی کنجکاوی شما را برمیانگیزد؟ چه چیزی به احتمال زیاد ما را به گریه میاندازد؟ کدام رسمالخطهای غیررومی در ایالات متحده رایجتر هستند؟ چرا نرخ خودکشی در آمریکا سریعتر از سایر کشورها در حال افزایش است؟ فقط بپرسید!
اگر سؤال شما در یک ستون ظاهر شود، یک نشان و کارت شناسایی رسمی دپارتمان داده برای شما ارسال خواهیم کرد. این هفته، آنها را برای هامیش فریزر و پل تیبتس (Paul Tibbits) در بثسدا، مریلند، پست خواهیم کرد.