هنگامی که شرکتهای فناوری برای اولین بار محصولات هوش مصنوعی مولد را عرضه کردند، برخی از منتقدان بلافاصله از فروپاشی رسانهها ابراز نگرانی کردند. هر تکه نوشته، تصویر و ویدئو مورد تردید قرار گرفت. اما برای ناشران خبری و روزنامهنگاران، مصیبت دیگری در راه بود.
چتباتها ثابت کردهاند که در نگه داشتن کاربران در مکالمات ماهر هستند. آنها این کار را با پاسخ دادن به هر سؤال انجام میدهند، که اغلب از طریق خلاصهسازی مقالات ناشران خبری است. ناگهان، افراد کمتری به خارج از سایتهای هوش مصنوعی مولد مراجعه میکنند – تحولی که تهدیدی وجودی برای رسانه و معیشت روزنامهنگاران در همه جا محسوب میشود.
بر اساس یک مطالعه جامع، "نمایههای کلی هوش مصنوعی" گوگل (AI Overviews) — قابلیتی که صفحات وب را بالاتر از نتایج جستجوی معمول سایت خلاصه میکند — تاکنون ترافیک وبسایتهای خارجی را بیش از ۳۴ درصد کاهش داده است. مدیر عامل DotDash Meredith، که ناشر People، Better Homes & Gardens و Food & Wine است، اخیراً اعلام کرده است که این شرکت برای سناریوی احتمالی "گوگل صفر" آماده میشود. برخی گمانهزنی کردهاند که افت ترافیک ناشی از چتباتها بخشی از دلایل تعدیل نیروهای اخیر در رسانههایی مانند Business Insider و Daily Dot بوده است. یک کارمند سابق اخیراً به الیور دارسی، خبرنگار رسانهای، گفته است: " Business Insider برای اینترنتی ساخته شده بود که دیگر وجود ندارد."
همه ناشران در معرض خطر یکسانی نیستند: آنهایی که عمدتاً به خوانندگان علاقهمند عمومی متکی هستند که از موتورهای جستجو و شبکههای اجتماعی میآیند، ممکن است وضعیت بدتری نسبت به ناشران تخصصی با مشترکان وفادار داشته باشند. با این حال، هیچکس کاملاً در امان نیست. "نمایههای کلی هوش مصنوعی" که در می ۲۰۲۴ منتشر شد، به ChatGPT، Claude، Grok، Perplexity و سایر محصولات مبتنی بر هوش مصنوعی میپیوندد که در مجموع، طبق یک مطالعه، جایگزین جستجو برای بیش از ۲۵ درصد از آمریکاییها شدهاند. شرکتها چتباتها را بر روی حجم عظیمی از کتابها و مقالات سرقت شده آموزش میدهند، همانطور که گزارشهای قبلی من نشان داده است، و مقالات خبری را برای تولید پاسخهای حاوی اطلاعات بهروز اسکرپ میکنند. مدلهای زبان بزرگ همچنین بر روی مقادیر زیادی از مطالب در مالکیت عمومی آموزش میبینند — اما بیشتر آنچه برای این مدلها مفید است، به ویژه زمانی که کاربران به دنبال اطلاعات بیدرنگ از چتباتها هستند، اخبار پشت فایروال است. ناشران در حال ایجاد ارزش هستند، اما شرکتهای هوش مصنوعی مخاطبان، هزینههای اشتراک و درآمد تبلیغاتی آنها را رهگیری میکنند.
بخوانید: مقیاس باورنکردنی مشکل کتابهای دزدی هوش مصنوعی
من در مورد این مشکل از Anthropic، xAI، Perplexity، Google و OpenAI سؤال کردم. Anthropic و xAI پاسخ ندادند. Perplexity مستقیماً در مورد این مسئله اظهار نظر نکرد. گوگل استدلال کرد که ترافیک "با کیفیت بالاتر" را به وبسایتهای ناشران ارسال میکند، به این معنی که کاربران پس از کلیک کردن، وقت بیشتری را در سایتها صرف میکنند، اما از ارائه هرگونه داده در حمایت از این ادعا خودداری کرد. OpenAI مرا به مقالهای ارجاع داد که نشان میدهد ChatGPT در کل ترافیک بیشتری را نسبت به گذشته به وبسایتها میفرستد، اما اعداد خام نسبتاً متوسط هستند. برای مثال، بیبیسی (BBC) طبق گزارشها در ماه آوریل ۱۱۸,۰۰۰ بازدید از ChatGPT دریافت کرده است، اما این تقریباً هیچ است در مقایسه با صدها میلیون بازدیدکنندهای که ماهانه دریافت میکند. این مقاله همچنین نشان میدهد که ترافیک از ChatGPT برای برخی ناشران در واقع کاهش یافته است.
در چند ماه گذشته، من با چندین ناشر خبری صحبت کردهام که همگی هوش مصنوعی را تهدیدی وجودی و قریبالوقوع برای کسب و کار خود میدانند. ریچ کاکاپولو (Rich Caccappolo)، نایب رئیس رسانهای در شرکتی که Daily Mail — بزرگترین روزنامه بریتانیا از نظر تیراژ — را منتشر میکند، به من گفت که همه ناشران "میتوانند ببینند که AI Overviews ترافیکی را که از جستجو دریافت میکنند، از بین خواهد رفت و یکی از ارکان اصلی مدل درآمد دیجیتال را تضعیف خواهد کرد." شرکتهای هوش مصنوعی ادعا کردهاند که چتباتها همچنان خوانندگان را به ناشران خبری ارسال خواهند کرد، اما شواهدی برای اثبات این ادعا ارائه ندادهاند. من از کاکاپولو پرسیدم که آیا فکر میکند پاسخهای تولید شده توسط هوش مصنوعی میتواند شرکت او را ورشکست کند. او به من گفت: "این قطعاً همان ترسی است که وجود دارد. و نگرانی من این است که این اتفاق در سه یا پنج سال رخ نخواهد داد — شوخی میکنم که سه شنبه آینده اتفاق میافتد."
ناشران کتاب، به ویژه کتابهای غیرداستانی و درسی، نیز به من گفتند که انتظار کاهش چشمگیر فروش را دارند، زیرا چتباتها میتوانند هم کتابهای آنها را خلاصه کنند و هم توضیحات مفصلی از محتوای آنها ارائه دهند. ناشران تلاش کردهاند مقابله کنند، اما گفتگوهای من نشان داد که چقدر وضعیت به ضرر آنهاست. جهان به سرعت در حال تغییر است، شاید به طور غیرقابل بازگشت. نهادهایی که مطبوعات آزاد کشور ما را تشکیل میدهند، برای بقای خود میجنگند.
ناشران به دو صورت واکنش نشان دادهاند. اول: اقدام قانونی. حداقل ۱۲ دعوی قضایی شامل بیش از ۲۰ ناشر علیه شرکتهای هوش مصنوعی تشکیل شده است. نتایج آنها بسیار نامشخص است، و ممکن است پروندهها تنها پس از وارد شدن آسیبهای جبرانناپذیر، رأی داده شوند.
پاسخ دوم، انعقاد قرارداد با شرکتهای هوش مصنوعی است که به محصولات آنها اجازه میدهد مقالات را خلاصه کنند یا بر محتوای تحریریه آموزش ببینند. برخی ناشران، مانند The Atlantic، هر دو استراتژی را دنبال میکنند (این شرکت با OpenAI همکاری شرکتی دارد و از Cohere شکایت کرده است). حداقل ۷۲ قرارداد مجوز بین ناشران و شرکتهای هوش مصنوعی در دو سال گذشته منعقد شده است. اما چگونگی رویکرد به این قراردادها کار آسانی نیست. کاکاپولو به من گفت که "احساس عدم توازن فوقالعادهای در میز مذاکره" داشته است — حسی که دیگران که با آنها صحبت کردم نیز مشترک بودند. یکی از مشکلات این است که هیچ قیمت استانداردی برای آموزش یک مدل زبان بزرگ (LLM) بر روی یک کتاب یا مقاله وجود ندارد. شرکتهای هوش مصنوعی میدانند چه نوع محتوایی را میخواهند، و با توجه به اینکه قبلاً توانایی و تمایل خود را برای برداشتن آن بدون پرداخت نشان دادهاند، اهرم فشار فوقالعادهای در مذاکرات دارند. من متوجه شدهام که گاهی اوقات کتابها تنها با چند صد دلار مجوز داده شدهاند، و اینکه ناشری که بیش از حد مطالبه کند ممکن است رد شود، و در نهایت شرکتهای فناوری مواد آنها را به هر حال بردارند.
بخوانید: ChatGPT به یک ماشین استودیو گیبلی تبدیل شد. این چگونه قانونی است؟
مسئله دیگر این است که به نظر میرسد محتوای مختلف، ارزشهای متفاوتی برای مدلهای زبان بزرگ (LLM) مختلف دارد. شرکت رسانههای دیجیتال Ziff Davis مجموعه دادههای آموزشی هوش مصنوعی مبتنی بر وب را مطالعه کرده و مشاهده کرده است که محتوای منابع "اقتدار بالا" مانند روزنامهها و مجلات اصلی، برای شرکتهای هوش مصنوعی مطلوبتر از پستهای وبلاگ و رسانههای اجتماعی به نظر میرسد. (Ziff Davis به دلیل آموزش بر روی مقالاتش بدون پرداخت هزینه مجوز از OpenAI شکایت کرده است). محققان مایکروسافت نیز علناً در مورد "اهمیت دادههای با کیفیت بالا" نوشتهاند و پیشنهاد کردهاند که محتوای سبک کتاب درسی ممکن است به ویژه مطلوب باشد.
اما فراتر از چند مطالعه خاص مانند اینها، بینش کمی در مورد اینکه چه نوع محتوایی بیشترین بهبود را در یک مدل زبان بزرگ ایجاد میکند وجود دارد، که سوالات بیپاسخ زیادی را باقی میگذارد. آیا زندگینامهها مهمتر یا کماهمیتتر از تاریخها هستند؟ آیا داستانهای با کیفیت بالا اهمیت دارند؟ آیا کتابهای قدیمی ارزشی دارند؟ امی برند (Amy Brand)، مدیر و ناشر MIT Press، به من گفت که "راه حلی که قول دهد ارزش منصفانه محتوای خاص نوشته شده توسط انسان را در بازار فعال دادههای آموزشی LLM تعیین کند، بسیار مفید خواهد بود."
قدرت مذاکره یک ناشر نیز به حدی محدود است که میتواند شرکت هوش مصنوعی را از استفاده از کارش بدون رضایت منع کند. هیچ راه مطمئنی برای جلوگیری از اسکرپ کردن وبسایتهای خبری توسط شرکتهای هوش مصنوعی وجود ندارد؛ حتی پروتکل حذف رباتها (Robots Exclusion Protocol)، روش استاندارد انصراف موجود برای ناشران خبری، به راحتی قابل دور زدن است. از آنجا که شرکتهای هوش مصنوعی عموماً دادههای آموزشی خود را مخفی نگه میدارند، و از آنجا که راه آسانی برای ناشران برای بررسی اینکه کدام چتباتها مقالات آنها را خلاصه میکنند وجود ندارد، ناشران در یافتن اینکه از کدام شرکتهای هوش مصنوعی شکایت کنند یا با آنها قرارداد ببندند، دشواری دارند. برخی کارشناسان، مانند تیم اورایلی (Tim O’Reilly)، پیشنهاد کردهاند که قوانین باید افشای دادههای آموزشی دارای حق چاپ را الزامی کنند، اما هیچ قانون موجودی شرکتها را ملزم به افشای نویسندگان یا ناشران خاصی که برای مواد آموزشی هوش مصنوعی استفاده شدهاند نمیکند.
البته، همه اینها یک سوال را مطرح میکند. به نظر میرسد شرکتهای هوش مصنوعی قبلاً محتوای ناشران را برداشتهاند. چرا باید اکنون برای آن هزینه بپردازند، به خصوص که برخی از این شرکتها در دادگاه استدلال کردهاند که آموزش مدلهای زبان بزرگ (LLM) بر روی کتابها و مقالات دارای حق چاپ، استفاده منصفانه است؟
شاید این قراردادها صرفاً سپری در برابر یک حکم نامطلوب دادگاه باشند. اگر شرکتهای هوش مصنوعی از آموزش بر روی آثار دارای حق چاپ به صورت رایگان منع شوند، سازمانهایی که قراردادهای موجود با ناشران دارند، ممکن است از رقبای خود جلوتر باشند. قراردادهای ناشران نیز وسیلهای برای حل و فصل بدون دعوی قضایی هستند — که ممکن است مسیری مطلوبتر برای ناشرانی باشد که ریسکگریز هستند یا به هر نحو دیگری نامطمئن هستند. اما جیمز گریملمن (James Grimmelmann)، حقوقدان، به من گفت که شرکتهای هوش مصنوعی میتوانند به شکایاتی مانند شکایت Ziff Davis با این استدلال پاسخ دهند که این قراردادها شامل بیش از صرفاً آموزش بر روی محتوای یک ناشر هستند: آنها همچنین ممکن است شامل دسترسی به نسخههای تمیزتر مقالات، دسترسی مداوم به یک فید روزانه یا بیدرنگ، یا معافیت از مسئولیت برای سرقت ادبی چتباتهایشان باشند. شرکتهای فناوری میتوانند استدلال کنند که پول مبادله شده در این قراردادها منحصراً برای عناصر غیرمجوز است، بنابراین آنها برای مواد آموزشی هزینه پرداخت نمیکنند. لازم به ذکر است که شرکتهای فناوری تقریباً همیشه به این قراردادها به عنوان همکاری، نه قراردادهای مجوز، اشاره میکنند، احتمالاً به همین دلیل.
با این حال، درآمد ناچیز حاصل از این توافقات قرار نیست ناشران را نجات دهد: حتی یک قرارداد خوب، به گفته یک ناشر، به هیچ وجه جبران درآمد از دست رفته ناشی از کاهش خوانندگان را نخواهد کرد. ناشرانی که میتوانند راهی برای بقا در برابر حمله هوش مصنوعی مولد پیدا کنند، ممکن است نیاز به ابداع مدلهای تجاری متفاوت و یافتن جریانهای درآمد جدید داشته باشند. استراتژیهای قابل دوامی ممکن است وجود داشته باشند، اما هیچ یک از ناشرانی که من با آنها صحبت کردم، ایده روشنی از آنها ندارند.
ناشران طی دو دهه گذشته به تهدیدات تکنولوژیک عادت کردهاند، شاید برجستهترین آنها از دست دادن درآمد تبلیغاتی به فیسبوک و گوگل باشد، شرکتی که اخیراً دارای انحصار غیرقانونی در تبلیغات آنلاین شناخته شد (اگرچه شرکت اعلام کرده است که به این حکم اعتراض خواهد کرد). اما ظهور هوش مصنوعی مولد ممکن است به معنای نابودی برای "قوه چهارم" (مطبوعات) باشد: با هوش مصنوعی، صنعت فناوری حتی ناشران را از داشتن مخاطب محروم میکند.
در صورت انقراض گسترده ناشران، برخی روزنامهنگاران قادر به بقا خواهند بود. به اصطلاح "اقتصاد خالق" (creator economy) نشان میدهد که ارائه اخبار و اطلاعات با کیفیت بالا از طریق ساباستک (Substack)، یوتیوب و حتی تیکتاک امکانپذیر است. اما همه خبرنگاران نمیتوانند به سادگی به این پلتفرمها منتقل شوند. روزنامهنگاری تحقیقی که فساد و سوء رفتار افراد و شرکتهای قدرتمند را افشا میکند، با خطر جدی عواقب قانونی همراه است و نیازمند منابعی — مانند زمان و پول — است که معمولاً برای فریلنسرها کمیاب است.
اگر ناشران خبری شروع به ورشکستگی کنند، آیا شرکتهای هوش مصنوعی نیز آسیب نخواهند دید؟ چتباتهای آنها برای پاسخ به سؤالات درباره جهان نیاز به دسترسی به روزنامهنگاری دارند. آیا صنعت فناوری به بقای روزنامهها و مجلات علاقه ندارد؟
در واقع، نشانههایی وجود دارد که شرکتهای هوش مصنوعی معتقدند دیگر نیازی به ناشران نیست. در ماه دسامبر، در اجلاس DealBook نیویورک تایمز، از سم آلتمن (Sam Altman)، مدیر عامل OpenAI، پرسیده شد که نویسندگان چه احساسی باید درباره استفاده از کارشان برای آموزش هوش مصنوعی داشته باشند. او گفت: "فکر میکنم ما واقعاً به یک قرارداد، استاندارد، پروتکل جدید، یا هرچه میخواهید بنامید، برای نحوه پاداش گرفتن خالقان نیاز داریم." او یک سیستم "انتخابی" را توصیف کرد که در آن یک نویسنده میتواند "پرداختهای خرد" (micropayments) دریافت کند، زمانی که نام، شباهت و سبک او استفاده میشود. اما این نمیتواند از رویه فعلی OpenAI دورتر باشد، که در آن محصولات از قبل برای تقلید از سبکهای هنرمندان و نویسندگان، بدون غرامت یا حتی یک گزینه مؤثر برای انصراف، استفاده میشوند.
از سوندار پیچای (Sundar Pichai)، مدیر عامل گوگل، نیز در اجلاس DealBook در مورد غرامت نویسندگان سؤال شد. او پیشنهاد کرد که یک راهحل بازار ظاهر خواهد شد، که احتمالاً در بلندمدت ناشران را شامل نخواهد شد. این معمول است. همانند سایر صنایعی که "اخلال" ایجاد کردهاند، به نظر میرسد غولهای سیلیکون ولی نهادهای قدیمی و تثبیت شده را واسطههایی میدانند که باید برای کارایی بیشتر حذف شوند. اوبر رانندگان را جذب کرد تا برایش کار کنند، صنعت تاکسی سنتی را درهم شکست، و اکنون حقوق، مزایا و حجم کاری را به صورت الگوریتمی کنترل میکند. این به معنای راحتی بیشتر برای مصرفکنندگان بوده است، همانطور که هوش مصنوعی نیز بحثاً چنین میکند — اما همچنین مخرب برای بسیاری از افرادی بوده است که زمانی میتوانستند از رانندگی حرفهای دستمزد معیشتی کسب کنند. پیچای آیندهای را پیشبینی کرد که ممکن است پیامد مشابهی برای روزنامهنگاران داشته باشد. او گفت: "فکر میکنم در آینده یک بازار وجود خواهد داشت — خالقانی خواهند بود که برای هوش مصنوعی خلق خواهند کرد. مردم راهش را پیدا خواهند کرد."