تصویرسازی: آدام فریس برای بلومبرگ
تصویرسازی: آدام فریس برای بلومبرگ

یوتیوب به دنبال سازندگان (و داده‌هایشان) برای پیروزی در عصر هوش مصنوعی

این غول ویدیویی، در آستانه ۲۰ سالگی، تلاش می‌کند تا جریان محتوا را حفظ کند و در عین حال، ارتش پخش‌کنندگان و دارندگان حق نشر خود را راضی نگه دارد.

مارک برگن، خبرنگار بلومبرگ نیوز، سفر پر فراز و نشیب یوتیوب برای تبدیل شدن به غول خفته رسانه‌های مدرن را در کتاب خود با عنوان «لایک، کامنت، سابسکرایب» (وایکینگ، ۲۰۲۲) به تصویر کشیده است. از آن زمان، رونق هوش مصنوعی یکی از بزرگترین چالش‌ها و فرصت‌ها را در طول ۲۰ سال فعالیت این غول ویدیویی ایجاد کرده است. در این فصل بعدی، برگن به بررسی آینده یوتیوب در عصر هوش مصنوعی می‌پردازد.

امجد حنیف، معاون رئیس یوتیوب، اخیراً با فرح مدحت، اینفلوئنسر مصری که دنبال‌کنندگان زیادی در خارج از کشور دارد، دیدار کرد. دومین مخاطب بزرگ مدحت در یوتیوب در کره جنوبی است، جایی که طرفداران ویدیوهای عربی او را با زیرنویس تماشا می‌کنند. حنیف معتقد است که هوش مصنوعی شرکتش به زودی مدحت را به یک سخنران روان کره‌ای در صفحه نمایش تبدیل می‌کند و به او این امکان را می‌دهد تا مخاطبان بیشتری را جذب کند.

او انتظار دارد که در پنج سال آینده، هر ویدیویی که در یوتیوب بارگذاری می‌شود، به طور خودکار به هر زبان گفتاری دوبله شود. هر کلمه مانند صدای واقعی شخص صحبت کننده به نظر می‌رسد و لب‌های آن‌ها دوباره متحرک می‌شوند تا مانند یک سخنران بومی حرکت کنند. این یکی از مجموعه‌ای از قابلیت‌هایی است که یوتیوب قصد دارد به سازندگان خود ارائه دهد تا، به گفته این شرکت، مخاطبان خود را گسترش دهند. حنیف، که محصولات سازنده را مدیریت می‌کند، می‌گوید امیدوار است که هر بارگذار از ابزارهای هوش مصنوعی متعلق به مالک یوتیوب، گوگلِ آلفابت، برای تولید ایده‌ها، ایجاد فیلم، ویرایش، بازاریابی ویدیوها و - شاید مهمتر از همه - ارائه داده‌های دقیق در مورد عملکرد ویدیو استفاده کند، که آن‌ها را تشویق می‌کند تا بیشتر پست بگذارند.

بیست سال پیش، اولین ویدیوی یوتیوب منتشر شد - یک پست ۱۹ ثانیه‌ای احمقانه از جاوید کریم، یکی از بنیانگذاران. وب‌سایت اشتراک‌گذاری ویدیو از آن زمان از یک عملیات بی‌هدف و غیر سودآور، در جنگ با هالیوود و تلویزیون پخش، به یک غول جهانی پیروزمند تبدیل شده است. در این راه، پیوندهای عمیقی با میلیون‌ها سازنده محتوا ایجاد کرد، که بسیاری از آن‌ها متخصصانی هستند که از این پلتفرم امرار معاش می‌کنند یا تلاش می‌کنند این کار را انجام دهند.

این یک رابطه ناآرام است: یوتیوب از نظر تاریخی سیاست‌ها، قوانین حق نشر و استراتژی‌های تجاری را با حداقل ورودی از سوی حتی بزرگترین ستاره‌های خود تعیین کرده است. با این حال، یوتیوب اکنون می‌گوید که هوش مصنوعی به دریای سازندگان خود اجازه می‌دهد تا حتی بیشتر از دنیای رسانه را در دست بگیرند. این فقط منصفانه است، زیرا گوگل مدل هوش مصنوعی خود، جمنای، را بر اساس ساعت‌های بی‌شماری از محتوای یوتیوب ساخته است، بدون اینکه بسیاری از سازندگان از آن اطلاع داشته باشند. (سخنگوی یوتیوب گفت که این شرکت از محتوای ویدیویی «برای بهبود تجربه محصول برای سازندگان و بینندگان در سراسر یوتیوب و گوگل، از جمله از طریق یادگیری ماشین و برنامه‌های هوش مصنوعی» استفاده می‌کند و این کار را «مطابق با شرایطی که سازندگان با آن موافقت می‌کنند» انجام می‌دهد.)

داستان موفقیت

یوتیوب بزرگتر از همیشه است. این شرکت با رقابت فزاینده‌ای از سوی اسپاتیفای، تیک‌تاک و پخش‌کننده‌های تلویزیونی مواجه است، اما سال گذشته ۳۶.۱ میلیارد دلار از فروش تبلیغات به دست آورد. بر اساس تخمین‌های شرکت تحقیقاتی موفت ناتانسون، ۱۸ میلیارد دلار دیگر از اشتراک‌ها و منابع دیگر به دست آورده است، که پیش‌بینی کرد که سال آینده یوتیوب از والت دیزنی به عنوان بزرگترین تجارت سرگرمی ایالات متحده از نظر درآمد پیشی خواهد گرفت. مارک رید، مدیر اجرایی آژانس تبلیغاتی WPP Plc، می‌گوید: «این یک داستان موفقیت شگفت‌انگیز بوده است.»

تغییر و تحولات مدیریتی سرعت این پلتفرم را کاهش نداده است. نیل موهان پس از استعفای سوزان وویچیتسکی در اوایل سال ۲۰۲۳ به عنوان مدیرعامل یوتیوب منصوب شد. (وویچیتسکی سال بعد در اثر سرطان ریه درگذشت.) موهان، که از سال ۲۰۱۵ به یوتیوب پیوست، از جانبازان تجارت تبلیغات گوگل است، بر تأکید عمومی وویچیتسکی بر سازندگان بومی تأکید کرده و در عین حال یوتیوب را عمیق‌تر به کانال‌های اصلی رسانه‌ای سوق داده است. او تلاش زیادی برای پادکستینگ انجام داده است و گروه رنگارنگ وبلاگ نویسان راست‌گرای یوتیوب را در آغوش گرفته است. موهان در نامه مدیرعامل خود در ماه فوریه، مصاحبه جو روگان با دونالد ترامپ در مسیر مبارزات انتخاباتی را تبلیغ کرد. در اوایل سال جاری، یوتیوب اعلام کرد که ماهانه یک میلیارد نفر پادکست‌ها را در پلتفرم خود تماشا می‌کنند و رهبری خود را بر اسپاتیفای در این دسته تثبیت می‌کند.

موهان گسترش بینندگان در صفحه نمایش تلویزیون را به یکی دیگر از اولویت‌های اصلی تبدیل کرده است و از معامله اخیر با NFL و حتی جلب خدمات پخش رقیب به برنامه یوتیوب استفاده می‌کند. او همچنین از کمپین‌های امی مگا-یوتیوبرها، مانند رت و لینک، حمایت کرده است. برایان فلاناگان، رئیس استودیوی Mythical Entertainment رت و لینک، می‌گوید یوتیوب در «اشتیاق ما برای در نظر گرفته شدن به عنوان تلویزیون از هر نظر - رتبه‌بندی، کسب درآمد، جوایز، برجستگی فرهنگی» سهیم است.

عصر هوش مصنوعی

در سپتامبر ۲۰۲۲، من کتاب خود را با عنوان «لایک، کامنت، سابسکرایب» منتشر کردم. دو ماه بعد، ChatGPT از راه رسید و رونق هوش مصنوعی مولد را آغاز کرد که می‌تواند دنیای رسانه را مانند هیچ چیز دیگری از زمان ظهور خود یوتیوب زیر و رو کند. ابزارهای جدید هوش مصنوعی در حال حاضر به مردم این امکان را می‌دهند که محتوا را سریع‌تر و ارزان‌تر از همیشه تولید کنند و اینترنت را با تقلیدهای قانع‌کننده، دیپ‌فیک‌ها و کلاهبرداری‌های آشکار پر می‌کنند. هالیوود با اشتیاق هوش مصنوعی مولد را در آغوش نگرفته است. نمونه‌های اولیه از قدرت‌های وهم‌آور آن، مانند یک آهنگ جعلی دریک و ویکند جعلی که به صورت ویروسی منتشر شد، به عنوان نویدبخش دزدی دریایی افسارگسیخته تلقی می‌شد.

گوگل همچنین خود را دوباره مهندسی کرده است و به معتبرترین چالش برای موتور جستجوی خود پاسخ می‌دهد. اما این شرکت به خوبی مجهز است تا از عهده عصر محتوای هوش مصنوعی در ویدیو برآید. گوگل هوش مصنوعی ویدیویی خود را با نام Veo منتشر کرد، که با تایپ کردن ساده دستورات در یک چت‌بات، فیلم تولید می‌کند. این کار به دنبال پیشنهادات مشابه از OpenAI و دیگران است - اما شبکه توزیع گسترده یوتیوب به این معنی است که حتی اگر سازندگان از محصولات هوش مصنوعی رقیب استفاده کنند، گوگل برنده می‌شود. هر کسی که می‌خواهد ویدیوی او دیده شود، همچنان آن را در یوتیوب قرار می‌دهد.

جلد کتاب «لایک، کامنت، سابسکرایب» اثر مارک برگن

یوتیوب با این هجوم جدید محتوای تولید شده توسط هوش مصنوعی، مانند سایر پلتفرم‌های وب، تلاش می‌کند تا جریان را حفظ کند و در عین حال مسائل مربوط به حق نشر را مدیریت کند. در اینجا، یوتیوب یک مزیت دارد: تقریباً برای دو دهه، Content ID را اجرا کرده است، یک سیستم نرم‌افزاری گسترده که مواد دارای حق نشر را در ویدیوها تشخیص می‌دهد و تا حد زیادی هالیوود و صنعت موسیقی را راضی کرده است. پس از شروع به کار هوش مصنوعی مولد، یوتیوب برای اطمینان دادن به شرکا اقدام کرد و توافق‌نامه‌هایی را با یونیورسال میوزیک گروپ NV و Creative Artists Agency LLC امضا کرد تا پلتفرم را برای آواتارهای هوش مصنوعی غیرمجاز از نوازندگان، ورزشکاران و بازیگران نظارت کند. یوتیوب به تازگی برخی از ستاره‌های برتر یوتیوب را نیز به تلاش برای حفاظت از دیپ‌فیک اضافه کرده است. الکساندرا شنون، رئیس توسعه استراتژیک CAA، می‌گوید پلتفرم‌های فناوری در رسیدگی به تداوم این دیپ‌فیک‌ها متفاوت بوده‌اند. او می‌افزاید: «یوتیوب پیشرو است. من این را می‌گویم.»

اما یوتیوب به همان اندازه با اطمینان در مورد رسیدگی به شکایت کلیدی دیگر در مورد هوش مصنوعی مولد اقدام نکرد: اینکه این بخش با جارو کردن بخش‌های عظیمی از اینترنت بدون درخواست رشد کرد. چت‌بات‌های امروزی تنها در صورتی می‌توانند ایمیل‌ها و اشعار شایسته بنویسند که آموزش ببینند - معمولاً از طریق برنامه‌های نرم‌افزاری که مقادیر زیادی از متن آنلاین را برای تغذیه به مدل‌های زبانی جمع‌آوری می‌کنند. گوگل، تجارتی که با خزیدن در وب برای جستجو متولد شده است، این عمل را به خوبی می‌داند.

مدتی پس از انتشار ChatGPT، مجموعه‌ای از شرکت‌ها برای ساخت هوش مصنوعی برای تولید تصاویر، صداها و ویدیوها به رقابت پرداختند. یوتیوب یک معدن طلای آموزشی بود. از سال ۲۰۱۷ حداقل ۴۰۰ ساعت فیلم در هر دقیقه بارگذاری شده است که یک بایگانی بی‌نظیر ایجاد کرده است. Wired و Proof News گزارش دادند که چندین غول سیلیکون ولی از یک پایگاه داده آموزشی با مواد از هزاران کانال یوتیوب ناآگاه استفاده کرده‌اند. (سخنگوی Salesforce Inc.، یکی از شرکت‌هایی که در این گزارش نام برده شده است، گفت که پایگاه داده «به طور عمومی در دسترس است و تحت یک مجوز مجاز منتشر شده است.») حق نشر در این بخش یک منطقه خاکستری باقی مانده است و به نظر می‌رسد که بسیاری از یوتیوبرها تصمیم گرفته‌اند با یوتیوب مانند یک وب‌سایت رایگان و باز رفتار کنند.

این ابهام سال گذشته زمانی به دید عموم رسید که OpenAI از Sora، مدل خود برای ویدیوی تولید شده توسط هوش مصنوعی، رونمایی کرد. از میرا موراتی، مدیر ارشد فناوری OpenAI، در مصاحبه‌ای با وال استریت ژورنال در ماه مارس پرسیده شد که آیا شرکت او یوتیوب را برای Sora خراشیده است یا خیر. او اخم کرد. او پاسخ داد: «من در واقع در این مورد مطمئن نیستم.»

یک ماه بعد، موهان برای مصاحبه با امیلی چانگ از بلومبرگ نشست. او از شیوه‌های OpenAI اظهار بی‌اطلاعی کرد، اما استدلال کرد که یوتیوب به شرکت‌ها اجازه نمی‌دهد بدون رضایت ویدیوها را بدزدند. او گفت: «اینها قوانین جاده هستند.» هنگامی که چانگ پرسید آیا گوگل با مدل هوش مصنوعی خود، جمنای، از این قوانین پیروی می‌کند، موهان طفره رفت. او گفت که شرکتش از مطالب یوتیوب «مطابق با» شرایط خدمات این پلتفرم استفاده می‌کند.

این یک پاسخ لغزنده بود. نیویورک تایمز سال گذشته گزارش داد که OpenAI عمداً روی داده‌های یوتیوب آموزش دیده است و برخی از کارمندان گوگل از آن اطلاع داشتند، اما از صحبت کردن در این مورد تردید داشتند زیرا گوگل هم همین کار را انجام داده بود. (سخنگوی یوتیوب به اظهارات قبلی موهان در مورد خراشیدن غیرمجاز اشاره کرد. OpenAI به نیویورک تایمز گفت که به «منابع متعددی» از داده‌ها متکی است؛ سخنگوی این استارت‌آپ از اظهار نظر بیشتر خودداری کرد.)

حتی یوتیوبرهای برتر و شرکای تجاری نیز برای به دست آوردن اطلاعات واضح در مورد اینکه چه کسی چه چیزی را خراشیده است و یوتیوب چه می‌دانسته، تلاش کرده‌اند. ازرا کوپرشتاین، مدیر باسابقه استعدادهای یوتیوب و رئیس آژانس استعدادیابی Night، می‌گوید: «این به نفع آنهاست که آن را زیر فرش پنهان کنند. ما به این موضوع به عنوان استثمار تمام این محتوا نگاه خواهیم کرد.»

در ماه اوت سال گذشته، هنک گرین، یک یوتیوبر باسابقه - و مورد علاقه شرکت - یک ویدیوی طولانی در مورد پاسخ موهان به چانگ منتشر کرد. طبق شرایط خدمات یوتیوب، بارگذاری یک ویدیو به شرکت مجوز استفاده از آن مواد را برای «بهره‌برداری، ترویج و بهبود» پلتفرم می‌دهد، بندهایی که گرین نتیجه گرفت اکنون شامل آموزش مدل‌های هوش مصنوعی گوگل می‌شود. زمانی که او برای اولین بار شروع به ارسال در یوتیوب کرد و برای بیشتر از دو دهه پس از آن، مدل‌های زبانی بزرگ وجود نداشتند. گرین در این ویدیو با عصبانیت گفت: «من نمی‌دانستم که با آن موافقت می‌کنم.»

برای سال‌های متمادی، یوتیوب با یک سیستم دو سطحی عمل کرده است. این شرکت پرداخت‌ها و قراردادها را به یک روش برای کانال‌های اداره شده توسط شرکت‌های ضبط و رسانه‌های سنتی - مانند سلبریتی‌هایی مانند تیلور سویفت و جیمی فالون - و روشی دیگر برای سازندگان «مستقل»، مانند گرین، که بخش عمده‌ای از پلتفرم را تشکیل می‌دهند، مدیریت می‌کند. هنگامی که گوگل شروع به کار بر روی مدل‌های هوش مصنوعی مولد کرد، تصمیم گرفت روی محتوای شرکای رسانه‌ای یوتیوب آموزش ندهد، اما از مطالب سازندگان استفاده کرد و به مجوز شرایط خدمات متکی بود.

اما این شرکت هرگز این موضوع را روشن نکرد. همچنین میزان خراشیدن توسط OpenAI یا دیگران را به اشتراک نگذاشت. گرین در ویدیوی خود گفت: «از جایی که من نشسته‌ام، مطمئناً دارم کلاهبرداری می‌شوم.»

یوتیوب از در دسترس قرار دادن موهان برای مصاحبه خودداری کرد. برخی از کارمندان یوتیوب به طور خصوصی استدلال می‌کنند که گوگل مسئولانه‌تر از OpenAI و دیگران عمل کرده است زیرا از تمام یوتیوب برداشت نکرده است. در ماه دسامبر، یوتیوب ویژگی‌ای را معرفی کرد که به سازندگان اجازه می‌دهد به اشخاص ثالث اطلاع دهند که برای خراشیدن داده‌ها باز هستند. (این شرکت برنامه‌های خود را برای این جمع‌آوری داده‌ها به اشتراک نگذاشته است، اما یک نماینده گفت که این ویژگی شرایط خدمات آن را تغییر نمی‌دهد.)

یک مجموعه جدید از کسب‌وکارها در تلاش هستند تا از این معاملات داده بهره ببرند و بازارهایی را در خارج از گوگل تشکیل دهند که در آن سازندگان می‌توانند فیلم‌های قدیمی یا استفاده نشده را به توسعه‌دهندگان هوش مصنوعی بفروشند. کاتلین گریس، کارمند سابق یوتیوب و اکنون مدیر ارشد استراتژی Vermillio Inc.، یکی از این دلالان داده، می‌گوید این مدلی است که برای سوق دادن تعادل به سمت تولیدکنندگان محتوا طراحی شده است و به آنها یک جریان درآمد فراتر از یوتیوب می‌دهد. او این رویکرد را با سیستم حق نشر طولانی مدت یوتیوب مقایسه می‌کند. گریس می‌پرسد: «آیا برای همه عالی بود؟ چه کسی این سقف بازار تریلیون دلاری را به دست آورد؟ گوگل این کار را کرد.»

حنیف، مدیر اجرایی یوتیوب، تأیید کرد که ویژگی اختیاری یوتیوب برای داده‌های آموزشی برای مدل‌های خود گوگل اعمال نمی‌شود. او به سازندگان می‌گوید که معامله شرایط خدمات - پذیرش اینکه محتوایی که در یوتیوب ارسال می‌کنند ممکن است برای آموزش جمنای استفاده شود - به معنای دسترسی به آخرین ویژگی‌های هوش مصنوعی این شرکت، مانند ترجمه‌های خودکار ویدیو، پاسخ‌های پیشنهادی به نظرات و تجزیه و تحلیل هوش مصنوعی از داده‌های مخاطبان است. حنیف می‌گوید: «روشی که من آن را توضیح داده‌ام این است که بسیاری از چیزهایی که آنها در مورد آن هیجان‌زده هستند، به جمنای متکی هستند.»

دموکراتیزه کردن خلاقیت

یوتیوب در حال حاضر در حال آزمایش برنامه‌ای با چند صد هزار سازنده برای فناوری دوبله هوش مصنوعی است که فوراً ویدیوهای انگلیسی را به هشت زبان دیگر تبدیل می‌کند یا بالعکس. به گفته این شرکت، بیش از ۴۰ درصد از زمان تماشای این ویدیوها از سوی افرادی است که به زبان‌های دوبله شده تماشا می‌کنند. کریستین اوستلین، معاون رئیس که بر این ویژگی نظارت دارد، می‌گوید یوتیوب «اهداف بسیار بلندپروازانه‌ای» برای گسترش این تلاش در سال ۲۰۲۵ دارد. این شرکت یک برنامه آزمایشی کوچکتر را با تمرکز بر شبیه‌سازی صداها برای دوبله اجرا می‌کند و در حال آزمایش تکنیک‌های انیمیشن مجدد لب‌ها است. به زودی، یوتیوب ممکن است این فناوری را برای ویدیوهای آرشیوی یا حتی کلیپ‌هایی از افراد مشهور درگذشته به کار گیرد. اوستلین می‌گوید: «اینها همه احتمالات هستند.»

برخی از مگاستارهای یوتیوب، مانند MrBeast، قبلاً در فناوری دوبله خارجی سرمایه‌گذاری کرده‌اند یا از بازیگران صدا به زبان‌های دیگر استفاده کرده‌اند. یوتیوب قصد دارد این توانایی برج بابل را به صورت رایگان ارائه دهد. کریس ژاک وب، مدیر اجرایی MrBeast، گفت: «این یک مانع بسیار بزرگ برای ورود برای هر کسی است که به دنبال جهانی شدن است.». او می‌گوید: «اگر من یک فرد [یوتیوبر] بودم، قطعاً می‌خواهم این را به جای استخدام صداپیشه به زبان دیگر امتحان کنم.»

آدام نوین، مدیر اجرایی استارت‌آپ هوش مصنوعی Invisible Narratives، استدلال می‌کند که این امر به یوتیوبر ها قدرت بیشتری می‌دهد و توازن را به سمت استعداد فردی تغییر می‌دهد. او می‌گوید: «مردم بیشتر با شخصیت‌ها ارتباط برقرار می‌کنند، نه با هالیوود.» او در مورد ابزارهای هوش مصنوعی می‌گوید: «آیا مردم می‌خواهند فیلم‌های شبیه‌سازی شده ایجاد کنند؟ به احتمال زیاد خیر. اما یک سد وحشتناک جلوی خلاقیت وجود دارد.»

مسئله استثمار داده‌ها هم وجود دارد. با این حال، در حال حاضر، بیشتر یوتیوبرها برای استدلال در برابر سیستم از نظر تئوری به نفع خود خیلی جوان هستند. با در نظر گرفتن اینکه گوگل تا این حد به منابع آنها وابسته است، تعداد بسیار کمی از سازندگان از این هدیه اسب تروا شکایت می‌کنند - به طور کلی، دموکراتیزه کردن خلاقیت. و چه کسی این فرصت را برای صحبت به هر زبانی رد می‌کند؟