مارک برگن، خبرنگار بلومبرگ نیوز، سفر پر فراز و نشیب یوتیوب برای تبدیل شدن به غول خفته رسانههای مدرن را در کتاب خود با عنوان «لایک، کامنت، سابسکرایب» (وایکینگ، ۲۰۲۲) به تصویر کشیده است. از آن زمان، رونق هوش مصنوعی یکی از بزرگترین چالشها و فرصتها را در طول ۲۰ سال فعالیت این غول ویدیویی ایجاد کرده است. در این فصل بعدی، برگن به بررسی آینده یوتیوب در عصر هوش مصنوعی میپردازد.
امجد حنیف، معاون رئیس یوتیوب، اخیراً با فرح مدحت، اینفلوئنسر مصری که دنبالکنندگان زیادی در خارج از کشور دارد، دیدار کرد. دومین مخاطب بزرگ مدحت در یوتیوب در کره جنوبی است، جایی که طرفداران ویدیوهای عربی او را با زیرنویس تماشا میکنند. حنیف معتقد است که هوش مصنوعی شرکتش به زودی مدحت را به یک سخنران روان کرهای در صفحه نمایش تبدیل میکند و به او این امکان را میدهد تا مخاطبان بیشتری را جذب کند.
او انتظار دارد که در پنج سال آینده، هر ویدیویی که در یوتیوب بارگذاری میشود، به طور خودکار به هر زبان گفتاری دوبله شود. هر کلمه مانند صدای واقعی شخص صحبت کننده به نظر میرسد و لبهای آنها دوباره متحرک میشوند تا مانند یک سخنران بومی حرکت کنند. این یکی از مجموعهای از قابلیتهایی است که یوتیوب قصد دارد به سازندگان خود ارائه دهد تا، به گفته این شرکت، مخاطبان خود را گسترش دهند. حنیف، که محصولات سازنده را مدیریت میکند، میگوید امیدوار است که هر بارگذار از ابزارهای هوش مصنوعی متعلق به مالک یوتیوب، گوگلِ آلفابت، برای تولید ایدهها، ایجاد فیلم، ویرایش، بازاریابی ویدیوها و - شاید مهمتر از همه - ارائه دادههای دقیق در مورد عملکرد ویدیو استفاده کند، که آنها را تشویق میکند تا بیشتر پست بگذارند.
بیست سال پیش، اولین ویدیوی یوتیوب منتشر شد - یک پست ۱۹ ثانیهای احمقانه از جاوید کریم، یکی از بنیانگذاران. وبسایت اشتراکگذاری ویدیو از آن زمان از یک عملیات بیهدف و غیر سودآور، در جنگ با هالیوود و تلویزیون پخش، به یک غول جهانی پیروزمند تبدیل شده است. در این راه، پیوندهای عمیقی با میلیونها سازنده محتوا ایجاد کرد، که بسیاری از آنها متخصصانی هستند که از این پلتفرم امرار معاش میکنند یا تلاش میکنند این کار را انجام دهند.
این یک رابطه ناآرام است: یوتیوب از نظر تاریخی سیاستها، قوانین حق نشر و استراتژیهای تجاری را با حداقل ورودی از سوی حتی بزرگترین ستارههای خود تعیین کرده است. با این حال، یوتیوب اکنون میگوید که هوش مصنوعی به دریای سازندگان خود اجازه میدهد تا حتی بیشتر از دنیای رسانه را در دست بگیرند. این فقط منصفانه است، زیرا گوگل مدل هوش مصنوعی خود، جمنای، را بر اساس ساعتهای بیشماری از محتوای یوتیوب ساخته است، بدون اینکه بسیاری از سازندگان از آن اطلاع داشته باشند. (سخنگوی یوتیوب گفت که این شرکت از محتوای ویدیویی «برای بهبود تجربه محصول برای سازندگان و بینندگان در سراسر یوتیوب و گوگل، از جمله از طریق یادگیری ماشین و برنامههای هوش مصنوعی» استفاده میکند و این کار را «مطابق با شرایطی که سازندگان با آن موافقت میکنند» انجام میدهد.)
داستان موفقیت
یوتیوب بزرگتر از همیشه است. این شرکت با رقابت فزایندهای از سوی اسپاتیفای، تیکتاک و پخشکنندههای تلویزیونی مواجه است، اما سال گذشته ۳۶.۱ میلیارد دلار از فروش تبلیغات به دست آورد. بر اساس تخمینهای شرکت تحقیقاتی موفت ناتانسون، ۱۸ میلیارد دلار دیگر از اشتراکها و منابع دیگر به دست آورده است، که پیشبینی کرد که سال آینده یوتیوب از والت دیزنی به عنوان بزرگترین تجارت سرگرمی ایالات متحده از نظر درآمد پیشی خواهد گرفت. مارک رید، مدیر اجرایی آژانس تبلیغاتی WPP Plc، میگوید: «این یک داستان موفقیت شگفتانگیز بوده است.»
تغییر و تحولات مدیریتی سرعت این پلتفرم را کاهش نداده است. نیل موهان پس از استعفای سوزان وویچیتسکی در اوایل سال ۲۰۲۳ به عنوان مدیرعامل یوتیوب منصوب شد. (وویچیتسکی سال بعد در اثر سرطان ریه درگذشت.) موهان، که از سال ۲۰۱۵ به یوتیوب پیوست، از جانبازان تجارت تبلیغات گوگل است، بر تأکید عمومی وویچیتسکی بر سازندگان بومی تأکید کرده و در عین حال یوتیوب را عمیقتر به کانالهای اصلی رسانهای سوق داده است. او تلاش زیادی برای پادکستینگ انجام داده است و گروه رنگارنگ وبلاگ نویسان راستگرای یوتیوب را در آغوش گرفته است. موهان در نامه مدیرعامل خود در ماه فوریه، مصاحبه جو روگان با دونالد ترامپ در مسیر مبارزات انتخاباتی را تبلیغ کرد. در اوایل سال جاری، یوتیوب اعلام کرد که ماهانه یک میلیارد نفر پادکستها را در پلتفرم خود تماشا میکنند و رهبری خود را بر اسپاتیفای در این دسته تثبیت میکند.
موهان گسترش بینندگان در صفحه نمایش تلویزیون را به یکی دیگر از اولویتهای اصلی تبدیل کرده است و از معامله اخیر با NFL و حتی جلب خدمات پخش رقیب به برنامه یوتیوب استفاده میکند. او همچنین از کمپینهای امی مگا-یوتیوبرها، مانند رت و لینک، حمایت کرده است. برایان فلاناگان، رئیس استودیوی Mythical Entertainment رت و لینک، میگوید یوتیوب در «اشتیاق ما برای در نظر گرفته شدن به عنوان تلویزیون از هر نظر - رتبهبندی، کسب درآمد، جوایز، برجستگی فرهنگی» سهیم است.
عصر هوش مصنوعی
در سپتامبر ۲۰۲۲، من کتاب خود را با عنوان «لایک، کامنت، سابسکرایب» منتشر کردم. دو ماه بعد، ChatGPT از راه رسید و رونق هوش مصنوعی مولد را آغاز کرد که میتواند دنیای رسانه را مانند هیچ چیز دیگری از زمان ظهور خود یوتیوب زیر و رو کند. ابزارهای جدید هوش مصنوعی در حال حاضر به مردم این امکان را میدهند که محتوا را سریعتر و ارزانتر از همیشه تولید کنند و اینترنت را با تقلیدهای قانعکننده، دیپفیکها و کلاهبرداریهای آشکار پر میکنند. هالیوود با اشتیاق هوش مصنوعی مولد را در آغوش نگرفته است. نمونههای اولیه از قدرتهای وهمآور آن، مانند یک آهنگ جعلی دریک و ویکند جعلی که به صورت ویروسی منتشر شد، به عنوان نویدبخش دزدی دریایی افسارگسیخته تلقی میشد.
گوگل همچنین خود را دوباره مهندسی کرده است و به معتبرترین چالش برای موتور جستجوی خود پاسخ میدهد. اما این شرکت به خوبی مجهز است تا از عهده عصر محتوای هوش مصنوعی در ویدیو برآید. گوگل هوش مصنوعی ویدیویی خود را با نام Veo منتشر کرد، که با تایپ کردن ساده دستورات در یک چتبات، فیلم تولید میکند. این کار به دنبال پیشنهادات مشابه از OpenAI و دیگران است - اما شبکه توزیع گسترده یوتیوب به این معنی است که حتی اگر سازندگان از محصولات هوش مصنوعی رقیب استفاده کنند، گوگل برنده میشود. هر کسی که میخواهد ویدیوی او دیده شود، همچنان آن را در یوتیوب قرار میدهد.

یوتیوب با این هجوم جدید محتوای تولید شده توسط هوش مصنوعی، مانند سایر پلتفرمهای وب، تلاش میکند تا جریان را حفظ کند و در عین حال مسائل مربوط به حق نشر را مدیریت کند. در اینجا، یوتیوب یک مزیت دارد: تقریباً برای دو دهه، Content ID را اجرا کرده است، یک سیستم نرمافزاری گسترده که مواد دارای حق نشر را در ویدیوها تشخیص میدهد و تا حد زیادی هالیوود و صنعت موسیقی را راضی کرده است. پس از شروع به کار هوش مصنوعی مولد، یوتیوب برای اطمینان دادن به شرکا اقدام کرد و توافقنامههایی را با یونیورسال میوزیک گروپ NV و Creative Artists Agency LLC امضا کرد تا پلتفرم را برای آواتارهای هوش مصنوعی غیرمجاز از نوازندگان، ورزشکاران و بازیگران نظارت کند. یوتیوب به تازگی برخی از ستارههای برتر یوتیوب را نیز به تلاش برای حفاظت از دیپفیک اضافه کرده است. الکساندرا شنون، رئیس توسعه استراتژیک CAA، میگوید پلتفرمهای فناوری در رسیدگی به تداوم این دیپفیکها متفاوت بودهاند. او میافزاید: «یوتیوب پیشرو است. من این را میگویم.»
اما یوتیوب به همان اندازه با اطمینان در مورد رسیدگی به شکایت کلیدی دیگر در مورد هوش مصنوعی مولد اقدام نکرد: اینکه این بخش با جارو کردن بخشهای عظیمی از اینترنت بدون درخواست رشد کرد. چتباتهای امروزی تنها در صورتی میتوانند ایمیلها و اشعار شایسته بنویسند که آموزش ببینند - معمولاً از طریق برنامههای نرمافزاری که مقادیر زیادی از متن آنلاین را برای تغذیه به مدلهای زبانی جمعآوری میکنند. گوگل، تجارتی که با خزیدن در وب برای جستجو متولد شده است، این عمل را به خوبی میداند.
مدتی پس از انتشار ChatGPT، مجموعهای از شرکتها برای ساخت هوش مصنوعی برای تولید تصاویر، صداها و ویدیوها به رقابت پرداختند. یوتیوب یک معدن طلای آموزشی بود. از سال ۲۰۱۷ حداقل ۴۰۰ ساعت فیلم در هر دقیقه بارگذاری شده است که یک بایگانی بینظیر ایجاد کرده است. Wired و Proof News گزارش دادند که چندین غول سیلیکون ولی از یک پایگاه داده آموزشی با مواد از هزاران کانال یوتیوب ناآگاه استفاده کردهاند. (سخنگوی Salesforce Inc.، یکی از شرکتهایی که در این گزارش نام برده شده است، گفت که پایگاه داده «به طور عمومی در دسترس است و تحت یک مجوز مجاز منتشر شده است.») حق نشر در این بخش یک منطقه خاکستری باقی مانده است و به نظر میرسد که بسیاری از یوتیوبرها تصمیم گرفتهاند با یوتیوب مانند یک وبسایت رایگان و باز رفتار کنند.
این ابهام سال گذشته زمانی به دید عموم رسید که OpenAI از Sora، مدل خود برای ویدیوی تولید شده توسط هوش مصنوعی، رونمایی کرد. از میرا موراتی، مدیر ارشد فناوری OpenAI، در مصاحبهای با وال استریت ژورنال در ماه مارس پرسیده شد که آیا شرکت او یوتیوب را برای Sora خراشیده است یا خیر. او اخم کرد. او پاسخ داد: «من در واقع در این مورد مطمئن نیستم.»
یک ماه بعد، موهان برای مصاحبه با امیلی چانگ از بلومبرگ نشست. او از شیوههای OpenAI اظهار بیاطلاعی کرد، اما استدلال کرد که یوتیوب به شرکتها اجازه نمیدهد بدون رضایت ویدیوها را بدزدند. او گفت: «اینها قوانین جاده هستند.» هنگامی که چانگ پرسید آیا گوگل با مدل هوش مصنوعی خود، جمنای، از این قوانین پیروی میکند، موهان طفره رفت. او گفت که شرکتش از مطالب یوتیوب «مطابق با» شرایط خدمات این پلتفرم استفاده میکند.
این یک پاسخ لغزنده بود. نیویورک تایمز سال گذشته گزارش داد که OpenAI عمداً روی دادههای یوتیوب آموزش دیده است و برخی از کارمندان گوگل از آن اطلاع داشتند، اما از صحبت کردن در این مورد تردید داشتند زیرا گوگل هم همین کار را انجام داده بود. (سخنگوی یوتیوب به اظهارات قبلی موهان در مورد خراشیدن غیرمجاز اشاره کرد. OpenAI به نیویورک تایمز گفت که به «منابع متعددی» از دادهها متکی است؛ سخنگوی این استارتآپ از اظهار نظر بیشتر خودداری کرد.)
حتی یوتیوبرهای برتر و شرکای تجاری نیز برای به دست آوردن اطلاعات واضح در مورد اینکه چه کسی چه چیزی را خراشیده است و یوتیوب چه میدانسته، تلاش کردهاند. ازرا کوپرشتاین، مدیر باسابقه استعدادهای یوتیوب و رئیس آژانس استعدادیابی Night، میگوید: «این به نفع آنهاست که آن را زیر فرش پنهان کنند. ما به این موضوع به عنوان استثمار تمام این محتوا نگاه خواهیم کرد.»
در ماه اوت سال گذشته، هنک گرین، یک یوتیوبر باسابقه - و مورد علاقه شرکت - یک ویدیوی طولانی در مورد پاسخ موهان به چانگ منتشر کرد. طبق شرایط خدمات یوتیوب، بارگذاری یک ویدیو به شرکت مجوز استفاده از آن مواد را برای «بهرهبرداری، ترویج و بهبود» پلتفرم میدهد، بندهایی که گرین نتیجه گرفت اکنون شامل آموزش مدلهای هوش مصنوعی گوگل میشود. زمانی که او برای اولین بار شروع به ارسال در یوتیوب کرد و برای بیشتر از دو دهه پس از آن، مدلهای زبانی بزرگ وجود نداشتند. گرین در این ویدیو با عصبانیت گفت: «من نمیدانستم که با آن موافقت میکنم.»
برای سالهای متمادی، یوتیوب با یک سیستم دو سطحی عمل کرده است. این شرکت پرداختها و قراردادها را به یک روش برای کانالهای اداره شده توسط شرکتهای ضبط و رسانههای سنتی - مانند سلبریتیهایی مانند تیلور سویفت و جیمی فالون - و روشی دیگر برای سازندگان «مستقل»، مانند گرین، که بخش عمدهای از پلتفرم را تشکیل میدهند، مدیریت میکند. هنگامی که گوگل شروع به کار بر روی مدلهای هوش مصنوعی مولد کرد، تصمیم گرفت روی محتوای شرکای رسانهای یوتیوب آموزش ندهد، اما از مطالب سازندگان استفاده کرد و به مجوز شرایط خدمات متکی بود.
اما این شرکت هرگز این موضوع را روشن نکرد. همچنین میزان خراشیدن توسط OpenAI یا دیگران را به اشتراک نگذاشت. گرین در ویدیوی خود گفت: «از جایی که من نشستهام، مطمئناً دارم کلاهبرداری میشوم.»
یوتیوب از در دسترس قرار دادن موهان برای مصاحبه خودداری کرد. برخی از کارمندان یوتیوب به طور خصوصی استدلال میکنند که گوگل مسئولانهتر از OpenAI و دیگران عمل کرده است زیرا از تمام یوتیوب برداشت نکرده است. در ماه دسامبر، یوتیوب ویژگیای را معرفی کرد که به سازندگان اجازه میدهد به اشخاص ثالث اطلاع دهند که برای خراشیدن دادهها باز هستند. (این شرکت برنامههای خود را برای این جمعآوری دادهها به اشتراک نگذاشته است، اما یک نماینده گفت که این ویژگی شرایط خدمات آن را تغییر نمیدهد.)
یک مجموعه جدید از کسبوکارها در تلاش هستند تا از این معاملات داده بهره ببرند و بازارهایی را در خارج از گوگل تشکیل دهند که در آن سازندگان میتوانند فیلمهای قدیمی یا استفاده نشده را به توسعهدهندگان هوش مصنوعی بفروشند. کاتلین گریس، کارمند سابق یوتیوب و اکنون مدیر ارشد استراتژی Vermillio Inc.، یکی از این دلالان داده، میگوید این مدلی است که برای سوق دادن تعادل به سمت تولیدکنندگان محتوا طراحی شده است و به آنها یک جریان درآمد فراتر از یوتیوب میدهد. او این رویکرد را با سیستم حق نشر طولانی مدت یوتیوب مقایسه میکند. گریس میپرسد: «آیا برای همه عالی بود؟ چه کسی این سقف بازار تریلیون دلاری را به دست آورد؟ گوگل این کار را کرد.»
حنیف، مدیر اجرایی یوتیوب، تأیید کرد که ویژگی اختیاری یوتیوب برای دادههای آموزشی برای مدلهای خود گوگل اعمال نمیشود. او به سازندگان میگوید که معامله شرایط خدمات - پذیرش اینکه محتوایی که در یوتیوب ارسال میکنند ممکن است برای آموزش جمنای استفاده شود - به معنای دسترسی به آخرین ویژگیهای هوش مصنوعی این شرکت، مانند ترجمههای خودکار ویدیو، پاسخهای پیشنهادی به نظرات و تجزیه و تحلیل هوش مصنوعی از دادههای مخاطبان است. حنیف میگوید: «روشی که من آن را توضیح دادهام این است که بسیاری از چیزهایی که آنها در مورد آن هیجانزده هستند، به جمنای متکی هستند.»
دموکراتیزه کردن خلاقیت
یوتیوب در حال حاضر در حال آزمایش برنامهای با چند صد هزار سازنده برای فناوری دوبله هوش مصنوعی است که فوراً ویدیوهای انگلیسی را به هشت زبان دیگر تبدیل میکند یا بالعکس. به گفته این شرکت، بیش از ۴۰ درصد از زمان تماشای این ویدیوها از سوی افرادی است که به زبانهای دوبله شده تماشا میکنند. کریستین اوستلین، معاون رئیس که بر این ویژگی نظارت دارد، میگوید یوتیوب «اهداف بسیار بلندپروازانهای» برای گسترش این تلاش در سال ۲۰۲۵ دارد. این شرکت یک برنامه آزمایشی کوچکتر را با تمرکز بر شبیهسازی صداها برای دوبله اجرا میکند و در حال آزمایش تکنیکهای انیمیشن مجدد لبها است. به زودی، یوتیوب ممکن است این فناوری را برای ویدیوهای آرشیوی یا حتی کلیپهایی از افراد مشهور درگذشته به کار گیرد. اوستلین میگوید: «اینها همه احتمالات هستند.»
برخی از مگاستارهای یوتیوب، مانند MrBeast، قبلاً در فناوری دوبله خارجی سرمایهگذاری کردهاند یا از بازیگران صدا به زبانهای دیگر استفاده کردهاند. یوتیوب قصد دارد این توانایی برج بابل را به صورت رایگان ارائه دهد. کریس ژاک وب، مدیر اجرایی MrBeast، گفت: «این یک مانع بسیار بزرگ برای ورود برای هر کسی است که به دنبال جهانی شدن است.». او میگوید: «اگر من یک فرد [یوتیوبر] بودم، قطعاً میخواهم این را به جای استخدام صداپیشه به زبان دیگر امتحان کنم.»
آدام نوین، مدیر اجرایی استارتآپ هوش مصنوعی Invisible Narratives، استدلال میکند که این امر به یوتیوبر ها قدرت بیشتری میدهد و توازن را به سمت استعداد فردی تغییر میدهد. او میگوید: «مردم بیشتر با شخصیتها ارتباط برقرار میکنند، نه با هالیوود.» او در مورد ابزارهای هوش مصنوعی میگوید: «آیا مردم میخواهند فیلمهای شبیهسازی شده ایجاد کنند؟ به احتمال زیاد خیر. اما یک سد وحشتناک جلوی خلاقیت وجود دارد.»
مسئله استثمار دادهها هم وجود دارد. با این حال، در حال حاضر، بیشتر یوتیوبرها برای استدلال در برابر سیستم از نظر تئوری به نفع خود خیلی جوان هستند. با در نظر گرفتن اینکه گوگل تا این حد به منابع آنها وابسته است، تعداد بسیار کمی از سازندگان از این هدیه اسب تروا شکایت میکنند - به طور کلی، دموکراتیزه کردن خلاقیت. و چه کسی این فرصت را برای صحبت به هر زبانی رد میکند؟