الکس رتنر، مدیرعامل اسنورکل هوش مصنوعی، زمانی را به یاد میآورد که برچسبگذاری داده – کار طاقتفرسای افزودن زمینه به انبوهی از دادههای خام و ارزیابی پاسخ مدل هوش مصنوعی – در میان محققان هوش مصنوعی کاری "پیشپاافتاده" محسوب میشد. اما این وضعیت به سرعت تغییر کرد، زمانی که ChatGPT در سال ۲۰۲۲ جهان را متحیر کرد و جانی تازه (و میلیاردها دلار) به مجموعهای از استارتاپها بخشید که برای تأمین دادههای برچسبگذاری شده انسانی برای شرکتهایی مانند OpenAI و Anthropic جهت آموزش مدلهای توانمند، شتاب گرفته بودند.
اکنون، حوزه پر رقابت برچسبگذاری داده به نظر میرسد در حال تغییر دیگری است. شرکتهای کمتری در حال آموزش مدلهای زبان بزرگ (LLM) از ابتدا هستند و این کار را به غولهای فناوری واگذار میکنند. در عوض، آنها مدلها را بهینه میکنند و برنامههای کاربردی در زمینههایی مانند توسعه نرمافزار، مراقبتهای بهداشتی و مالی میسازند که تقاضا برای دادههای تخصصی را ایجاد میکند. رباتهای گفتوگوی هوش مصنوعی دیگر فقط مقاله و شعر نمینویسند؛ به آنها کارهای پرخطر مانند کمک به پزشکان در تشخیص بیماری یا بررسی درخواستهای وام محول شده است و آنها اشتباهات بیشتری مرتکب میشوند. رتنر میگوید: ارزیابی عملکرد یک مدل برای کسبوکارها جهت اعتماد و در نهایت پذیرش هوش مصنوعی حیاتی شده است. او به فوربس گفت: "ارزیابی به نقطه ورود جدید تبدیل شده است."
این فوریت برای سنجش تواناییهای هوش مصنوعی در موارد استفاده بسیار خاص، جهت جدیدی را برای اسنورکل هوش مصنوعی ایجاد کرده است، که در حال تغییر مسیر است تا به شرکتها کمک کند سیستمهای ارزیابی و مجموعه دادهها را برای آزمایش مدلهای هوش مصنوعی خود و تنظیم آنها بر اساس نتایج ایجاد کنند. دانشمندان داده و متخصصان حوزه در یک شرکت از نرمافزار اسنورکل برای انتخاب و تولید هزاران جفت پرسش و پاسخ به عنوان نمونههایی از یک پاسخ صحیح به یک پرسش استفاده میکنند. مدل هوش مصنوعی سپس بر اساس آن مجموعه داده ارزیابی میشود و برای بهبود کیفیت کلی بر روی آن آموزش میبیند.
این شرکت اکنون ۱۰۰ میلیون دلار در دور سرمایهگذاری سری D به رهبری شرکت سرمایهگذاری خطرپذیر Addition مستقر در نیویورک، با ارزشگذاری ۱.۳ میلیارد دلار جذب کرده است – این رقم ۳۰ درصد افزایش نسبت به ارزشگذاری ۱ میلیارد دلاری آن در سال ۲۰۲۱ نشان میدهد. تغییر نسبتاً اندک در ارزشگذاری میتواند نشانهای باشد که شرکت آنطور که سرمایهگذاران انتظار داشتند رشد نکرده است، اما رتنر گفت این نتیجه یک "اصلاح سالم در بازار گستردهتر" است. اسنورکل هوش مصنوعی از افشای درآمد خود خودداری کرد.
رتنر به فوربس گفت: کارشناسان پشتیبانی مشتری در یک شرکت مخابراتی بزرگ از اسنورکل هوش مصنوعی برای ارزیابی و بهینهسازی ربات گفتوگوی خود برای پاسخ به سوالات مربوط به صورتحساب و برنامهریزی قرار ملاقاتها استفاده کردهاند. افسران وام در یکی از سه بانک برتر ایالات متحده از اسنورکل برای آموزش یک سیستم هوش مصنوعی استفاده کردهاند که پایگاههای داده را برای پاسخ به سوالات مربوط به مشتریان سازمانی بزرگ کاوش میکند و دقت آن را از ۲۵% به ۹۳% بهبود بخشیده است. سریرام سریدهاران، همبنیانگذار Rox، به فوربس گفت: برای استارتاپ نوپای هوش مصنوعی Rox که نیروی انسانی یا زمان کافی برای ارزیابی سیستم هوش مصنوعی خود برای متخصصان فروش را نداشت، اسنورکل به بهبود دقت بین ۱۰% تا ۱۲% کمک کرد.
این یک تمرکز جدید برای شرکتی است که زمانی بسیار مورد توجه بود، و در سال ۲۰۱۹ از آزمایشگاه هوش مصنوعی دانشگاه استنفورد با محصولی که به متخصصان کمک میکرد هزاران تصویر و متن را طبقهبندی کنند، خارج شد. اما از زمان راهاندازی ChatGPT در سال ۲۰۲۲، این استارتاپ تا حد زیادی تحتالشعاع رقبای بزرگتر قرار گرفته است، زیرا شرکتهای بیشتری به فضای برچسبگذاری داده هجوم آوردند. Scale AI، که خدمات برچسبگذاری و ارزیابی داده را نیز ارائه میدهد، گزارش شده است که در حال مذاکره برای نهایی کردن فروش سهام با ارزشگذاری ۲۵ میلیارد دلار است، که نسبت به ارزشگذاری ۱۳.۸ میلیارد دلاری آن در سال گذشته افزایش یافته است. دیگر رقبا شامل Turing هستند که ارزشگذاری خود را از سال ۲۰۲۱ به ۲.۲ میلیارد دلار دو برابر کرده است، و Invisible Technologies، که در سال ۲۰۲۴ با درآمد ۱۳۴ میلیون دلار، بدون جذب سرمایه زیاد از شرکتهای سرمایهگذاری خطرپذیر، فعالیت کرده است.
اسنورکل نیز با چالشهای کلان مواجه شده است: با بهتر شدن مدلهای هوش مصنوعی مانند آنهایی که ChatGPT را قدرت میدهند، میتوانستند دادهها را در مقیاس وسیع و رایگان برچسبگذاری کنند و اندازه بازار را بیشتر کاهش دهند. رتنر اذعان داشت که اسنورکل بلافاصله پس از راهاندازی ChatGPT دوره کوتاهی از رشد کند را تجربه کرد و گفت که شرکتها آزمایشهای خود را با برخی از فروشندگان متوقف کرده بودند تا استفاده مستقیم از مدلهای هوش مصنوعی برای برچسبگذاری را بررسی کنند. اما او گفت که کسبوکار اسنورکل در سال ۲۰۲۳ دوباره رونق گرفت و از آن زمان رشد کرده است.
رتنر گفت که عامل تمایز اسنورکل، تأکید آن بر به کارگیری متخصصان حوزه – چه متخصصان خودش یا متخصصان داخلی یک شرکت – و استفاده از یک روش اختصاصی به نام "برچسبگذاری برنامهنویسیشده" است، که به طور خودکار به انبوهی از دادهها از طریق کلمات کلیدی ساده یا قطعات کد برچسب میزند، برخلاف انجام آن به صورت دستی. هدف این است که به متخصصان زمانبندی فشرده مانند پزشکان و وکلا کمک شود تا دادهها را سریعتر و مقرونبهصرفهتر برچسبگذاری کنند.
با تمرکز بر ارزیابی که شامل تولید داده نیز میشود، اسنورکل شروع به استخدام دهها هزار پیمانکار ماهر مانند اساتید رشتههای علوم، فناوری، مهندسی و ریاضی (STEM)، وکلا، حسابداران و نویسندگان داستان کرده است تا مجموعه دادههای تخصصی برای توسعهدهندگان متعدد هوش مصنوعی ایجاد کنند، که سپس از این مجموعه دادهها برای ارزیابی مدلهای خود استفاده میکنند (او از گفتن اینکه اسنورکل با کدام آزمایشگاههای پیشرو هوش مصنوعی کار میکند، خودداری کرد). رتنر گفت: آنها همچنین میتوانند از این دادهها برای افزودن قابلیتهای جدید به رباتهای گفتوگوی خود استفاده کنند، مانند توانایی تجزیه و "استدلال" در مورد یک پرسش دشوار یا انجام تحقیقات عمیق در مورد یک موضوع.
اما حتی در زمینه ساخت ارزیابیهای تخصصی، اسنورکل با رقابت شدید – جدید و قدیمی – روبرو است. شرکتهای برتر هوش مصنوعی تعدادی معیار عمومی و مجموعه دادههای متنباز (Open Source) را برای ارزیابی مدلهای خود منتشر کردهاند. LMArena، یک جدول ردهبندی محبوب برای ارزیابی عملکرد مدل هوش مصنوعی، اخیراً به عنوان یک شرکت جدید جدا شد و ۱۰۰ میلیون دلار سرمایه اولیه از سرمایهگذاران برتر با ارزشگذاری ۶۰۰ میلیون دلاری، بر اساس گزارش بلومبرگ، جذب کرد. علاوه بر این، شرکتهایی مانند Scale، Turing و Invisible، همگی خدمات ارزیابی ارائه میدهند. اما رتنر گفت که برخلاف رقبای خود، اسنورکل از ابتدا بر اساس تخصص انسانی ساخته شده است.
سام موتامدی، شریک Greylock که در این دور مشارکت داشت، گفت که این خدمات جدید مجموعه دادههای تخصصی بخش رو به رشدی از کسبوکار اسنورکل هستند، زیرا صنعت به سمت آنچه "پس از آموزش" (post training) نامیده میشود – فرآیند تنظیم عملکرد مدل برای کاربردهای خاص – در حال حرکت است. هوش مصنوعی قبلاً بیشتر دادههای اینترنتی را جذب کرده است، که مجموعه دادههای سفارشی ساخته شده توسط کارشناسان حوزه را ارزشمندتر میکند. او گفت: "من فکر میکنم این باد موافق بازار برای اسنورکل واقعاً خوب بوده است."