الکس رتنر، مدیرعامل اسنورکل هوش مصنوعی، گفت شرکتش تمرکز بیشتری بر کمک به متخصصان حوزه برای ساخت مجموعه داده‌ها و مدل‌ها برای ارزیابی سیستم‌های هوش مصنوعی دارد.
الکس رتنر، مدیرعامل اسنورکل هوش مصنوعی، گفت شرکتش تمرکز بیشتری بر کمک به متخصصان حوزه برای ساخت مجموعه داده‌ها و مدل‌ها برای ارزیابی سیستم‌های هوش مصنوعی دارد.

اسنورکل هوش مصنوعی ۱۰۰ میلیون دلار برای ساخت ارزیابی‌کننده‌های بهتر مدل‌های هوش مصنوعی جذب سرمایه کرد

در رقابت با بازیگران بزرگ‌تر، این استارتاپ برچسب‌گذاری داده، بر استفاده از متخصصان انسانی برای قضاوت در مورد دقت سیستم‌های هوش مصنوعی تأکید می‌کند.

الکس رتنر، مدیرعامل اسنورکل هوش مصنوعی، زمانی را به یاد می‌آورد که برچسب‌گذاری داده – کار طاقت‌فرسای افزودن زمینه به انبوهی از داده‌های خام و ارزیابی پاسخ مدل هوش مصنوعی – در میان محققان هوش مصنوعی کاری "پیش‌پاافتاده" محسوب می‌شد. اما این وضعیت به سرعت تغییر کرد، زمانی که ChatGPT در سال ۲۰۲۲ جهان را متحیر کرد و جانی تازه (و میلیاردها دلار) به مجموعه‌ای از استارتاپ‌ها بخشید که برای تأمین داده‌های برچسب‌گذاری شده انسانی برای شرکت‌هایی مانند OpenAI و Anthropic جهت آموزش مدل‌های توانمند، شتاب گرفته بودند.

اکنون، حوزه پر رقابت برچسب‌گذاری داده به نظر می‌رسد در حال تغییر دیگری است. شرکت‌های کمتری در حال آموزش مدل‌های زبان بزرگ (LLM) از ابتدا هستند و این کار را به غول‌های فناوری واگذار می‌کنند. در عوض، آن‌ها مدل‌ها را بهینه می‌کنند و برنامه‌های کاربردی در زمینه‌هایی مانند توسعه نرم‌افزار، مراقبت‌های بهداشتی و مالی می‌سازند که تقاضا برای داده‌های تخصصی را ایجاد می‌کند. ربات‌های گفت‌وگوی هوش مصنوعی دیگر فقط مقاله و شعر نمی‌نویسند؛ به آن‌ها کارهای پرخطر مانند کمک به پزشکان در تشخیص بیماری یا بررسی درخواست‌های وام محول شده است و آن‌ها اشتباهات بیشتری مرتکب می‌شوند. رتنر می‌گوید: ارزیابی عملکرد یک مدل برای کسب‌وکارها جهت اعتماد و در نهایت پذیرش هوش مصنوعی حیاتی شده است. او به فوربس گفت: "ارزیابی به نقطه ورود جدید تبدیل شده است."

این فوریت برای سنجش توانایی‌های هوش مصنوعی در موارد استفاده بسیار خاص، جهت جدیدی را برای اسنورکل هوش مصنوعی ایجاد کرده است، که در حال تغییر مسیر است تا به شرکت‌ها کمک کند سیستم‌های ارزیابی و مجموعه داده‌ها را برای آزمایش مدل‌های هوش مصنوعی خود و تنظیم آن‌ها بر اساس نتایج ایجاد کنند. دانشمندان داده و متخصصان حوزه در یک شرکت از نرم‌افزار اسنورکل برای انتخاب و تولید هزاران جفت پرسش و پاسخ به عنوان نمونه‌هایی از یک پاسخ صحیح به یک پرسش استفاده می‌کنند. مدل هوش مصنوعی سپس بر اساس آن مجموعه داده ارزیابی می‌شود و برای بهبود کیفیت کلی بر روی آن آموزش می‌بیند.

این شرکت اکنون ۱۰۰ میلیون دلار در دور سرمایه‌گذاری سری D به رهبری شرکت سرمایه‌گذاری خطرپذیر Addition مستقر در نیویورک، با ارزش‌گذاری ۱.۳ میلیارد دلار جذب کرده است – این رقم ۳۰ درصد افزایش نسبت به ارزش‌گذاری ۱ میلیارد دلاری آن در سال ۲۰۲۱ نشان می‌دهد. تغییر نسبتاً اندک در ارزش‌گذاری می‌تواند نشانه‌ای باشد که شرکت آنطور که سرمایه‌گذاران انتظار داشتند رشد نکرده است، اما رتنر گفت این نتیجه یک "اصلاح سالم در بازار گسترده‌تر" است. اسنورکل هوش مصنوعی از افشای درآمد خود خودداری کرد.

رتنر به فوربس گفت: کارشناسان پشتیبانی مشتری در یک شرکت مخابراتی بزرگ از اسنورکل هوش مصنوعی برای ارزیابی و بهینه‌سازی ربات گفت‌وگوی خود برای پاسخ به سوالات مربوط به صورتحساب و برنامه‌ریزی قرار ملاقات‌ها استفاده کرده‌اند. افسران وام در یکی از سه بانک برتر ایالات متحده از اسنورکل برای آموزش یک سیستم هوش مصنوعی استفاده کرده‌اند که پایگاه‌های داده را برای پاسخ به سوالات مربوط به مشتریان سازمانی بزرگ کاوش می‌کند و دقت آن را از ۲۵% به ۹۳% بهبود بخشیده است. سریرام سریدهاران، هم‌بنیان‌گذار Rox، به فوربس گفت: برای استارتاپ نوپای هوش مصنوعی Rox که نیروی انسانی یا زمان کافی برای ارزیابی سیستم هوش مصنوعی خود برای متخصصان فروش را نداشت، اسنورکل به بهبود دقت بین ۱۰% تا ۱۲% کمک کرد.

این یک تمرکز جدید برای شرکتی است که زمانی بسیار مورد توجه بود، و در سال ۲۰۱۹ از آزمایشگاه هوش مصنوعی دانشگاه استنفورد با محصولی که به متخصصان کمک می‌کرد هزاران تصویر و متن را طبقه‌بندی کنند، خارج شد. اما از زمان راه‌اندازی ChatGPT در سال ۲۰۲۲، این استارتاپ تا حد زیادی تحت‌الشعاع رقبای بزرگ‌تر قرار گرفته است، زیرا شرکت‌های بیشتری به فضای برچسب‌گذاری داده هجوم آوردند. Scale AI، که خدمات برچسب‌گذاری و ارزیابی داده را نیز ارائه می‌دهد، گزارش شده است که در حال مذاکره برای نهایی کردن فروش سهام با ارزش‌گذاری ۲۵ میلیارد دلار است، که نسبت به ارزش‌گذاری ۱۳.۸ میلیارد دلاری آن در سال گذشته افزایش یافته است. دیگر رقبا شامل Turing هستند که ارزش‌گذاری خود را از سال ۲۰۲۱ به ۲.۲ میلیارد دلار دو برابر کرده است، و Invisible Technologies، که در سال ۲۰۲۴ با درآمد ۱۳۴ میلیون دلار، بدون جذب سرمایه زیاد از شرکت‌های سرمایه‌گذاری خطرپذیر، فعالیت کرده است.

اسنورکل نیز با چالش‌های کلان مواجه شده است: با بهتر شدن مدل‌های هوش مصنوعی مانند آنهایی که ChatGPT را قدرت می‌دهند، می‌توانستند داده‌ها را در مقیاس وسیع و رایگان برچسب‌گذاری کنند و اندازه بازار را بیشتر کاهش دهند. رتنر اذعان داشت که اسنورکل بلافاصله پس از راه‌اندازی ChatGPT دوره کوتاهی از رشد کند را تجربه کرد و گفت که شرکت‌ها آزمایش‌های خود را با برخی از فروشندگان متوقف کرده بودند تا استفاده مستقیم از مدل‌های هوش مصنوعی برای برچسب‌گذاری را بررسی کنند. اما او گفت که کسب‌وکار اسنورکل در سال ۲۰۲۳ دوباره رونق گرفت و از آن زمان رشد کرده است.

رتنر گفت که عامل تمایز اسنورکل، تأکید آن بر به کارگیری متخصصان حوزه – چه متخصصان خودش یا متخصصان داخلی یک شرکت – و استفاده از یک روش اختصاصی به نام "برچسب‌گذاری برنامه‌نویسی‌شده" است، که به طور خودکار به انبوهی از داده‌ها از طریق کلمات کلیدی ساده یا قطعات کد برچسب می‌زند، برخلاف انجام آن به صورت دستی. هدف این است که به متخصصان زمان‌بندی فشرده مانند پزشکان و وکلا کمک شود تا داده‌ها را سریع‌تر و مقرون‌به‌صرفه‌تر برچسب‌گذاری کنند.

با تمرکز بر ارزیابی که شامل تولید داده نیز می‌شود، اسنورکل شروع به استخدام ده‌ها هزار پیمانکار ماهر مانند اساتید رشته‌های علوم، فناوری، مهندسی و ریاضی (STEM)، وکلا، حسابداران و نویسندگان داستان کرده است تا مجموعه داده‌های تخصصی برای توسعه‌دهندگان متعدد هوش مصنوعی ایجاد کنند، که سپس از این مجموعه داده‌ها برای ارزیابی مدل‌های خود استفاده می‌کنند (او از گفتن اینکه اسنورکل با کدام آزمایشگاه‌های پیشرو هوش مصنوعی کار می‌کند، خودداری کرد). رتنر گفت: آن‌ها همچنین می‌توانند از این داده‌ها برای افزودن قابلیت‌های جدید به ربات‌های گفت‌وگوی خود استفاده کنند، مانند توانایی تجزیه و "استدلال" در مورد یک پرسش دشوار یا انجام تحقیقات عمیق در مورد یک موضوع.

اما حتی در زمینه ساخت ارزیابی‌های تخصصی، اسنورکل با رقابت شدید – جدید و قدیمی – روبرو است. شرکت‌های برتر هوش مصنوعی تعدادی معیار عمومی و مجموعه داده‌های متن‌باز (Open Source) را برای ارزیابی مدل‌های خود منتشر کرده‌اند. LMArena، یک جدول رده‌بندی محبوب برای ارزیابی عملکرد مدل هوش مصنوعی، اخیراً به عنوان یک شرکت جدید جدا شد و ۱۰۰ میلیون دلار سرمایه اولیه از سرمایه‌گذاران برتر با ارزش‌گذاری ۶۰۰ میلیون دلاری، بر اساس گزارش بلومبرگ، جذب کرد. علاوه بر این، شرکت‌هایی مانند Scale، Turing و Invisible، همگی خدمات ارزیابی ارائه می‌دهند. اما رتنر گفت که برخلاف رقبای خود، اسنورکل از ابتدا بر اساس تخصص انسانی ساخته شده است.

سام موتامدی، شریک Greylock که در این دور مشارکت داشت، گفت که این خدمات جدید مجموعه داده‌های تخصصی بخش رو به رشدی از کسب‌وکار اسنورکل هستند، زیرا صنعت به سمت آنچه "پس از آموزش" (post training) نامیده می‌شود – فرآیند تنظیم عملکرد مدل برای کاربردهای خاص – در حال حرکت است. هوش مصنوعی قبلاً بیشتر داده‌های اینترنتی را جذب کرده است، که مجموعه داده‌های سفارشی ساخته شده توسط کارشناسان حوزه را ارزشمندتر می‌کند. او گفت: "من فکر می‌کنم این باد موافق بازار برای اسنورکل واقعاً خوب بوده است."