
چگونه دو زن چینی تزهای دکترای خود را به یادگیری ماشینی تبدیل کردند که ارتباطاتی بین رویدادهای به ظاهر نامرتبط برقرار میکند تا طرحهای تقلب نوظهور را کشف کند.
در سال 2006، پس از گرفتن مدرک دکترا از دانشگاه کارنگی ملون، یینگلیان شی به این فکر نمیکرد که آیا میخواهد کار خود را در ایالات متحده ادامه دهد یا در چین، چه رسد به اینکه روزی کارآفرین شود. در عوض، او تمام تمرکز خود را بر بهترین مکان برای ادامه کارش گذاشته بود – پایان نامه او در مورد شناسایی تهدیدات احتمالی امنیت اینترنت با جستجوی همبستگی بین رویدادهای به ظاهر نامرتبط بود. او در نهایت به آزمایشگاههای سیلیکون ولی مایکروسافت ریسرچ، یک اتاق فکر برای پیشرفتهای فناوری، رفت. شی با اشاره به اینکه همکارانش شامل چندین برنده جایزه تورینگ بودند - معروف به جایزه نوبل در علوم کامپیوتر - با شگفتی میگوید: «آنها واقعاً بهترین در جهان بودند.»
سه هفته بعد، فانگ یو، تازه فارغ التحصیل از دانشگاه کالیفرنیا/برکلی (همچنین با پایان نامه ای در مورد امنیت اینترنت) به همان آزمایشگاه رسید. این زنان در 30 دقیقه ای شهر سوژو، درست در غرب شانگهای بزرگ شده بودند و به سرعت با هم دوست و همکار علمی شدند.
امروزه، شی، 48 ساله، و یو، 46 ساله، دهها مقاله آکادمیک و 11 سال تلاشهای استارتآپی را در کارنامه خود دارند. اکنون، شرکتی که آنها در سال 2013 تأسیس کردند، DataVisor، مستقر در Mountain View، کالیفرنیا، سرانجام در زمینه داغ محافظت از شرکتهای مالی و مشتریانشان در برابر تقلب، پیشرفت کرده است. با مدیرعاملی شی و مدیر ارشد تولید یو، درآمد DataVisor در سال 2024 با 67 درصد افزایش به 50 میلیون دلار رسید و به آن کمک کرد تا برای اولین بار در فهرست Forbes' Fintech 50 قرار گیرد، که نوآورترین استارتآپهای فینتک آمریکا را معرفی میکند. مشتریان آن عبارتند از SoFi، Affirm و Marqeta.
این روزها، بانکها و فینتکها از تکنیکها و فروشندگان امنیتی متعددی در یک مسابقه تسلیحاتی واقعی با کلاهبرداران استفاده میکنند. جایگاه DataVisor یافتن شبکههای تقلب نوظهور قبل از اینکه بتوانند خسارات بزرگی وارد کنند است. این شبکهها دائماً راههای جدیدی برای تصاحب خوشههای حسابهای کاربری، سوء استفاده از آسیبپذیریهایی مانند نشت اطلاعات اعتباری برای ارسال درخواستهای وام جعلی یا فریب کاربران ناآگاه برای پرداخت هزینه محصولات نامشروع پیدا میکنند. هر زمان که یک حلقه یا روش تقلب جدید کشف شود، مدلهای تشخیص تقلب میتوانند برای شناسایی آن نشانههای هشدار بهروزرسانی شوند، اما این همیشه به کاربرانی که قبلاً تحت تأثیر قرار گرفتهاند کمک نمیکند.
شی میگوید: «با یادگیری ماشین معمولی، شما باید آن را روی چیزی آموزش دهید تا یاد بگیرد و بهتر شود. شما همیشه واکنشی هستید، الگوهای حمله را از ماهها قبل شناسایی میکنید، زمانی که اوضاع از قبل تغییر کرده است.»
راز DataVisor چیزی است که به عنوان یادگیری ماشینی «بدون نظارت» شناخته میشود، که از الگوریتمها برای تجزیه و تحلیل مجموعههای دادهای بدون برچسب استفاده میکند و همبستگیها را به تنهایی کشف میکند، بدون اینکه انسانها به آن بگویند به دنبال چه اهداف یا دستهبندیهایی باشد. شی وارد جزئیات نمیشود که چه چیزی باعث کارکرد الگوریتمهای ثبت شده میشود، اما یک مثال ساده ارائه میدهد: تصور کنید یک حلقه تقلب به دادههای یک بانک دسترسی پیدا میکند و یک نمایه قربانی خاص را شناسایی میکند، مانند مشتریان قدیمی با سابقه تراکنش بالا و تجربه دیجیتالی کمتر. سپس پیشنهادهای جعلی برای خرید کارت هدیه برای آنها ارسال میشود و اگر مبلغ دلاری کمتر از تراکنش معمول آنها باشد، احتمال کمتری وجود دارد که فیلترهای تقلب بانک را فعال کند. اما یادگیری ماشینی بدون نظارت DataVisor قادر خواهد بود در چند میلی ثانیه بین این مشتریان بانک ارتباط برقرار کند - ارتباطاتی که هیچکس به آن نگفته بود به دنبال آن باشد - و از هجوم پیشنهادات تقلبی در زمان واقعی جلوگیری کند.
یو میگوید: «این موضوع در مورد DataVisor بسیار منحصر به فرد است، اینکه ما قادریم خوشهبندی در زمان واقعی را انجام دهیم. آنها هر روز یا حتی هر ساعت طرحهای جدیدی ارائه میدهند.» شی میگوید این قابلیت امروزه به ویژه ارزشمند است، زیرا «تقریباً تمام حملات اصلی امروزی از این حلقههای تقلب هماهنگ ناشی میشوند.»
در واقع، یک گزارش اخیر توسط شرکت تأیید هویت Au10tix سال 2024 را سال «تقلب به عنوان یک سرویس» اعلام کرد. این گزارش میگوید که میانگین تعداد حوادث در هر «حمله بزرگ» هماهنگ از 4000 به 8000 دو برابر شده است و این کالایی شدن جرم و جنایت، پول بیشتری را از مصرفکنندگان میگیرد. ضررهای ناشی از تقلب گزارش شده به کمیسیون تجارت فدرال در ایالات متحده در سال 2023 به 10.4 میلیارد دلار و در سه فصل اول سال 2024 به 8.7 میلیارد دلار رسید و در مسیر ثبت یک رکورد دیگر قرار دارد.
این را برای شی و یو بگویید- آنها مهارتهای فنی لازم را برای اثبات ادعاهای خود دارند که الگوریتمهایشان برتر است. هر دو از سوپراستارهای دانشگاهی بودند، به طوری که شی رتبه اول را از بین 140 دانشجوی علوم کامپیوتر فارغالتحصیل شده از دانشگاه پکن کسب کرد و یو در حالی که دانشجوی کارشناسی در دانشگاه فودان در شانگهای بود، با اعضای مؤسس مایکروسافت ریسرچ آسیا کارآموزی کرد، که همین امر الهامبخش او برای ادامه تحصیل در مقطع دکترا شد.
هر دو برای تحصیلات تکمیلی به ایالات متحده آمدند، زیرا معتقد بودند اینجا مکانی برای پیگیری علوم کامپیوتر پیشرفته است. آنها کارت سبز دریافت کردند و برای کار در مایکروسافت ماندند و در نهایت شهروند شدند.
در هفت سال حضور در مایکروسافت، هر دو دهها مقاله منتشر کردند که از آن زمان تاکنون هزاران بار مورد استناد قرار گرفتهاند. آنها اغلب به عنوان نویسندگان مشترک در مقالاتی با موضوعاتی مانند رویکردی جدید برای شناسایی ترافیک ربات جستجو یا نحوه شناسایی طرحهای تبلیغات مخرب وب با هم همکاری میکردند.
شی میگوید: «ایدههای زیادی داشتیم، اما همیشه منتظر بودیم تا افراد دیگر این ایده را بردارند تا به واقعیت تبدیل شود. ما در مورد این صحبت کردیم که اگر یک سال دیگر در مایکروسافت ریسرچ بمانیم، میتوانیم شاید سه یا چهار مقاله در سال منتشر کنیم، اما پس از سالها، از آن سطح از تأثیرگذاری ناراضی میشوید. ما چیز واقعیتری میخواستیم.»
آنها همچنین توسط محققان شرکتهای دیگری مانند Yelp، Pinterest و Facebook که مقالات آنها را خوانده بودند و میخواستند در مورد مشکلات مشابه تجزیه و تحلیل دادهها همکاری کنند، مورد تماس قرار گرفتند. بنابراین در سال 2013 آنها گام کارآفرینی را برداشتند.
یو میگوید: «قبل از اینکه شرکت را شروع کنیم، از مردم پرسیدیم، آیا آماده هستیم؟ پاسخ یکپارچه این بود: نه، شما نمیدانید چه چیزی در پیش دارید.»
آنها با پساندازهای خود و ارتباطات دره سیلیکون شروع کردند و چند مشتری اولیه مانند Yelp را جذب کردند، که میخواست بداند آیا کاربران با نظرات خود از سیستم آن سوء استفاده میکنند یا خیر، و برنامه پیامرسانی فوری چینی Momo. آنها در سال 2015 یک دور سرمایهگذاری سری A به مبلغ 14.5 میلیون دلار، اولین پول خارجی را که جمعآوری کردند، بستند و جایگاهی را در ساختن راهحلهای امنیتی برای شرکتهای اینترنتی با فناوری پیشرفته ایجاد کردند. در سال 2018، DataVisor 40 میلیون دلار دیگر با رهبری Sequoia China جمعآوری کرد و طبق گزارش Pitchbook پس از 12 میلیون دلار بیشتر در سال 2019، به ارزش 390 میلیون دلار رسید.
اما در زیر سطح، بازار آنها خشک میشد. در حالی که DataVisor بر سوء استفاده از تبلیغاتی متمرکز بود که شرکتهای فناوری برای جذب کاربران بیشتر ارائه میکردند، مشتریان آن به اندازه گذشته این پاداشها را ارائه نمیکردند، که معمولاً منجر به نرخهای بالای حفظ مشتری نمیشد. در همان زمان، مؤسسات مالی سیستمهای خود را با سرعت بیشتری دیجیتالی میکردند و DataVisor استراتژی خود را برای هدف قرار دادن آنها به عنوان مشتری تغییر داد.
این تغییر سریع نبود. شی میگوید دو یا سه سال طول کشید تا «محصول خود را از درون به بیرون بچرخانیم» و الگوریتمهای خود را بیشتر سرتاسری کنیم، مانند یک فروشگاه یکجا برای پیشگیری از تقلب. DataVisor 40 میلیون دلار در دسامبر 2022 به رهبری Brighton Park Capital جمعآوری کرد تا به بازسازی خود کمک کند. طبق گزارش Pitchbook، در زمانی که اشتیاق سرمایهگذاران به فینتکها در حال کاهش بود، ارزشگذاری کمتری به مبلغ 260 میلیون دلار برای آن دور سرمایهگذاری در نظر گرفته شد و مجموع بودجه آن به بیش از 100 میلیون دلار رسید. Forbes تخمین میزند که این دو بنیانگذار در مجموع حدود 25 درصد از سهام شرکت را حفظ کردهاند.
شی تغییر در احساسات بازار در سال 2022 را به عنوان یک «بررسی واقعیت» برای خود و هیئت مدیرهاش پس از آن که سال قبل یک معیار بالا برای ارزشگذاری تعیین کرده بود، توصیف میکند. اما او هرگز فشار جدی برای آوردن مدیران باتجربهتر برای جمعآوری دور سرمایهگذاری دیگری احساس نکرد. در عوض، او میگوید DataVisor در نهایت با چندین برگه شرایط برای بررسی مواجه شد و تصمیم گرفت با Brighton Park، یک شرکت سرمایهگذاری سهام خصوصی مستقر در Greenwich، کانکتیکات، که به چشمانداز بلندمدت او اعتقاد داشت، شریک شود.
شی میگوید: «این نقطهای بود که ما به بودجه اضافی نیاز داشتیم تا ما را به سطح بعدی برساند. ما بسیار مطمئن بودیم که هنوز بهترین فناوری را در جهان داریم.»
تاکنون، ظاهر جدید موفقیتآمیز بوده است. 50 مشتری DataVisor اکنون شامل شرکت خرید اعتباری Affirm، بانک دیجیتال SoFi و صادرکننده کارت Marqeta هستند. اگرچه تعداد مشتریان در مقایسه با شرکتهای تأیید هویت مانند Persona یا Socure که به هزاران کسبوکار خدمات ارائه میدهند، ناچیز است، DataVisor نوید یک رابطه عمیق را میدهد که همه چیز از پذیرش کاربران تا نظارت بر تراکنشها و حوالههای آنها را پوشش میدهد. مشتریان هزینه اشتراک سالانه را پرداخت میکنند که بر اساس حجم رویدادهایی که DataVisor باید پردازش کند، متفاوت است.
شی میگوید که بسیاری از مشتریان اکنون به DataVisor مراجعه میکنند تا تلاشهای خود را برای مبارزه با تقلب ادغام کنند، پس از اینکه متوجه شدند تلاش برای ادغام چندین فروشنده مختلف باعث سردرد و ناهماهنگی میشود. این کمک و رویکرد جامع به DataVisor اجازه میدهد تا برای هر مشتری اضافی هزینه بیشتری نسبت به رقبا دریافت کند. او میگوید: «با گذشت زمان، امیدواریم که این امر به ما مسیری برای تبدیل شدن به یک شرکت بسیار بزرگتر بدهد.»