عکس از کودی پیکنز برای فوربز
عکس از کودی پیکنز برای فوربز

دانشمندانی که در DataVisor پشت پرده هستند، از هوش مصنوعی برای شناسایی کلاهبرداری‌های مالی قبل از شروع آن‌ها استفاده می‌کنند

عکس روی جلد دیجیتال - یینگلیان شی از Datavisor
عکس از کودی پیکنز برای فوربز

چگونه دو زن چینی تزهای دکترای خود را به یادگیری ماشینی تبدیل کردند که ارتباطاتی بین رویدادهای به ظاهر نامرتبط برقرار می‌کند تا طرح‌های تقلب نوظهور را کشف کند.

در سال 2006، پس از گرفتن مدرک دکترا از دانشگاه کارنگی ملون، یینگلیان شی به این فکر نمی‌کرد که آیا می‌خواهد کار خود را در ایالات متحده ادامه دهد یا در چین، چه رسد به اینکه روزی کارآفرین شود. در عوض، او تمام تمرکز خود را بر بهترین مکان برای ادامه کارش گذاشته بود – پایان نامه او در مورد شناسایی تهدیدات احتمالی امنیت اینترنت با جستجوی همبستگی بین رویدادهای به ظاهر نامرتبط بود. او در نهایت به آزمایشگاه‌های سیلیکون ولی مایکروسافت ریسرچ، یک اتاق فکر برای پیشرفت‌های فناوری، رفت. شی با اشاره به اینکه همکارانش شامل چندین برنده جایزه تورینگ بودند - معروف به جایزه نوبل در علوم کامپیوتر - با شگفتی می‌گوید: «آنها واقعاً بهترین در جهان بودند.»

سه هفته بعد، فانگ یو، تازه فارغ التحصیل از دانشگاه کالیفرنیا/برکلی (همچنین با پایان نامه ای در مورد امنیت اینترنت) به همان آزمایشگاه رسید. این زنان در 30 دقیقه ای شهر سوژو، درست در غرب شانگهای بزرگ شده بودند و به سرعت با هم دوست و همکار علمی شدند.


امروزه، شی، 48 ساله، و یو، 46 ساله، ده‌ها مقاله آکادمیک و 11 سال تلاش‌های استارت‌آپی را در کارنامه خود دارند. اکنون، شرکتی که آنها در سال 2013 تأسیس کردند، DataVisor، مستقر در Mountain View، کالیفرنیا، سرانجام در زمینه داغ محافظت از شرکت‌های مالی و مشتریانشان در برابر تقلب، پیشرفت کرده است. با مدیرعاملی شی و مدیر ارشد تولید یو، درآمد DataVisor در سال 2024 با 67 درصد افزایش به 50 میلیون دلار رسید و به آن کمک کرد تا برای اولین بار در فهرست Forbes' Fintech 50 قرار گیرد، که نوآورترین استارت‌آپ‌های فین‌تک آمریکا را معرفی می‌کند. مشتریان آن عبارتند از SoFi، Affirm و Marqeta.

این روزها، بانک‌ها و فین‌تک‌ها از تکنیک‌ها و فروشندگان امنیتی متعددی در یک مسابقه تسلیحاتی واقعی با کلاهبرداران استفاده می‌کنند. جایگاه DataVisor یافتن شبکه‌های تقلب نوظهور قبل از اینکه بتوانند خسارات بزرگی وارد کنند است. این شبکه‌ها دائماً راه‌های جدیدی برای تصاحب خوشه‌های حساب‌های کاربری، سوء استفاده از آسیب‌پذیری‌هایی مانند نشت اطلاعات اعتباری برای ارسال درخواست‌های وام جعلی یا فریب کاربران ناآگاه برای پرداخت هزینه محصولات نامشروع پیدا می‌کنند. هر زمان که یک حلقه یا روش تقلب جدید کشف شود، مدل‌های تشخیص تقلب می‌توانند برای شناسایی آن نشانه‌های هشدار به‌روزرسانی شوند، اما این همیشه به کاربرانی که قبلاً تحت تأثیر قرار گرفته‌اند کمک نمی‌کند.

شی می‌گوید: «با یادگیری ماشین معمولی، شما باید آن را روی چیزی آموزش دهید تا یاد بگیرد و بهتر شود. شما همیشه واکنشی هستید، الگوهای حمله را از ماه‌ها قبل شناسایی می‌کنید، زمانی که اوضاع از قبل تغییر کرده است.»

راز DataVisor چیزی است که به عنوان یادگیری ماشینی «بدون نظارت» شناخته می‌شود، که از الگوریتم‌ها برای تجزیه و تحلیل مجموعه‌های داده‌ای بدون برچسب استفاده می‌کند و همبستگی‌ها را به تنهایی کشف می‌کند، بدون اینکه انسان‌ها به آن بگویند به دنبال چه اهداف یا دسته‌بندی‌هایی باشد. شی وارد جزئیات نمی‌شود که چه چیزی باعث کارکرد الگوریتم‌های ثبت شده می‌شود، اما یک مثال ساده ارائه می‌دهد: تصور کنید یک حلقه تقلب به داده‌های یک بانک دسترسی پیدا می‌کند و یک نمایه قربانی خاص را شناسایی می‌کند، مانند مشتریان قدیمی با سابقه تراکنش بالا و تجربه دیجیتالی کمتر. سپس پیشنهادهای جعلی برای خرید کارت هدیه برای آنها ارسال می‌شود و اگر مبلغ دلاری کمتر از تراکنش معمول آنها باشد، احتمال کمتری وجود دارد که فیلترهای تقلب بانک را فعال کند. اما یادگیری ماشینی بدون نظارت DataVisor قادر خواهد بود در چند میلی ثانیه بین این مشتریان بانک ارتباط برقرار کند - ارتباطاتی که هیچ‌کس به آن نگفته بود به دنبال آن باشد - و از هجوم پیشنهادات تقلبی در زمان واقعی جلوگیری کند.

یو می‌گوید: «این موضوع در مورد DataVisor بسیار منحصر به فرد است، اینکه ما قادریم خوشه‌بندی در زمان واقعی را انجام دهیم. آنها هر روز یا حتی هر ساعت طرح‌های جدیدی ارائه می‌دهند.» شی می‌گوید این قابلیت امروزه به ویژه ارزشمند است، زیرا «تقریباً تمام حملات اصلی امروزی از این حلقه‌های تقلب هماهنگ ناشی می‌شوند.»

در واقع، یک گزارش اخیر توسط شرکت تأیید هویت Au10tix سال 2024 را سال «تقلب به عنوان یک سرویس» اعلام کرد. این گزارش می‌گوید که میانگین تعداد حوادث در هر «حمله بزرگ» هماهنگ از 4000 به 8000 دو برابر شده است و این کالایی شدن جرم و جنایت، پول بیشتری را از مصرف‌کنندگان می‌گیرد. ضررهای ناشی از تقلب گزارش شده به کمیسیون تجارت فدرال در ایالات متحده در سال 2023 به 10.4 میلیارد دلار و در سه فصل اول سال 2024 به 8.7 میلیارد دلار رسید و در مسیر ثبت یک رکورد دیگر قرار دارد.


این را برای شی و یو بگویید- آنها مهارت‌های فنی لازم را برای اثبات ادعاهای خود دارند که الگوریتم‌هایشان برتر است. هر دو از سوپراستارهای دانشگاهی بودند، به طوری که شی رتبه اول را از بین 140 دانشجوی علوم کامپیوتر فارغ‌التحصیل شده از دانشگاه پکن کسب کرد و یو در حالی که دانشجوی کارشناسی در دانشگاه فودان در شانگهای بود، با اعضای مؤسس مایکروسافت ریسرچ آسیا کارآموزی کرد، که همین امر الهام‌بخش او برای ادامه تحصیل در مقطع دکترا شد.

هر دو برای تحصیلات تکمیلی به ایالات متحده آمدند، زیرا معتقد بودند اینجا مکانی برای پیگیری علوم کامپیوتر پیشرفته است. آنها کارت سبز دریافت کردند و برای کار در مایکروسافت ماندند و در نهایت شهروند شدند.

در هفت سال حضور در مایکروسافت، هر دو ده‌ها مقاله منتشر کردند که از آن زمان تاکنون هزاران بار مورد استناد قرار گرفته‌اند. آنها اغلب به عنوان نویسندگان مشترک در مقالاتی با موضوعاتی مانند رویکردی جدید برای شناسایی ترافیک ربات جستجو یا نحوه شناسایی طرح‌های تبلیغات مخرب وب با هم همکاری می‌کردند.

شی می‌گوید: «ایده‌های زیادی داشتیم، اما همیشه منتظر بودیم تا افراد دیگر این ایده را بردارند تا به واقعیت تبدیل شود. ما در مورد این صحبت کردیم که اگر یک سال دیگر در مایکروسافت ریسرچ بمانیم، می‌توانیم شاید سه یا چهار مقاله در سال منتشر کنیم، اما پس از سال‌ها، از آن سطح از تأثیرگذاری ناراضی می‌شوید. ما چیز واقعی‌تری می‌خواستیم.»

آنها همچنین توسط محققان شرکت‌های دیگری مانند Yelp، Pinterest و Facebook که مقالات آنها را خوانده بودند و می‌خواستند در مورد مشکلات مشابه تجزیه و تحلیل داده‌ها همکاری کنند، مورد تماس قرار گرفتند. بنابراین در سال 2013 آنها گام کارآفرینی را برداشتند.

یو می‌گوید: «قبل از اینکه شرکت را شروع کنیم، از مردم پرسیدیم، آیا آماده هستیم؟ پاسخ یکپارچه این بود: نه، شما نمی‌دانید چه چیزی در پیش دارید.»

آنها با پس‌اندازهای خود و ارتباطات دره سیلیکون شروع کردند و چند مشتری اولیه مانند Yelp را جذب کردند، که می‌خواست بداند آیا کاربران با نظرات خود از سیستم آن سوء استفاده می‌کنند یا خیر، و برنامه پیام‌رسانی فوری چینی Momo. آنها در سال 2015 یک دور سرمایه‌گذاری سری A به مبلغ 14.5 میلیون دلار، اولین پول خارجی را که جمع‌آوری کردند، بستند و جایگاهی را در ساختن راه‌حل‌های امنیتی برای شرکت‌های اینترنتی با فناوری پیشرفته ایجاد کردند. در سال 2018، DataVisor 40 میلیون دلار دیگر با رهبری Sequoia China جمع‌آوری کرد و طبق گزارش Pitchbook پس از 12 میلیون دلار بیشتر در سال 2019، به ارزش 390 میلیون دلار رسید.

اما در زیر سطح، بازار آنها خشک می‌شد. در حالی که DataVisor بر سوء استفاده از تبلیغاتی متمرکز بود که شرکت‌های فناوری برای جذب کاربران بیشتر ارائه می‌کردند، مشتریان آن به اندازه گذشته این پاداش‌ها را ارائه نمی‌کردند، که معمولاً منجر به نرخ‌های بالای حفظ مشتری نمی‌شد. در همان زمان، مؤسسات مالی سیستم‌های خود را با سرعت بیشتری دیجیتالی می‌کردند و DataVisor استراتژی خود را برای هدف قرار دادن آنها به عنوان مشتری تغییر داد.

این تغییر سریع نبود. شی می‌گوید دو یا سه سال طول کشید تا «محصول خود را از درون به بیرون بچرخانیم» و الگوریتم‌های خود را بیشتر سرتاسری کنیم، مانند یک فروشگاه یک‌جا برای پیشگیری از تقلب. DataVisor 40 میلیون دلار در دسامبر 2022 به رهبری Brighton Park Capital جمع‌آوری کرد تا به بازسازی خود کمک کند. طبق گزارش Pitchbook، در زمانی که اشتیاق سرمایه‌گذاران به فین‌تک‌ها در حال کاهش بود، ارزش‌گذاری کمتری به مبلغ 260 میلیون دلار برای آن دور سرمایه‌گذاری در نظر گرفته شد و مجموع بودجه آن به بیش از 100 میلیون دلار رسید. Forbes تخمین می‌زند که این دو بنیانگذار در مجموع حدود 25 درصد از سهام شرکت را حفظ کرده‌اند.

شی تغییر در احساسات بازار در سال 2022 را به عنوان یک «بررسی واقعیت» برای خود و هیئت مدیره‌اش پس از آن که سال قبل یک معیار بالا برای ارزش‌گذاری تعیین کرده بود، توصیف می‌کند. اما او هرگز فشار جدی برای آوردن مدیران باتجربه‌تر برای جمع‌آوری دور سرمایه‌گذاری دیگری احساس نکرد. در عوض، او می‌گوید DataVisor در نهایت با چندین برگه شرایط برای بررسی مواجه شد و تصمیم گرفت با Brighton Park، یک شرکت سرمایه‌گذاری سهام خصوصی مستقر در Greenwich، کانکتیکات، که به چشم‌انداز بلندمدت او اعتقاد داشت، شریک شود.

شی می‌گوید: «این نقطه‌ای بود که ما به بودجه اضافی نیاز داشتیم تا ما را به سطح بعدی برساند. ما بسیار مطمئن بودیم که هنوز بهترین فناوری را در جهان داریم.»

تاکنون، ظاهر جدید موفقیت‌آمیز بوده است. 50 مشتری DataVisor اکنون شامل شرکت خرید اعتباری Affirm، بانک دیجیتال SoFi و صادرکننده کارت Marqeta هستند. اگرچه تعداد مشتریان در مقایسه با شرکت‌های تأیید هویت مانند Persona یا Socure که به هزاران کسب‌وکار خدمات ارائه می‌دهند، ناچیز است، DataVisor نوید یک رابطه عمیق را می‌دهد که همه چیز از پذیرش کاربران تا نظارت بر تراکنش‌ها و حواله‌های آنها را پوشش می‌دهد. مشتریان هزینه اشتراک سالانه را پرداخت می‌کنند که بر اساس حجم رویدادهایی که DataVisor باید پردازش کند، متفاوت است.

شی می‌گوید که بسیاری از مشتریان اکنون به DataVisor مراجعه می‌کنند تا تلاش‌های خود را برای مبارزه با تقلب ادغام کنند، پس از اینکه متوجه شدند تلاش برای ادغام چندین فروشنده مختلف باعث سردرد و ناهماهنگی می‌شود. این کمک و رویکرد جامع به DataVisor اجازه می‌دهد تا برای هر مشتری اضافی هزینه بیشتری نسبت به رقبا دریافت کند. او می‌گوید: «با گذشت زمان، امیدواریم که این امر به ما مسیری برای تبدیل شدن به یک شرکت بسیار بزرگتر بدهد.»