چرا کسب و کار ها باید از پلتفرم های تشخیص تقلب استفاده کنند و خودشان به مقابله با تقلب نروند؟
نویسنده : مهسا اذانی | تاریخ بروزرسانی : 1400/04/08
نکته قابل توجه برای هر کسب و کار بزرگ آنلاین این است که آیا یک راه حل تشخیص تقلب در داخل مجموعه ایجاد کند یا از یک ارائه دهنده راه حل (third party)استفاده کند. ما یک نظر داریم اما بگذارید از همان ابتدا روشن باشیم: ما مدعی هستیم در بهترین بودن. دژینو بیش از یک سال صرف توسعه ابزارها و تکنیک هایی کرده است که بهترین ها را در کلاس پیشگیری از تقلب نشان دهد و از این بابت بسیار افتخار می کنیم.
اما، ما با مشتریانی بسیار بزرگ و دارای مهارت کافی فنی برخورد می کنیم(بزرگترین کسب و کار های ایران) که بتوانند راه حل خود را بسازند. ما همچنین با مشتریانی کار می کنیم که ترکیبی از فناوری خود و برخی از ما (مدل ترکیبی) دارند.
بنابراین، بحث هایی که ما با دوستانمان در این باره انجام می دهیم در مورد کدام مسیر است؟ ملاحظات هنگام تصمیم گیری چیست؟
آیا تشخیص تقلب صلاحیت اصلی کسب و کار شماست؟
ساخت یک سیستم خوب کشف تقلب ارزان نیست و همچنین کار آسانی نیست. برای مقایسه، تعداد کمی از شرکت ها سیستم حسابداری خود را ایجاد می کنند. پس چرا برخی از مشاغل در نظر دارند خودشان تقلب را کشف کنند؟
در بعضی موارد به این دلیل است که تلاش مورد نیاز دست کم گرفته می شود. ساخت یک سیستم اساسی کشف تقلب که به سرعت تخریب می شود بسیار آسان است. اما …
ساخت، نگهداری و پشتیبانی از یک سیستم کاری مهم است. بنابراین ما به سوال اصلی بر می گردیم، چرا ساخت در داخل مجموعه؟ از خودت بپرس:
- آیا کسب و کار شما منوط به این است که بتوانید ریسک را به طور دقیق پیش بینی کنید؟
- آیا این یک هدف و رشد طبیعی از سیستم ها و مهارت های موجود شما است که قبلاً داشته اید؟
- آیا این موضوع ماهیت کسب و کار است یا ریسک درز اطلاعات در سپردن به third party آن چنان بالاست که چاره ای جز ساخت داخلی ندارید؟
- آیا دلیل نظارتی و قانونی وجود دارد که شما را وادار به انجام داخلی می کند؟
منطقی است که تصور کنیم پاسخ حداقل یکی از این سوال ها مثبت است. بنابراین چه ملاحظات دیگری وجود دارد؟
آیا داده های کافی برای ایجاد مدل های کارآمد ماشین لرنینگ کشف تقلب دارید؟
برای لحظه ای فرض خواهیم کرد که هر کسب و کار قصد دارد از یادگیری ماشینی در هسته استراتژی تشخیص تقلب خود استفاده کند. با استفاده از این فرض، برای شروع چقدر داده مورد نیاز است تا با اطمینان کافی استارت زده شود؟
ما در دژینو معتقدیم (و ثابت کرده ایم) که بهترین داده برای پیش بینی مربوط به خود کسب و کار است. به همین دلیل است که ما برای هر یک از مشتریان خود مدل های سفارشی می سازیم. هر کسب و کار با اندازه قابل توجه (مثلاً معاملات> 500 میلیون تومان در سال) باید داده های کافی برای ساخت مدل های بسیار عالی را داشته باشد.
آنچه که آنها هرگز نخواهند داشت دسترسی به مجموعه داده های فراتر از مجموعه خود است.
این مهم است زیرا توانایی آزمایش و تنظیم مدل ها در محیط های مختلف، دفاعی کلیدی برای نصب بیش از حد است. بهتر است از یک مدل کلی حرکت کرده و سپس با یک مجموعه داده خاص سازگار شوید. یک کسب و کار تنها مدل خاصی دارد که می تواند نتایج خوبی داشته باشد اما هرگز بهینه نیست.
آیا از نسل های جدید تقلب می دانید و در این مورد بروز هستید؟
هر کسب و کار بزرگ تیمی آشنا با تقلب هایی خواهد داشت که کسب و کار هر روز با آن روبرو می شود. معمولاً در آن تیم برخی از آنها تجربه هایی از شرکت های دیگر را با خود به همراه آورده اند. تخصص واقعی تقلب معمولاً مسئله ای نیست.
کاری که انجام آن دشوارتر است ترجمه این تخصص به علم داده و انجام آن به طور مداوم است. تیم های علوم داده در مشاغل تجارت الکترونیکی عموم گرایان هستند. کار بر روی الگوریتم های قیمت گذاری برای یک پروژه و کشف تقلب در پروژه دیگر. این مزایای مشخصی دارد. مهمترین آنها توانایی درگیر کردن استعداد علوم داده در هنگام شروع کار بر روی یکسری مشکلات است. هزینه این کار استفاده مداوم توسط تیم داده برای مسئله تقلب است.
همانطور که دژینو بالغ شده است، یکی از مهارتهایی که ما به کمال رسانده ایم توانایی تبدیل بینش تقلب به صد ها ویژگی آزمایش شده و معتبر و ورودی های مدل است که انجام مقیاس آن در داخل بسیار دشوار است. این نتیجه تحقیقات و تیم رابط مشتری در مرحله قفل با یک تیم علوم داده است که دائماً روی موضوع تقلب متمرکز است. ساده به نظر می رسد. راز ایجاد انگیزه در یک تیم در دراز مدت است اگر آنها فقط روی یک مجموعه داده های تجاری کار می کنند.
فراتر از نسخه 1.0 دژینو
ارسال نمونه اولیه چه در نرم افزار و چه در علم داده، آسان و سرگرم کننده است. انعطاف پذیر، قابل اعتماد، مقیاس پذیر، سریع و ایمن، بسیار دشوارتر است.
ما در مورد بهترین روش های علوم داده خود به جزئیات زیادی می پردازیم. و اطلاعاتی که در یک سال پیش به دست آوردیم امروز از رده خارج شده است و باید خود را بروز نگه داریم، بات های نسل جدید هر روز به بازار می آیند.
وقتی تقلب در بسیاری از سازمان ها کنترل می شود، بسیار جدی و وسوسه انگیز است که پروژه تشخیص تقلب را ” تمام شده ” ببینید و کارکنان اصلی را به اولویت های دیگر منتقل کنید.
در این میان ، تقلب و متقلب در حال تغییر هستند. جهان به جلو حرکت می کند اما راه حل داخلی شما اینگونه نیست.
یکی از نکات مهم در مورد ارزیابی خرید و ساخت این است که چقدر می توانید از بودجه تضمین شده و منابع مستمر دانشمندان داده شما که به دنبال تقلب هستند، اطمینان دارید.
نوآوری در تقلب
ما تاکنون روی رایج ترین سناریوی کشف تقلب متمرکز شده ای، تقلب با کارت پرداخت با استفاده از یادگیری ماشین پیش بینی شده است. اما این تنها بخشی از تصویر تقلب است. مشتریان ما همه از دژینو حداقل برای یکی از خدمات اضافی علاوه بر این استفاده می کنند. من خلاصه آنها را با پیوندهایی برای اطلاعات بیشتر شرح می دهم:
- تجزیه و تحلیل شبکه: ایجاد فوری گراف شبکه ای که روابط نهاد ها را در یک پایگاه داده نشان دهد. این مورد برای تجزیه و تحلیل تحقیقات حیاتی است. همچنین تجزیه و تحلیل شبکه ها قابلیت پیش بینی ماشین لرنینگ را افزایش می دهد.
- تقلب در بازارگاه(Marketplace) : تجزیه و تحلیل 360 درجه تهدیدات تقلب برای یک بازار آنلاین. از تأمین کننده تا پیک موتوری، هر عنصر یک خطر بالقوه است و تکنیک های مختلفی برای این تصویر پیچیده لازم است.
- احراز هویت و پذیرش : به طور فزاینده ای، موفقیت در پرداخت به این بستگی دارد که چه مقدار پرداخت خوب می توانید بدون اصطکاک پذیرفته شوید. نه فقط متوقف کردن پرداخت های بد. مقررات و قوانین به سرعت در حال تغییر این چشم انداز هستند و سرمایه گذاری برای ادامه کار بسیار دلهره آور است.
- مجموعه داده های به اشتراک گذاشته شده : یک بررسی مفید تقلب بین مشاغل مشابه این است که آیا برخی از شناسه ها توسط سایر کسب و کار ها به عنوان تقلب برچسب گذاری شده اند یا خیر. این می تواند یک ایمیل، تلفن، آدرس IP یا روش پرداخت باشد. این فقط از طریق داده های مشترک ناشناس از طریق شخص ثالث (third party) امکان پذیر است.
از آنجا که ماهیت حملات مخرب کننده بات ها و تقلب تکامل می یابد، فنون و تکنیک های فناوری لازم برای شکست آنها بی پایان است. این معمای اصلی در تصمیم خرید و ساخت است. این یک تصمیم یک بار نیست. این یک سرمایه گذاری در حال انجام و قابل توجه است. البته هر راهی را انتخاب کنید درست است. تصمیم واقعی این است که به احتمال زیاد بهترین نتیجه را برای کسب و کار شما به همراه داشته باشد. ما خوشحال خواهیم شد که به کسب و کار شما کمک کنیم.