دانلود و پشتیبانی

لورم ایپسوم متن ساختگی با تولید سادگی نامفهوم از صنعت چاپ و با استفاده از طراحان گرافیک است.

s f

اطلاعات تماس
ایران چهارمحال و بختیاری
شهرکرد خیابان اول
youremail@yourdomain.com
038312345678

دژینو | dezhino

سیستم یادگیری ماشین تحت نظارت

سیستم یادگیری ماشین تحت نظارت چگونه کار می کند؟

نویسنده : مهسا اذانی | تاریخ بروزرسانی : 1400/03/21

چندین مدل مختلف یادگیری ماشین می شود استفاده کرد، در اینجا یک توضیح ساده از نحوه کار سیستم یادگیری ماشین تحت نظارت(Supervised machine learning system) وجود دارد با ما همراه باشید.

 

داده های ورودی ⇓

داده های ورودی ⇓

استخراج ویژگی ها ⇓

استخراج ویژگی ها ⇓

الگوریتم آموزش ⇓

الگوریتم آموزش ⇓

ایجاد مدل ⇓

ایجاد مدل 

 

داده های ورودی به یادگیری ماشین

وقتی نوبت به کشف تقلب می رسد، هرچه داده بیشتر باشد بهتر است.

برای یادگیری ماشین تحت نظارت(supervised machine learning)، داده ها باید دارای برچسب خوب (مشتریان واقعی که هرگز مرتکب تقلب نشده اند) یا بد (مشتریانی با تقلب مرتبط با آنها شوند یا به صورت دستی به عنوان متقلب برچسب گذاری شوند) باشند.

 

استخراج ویژگی ها یادگیری ماشین تحت نظارت

ویژگی ها رفتار مشتری را توصیف می کنند و رفتارهای متقلبانه به عنوان سیگنال های کلاهبرداری شناخته می شوند.

 

در دژینو، ما ویژگی ها را به پنج دسته اصلی گروه بندی می کنیم که هر یک از آنها دارای صدها یا هزاران ویژگی فردی است:

 

هویت

هویت

 

تعداد ارقام در آدرس ایمیل مشتری، سن حساب وی، تعداد دستگاه هایی که مشتری در آن مشاهده شده است، میزان تقلب در آدرس IP مشتری.

 

سفارشات

سفارشات

 

تعداد سفارشاتی که در هفته اول انجام داده اند، تعداد معاملات ناموفق، ارزش متوسط سفارش، محتوای پرخطر سبد.

 

روش های پرداخت

روش های پرداخت

 

میزان تقلب در صدور بانک، شباهت بین نام مشتری و نام صورتحساب، کارت های کشورهای مختلف.

 

مکانها

مکانها

 

آدرس حمل و نقل با آدرس صورتحساب مطابقت دارد، کشور حمل و نقل با کشور آدرس IP مشتری مطابقت دارد، میزان تقلب در محل مشتری.

 

شبکه

شبکه

 

تعداد ایمیل ها ، شماره تلفن ها یا روش های پرداخت مشترک در شبکه ، سن شبکه مشتری.

 

الگوریتم آموزش یادگیری ماشین تحت نظارت

 

الگوریتم مجموعه قوانینی است که هنگام حل مسائل پیچیده مانند معادله ریاضی یا حتی یک دستورالعمل رعایت می شود. الگوریتم با استفاده از داده های مشتری توصیف شده توسط ویژگی های ما برای یادگیری نحوه پیش بینی  تقلب یا غیر تقلب است.

 

در آغاز، ما الگوریتم مربوط به داده های قدیمی خود کسب و کار را استفاده خواهیم داد، ما این را یک مجموعه یادگیری می نامیم. هرچه تقلب در این یادگیری بیشتر باشد، بهتر است، به طوری که ماشین مثالهای زیادی برای یادگیری دارد.

 

یک مدل یادگیری ماشین تحت نظارت ایجاد کنید

 

هنگامی که یادگیری به پایان رسید، شما یک مدل خاص برای کسب و کار خود دارید، که می تواند تقلب را در میلی ثانیه تشخیص دهد.

 

ما به طور مداوم مراقب مدل هستیم تا مطمئن شویم که آنطور که باید رفتار می کند و همیشه به دنبال راه هایی برای بهبود آن هستیم. ما به طور منظم مدل جدیدی را برای هر مشتری بهبود، به روز رسانی و بارگذاری می کنیم تا سیستم همیشه جدیدترین تکنیک های تقلب را تشخیص دهد.

 

چگونه می توانید بگویید مدل کار می کند؟

 

بعد از یادگیری، برای بررسی اینکه مدل به درستی کار می کند، داده هایی را که قبلاً هرگز ندیده است، به مدل نشان می دهیم، اما نتایج تقلب را می دانیم. اگر مدل تقلب را به درستی تشخیص دهد، می توانیم آن را برای استفاده در برابر معاملات تجارت آنلاین اجرا کنیم. ما همچنین برخی از تجزیه و تحلیل های عقل سلیم خودکار را بر روی داده های اخیر انجام می دهیم که برچسب تقلبی برای اطمینان از رفتار صحیح مدل هنگام اجرا نداریم.

 

شرایط تقلبی خاصی وجود دارد که مدل باید همیشه آنها را انتخاب کند، برخی از نمونه ها عبارتند از:

 

  • سرعت بالا در روش های پرداخت جدید به عنوان مثال: مشتری در عرض یک ساعت 10 کارت پرداخت جدید اضافه می کند
  • آدرس ایمیل مشکوک به عنوان مثال: عدم تطابق بین نام حساب یا نام موجود در کارت، یا کلمات بی ادب / ناشایست در ایمیل
  • مشتری تعداد زیادی سفارش با ارزش بالا انجام می دهد.
  • سفارشات از یک مکان مخصوص تقلب، حمل و نقل به یک مکان کلاهبرداری شناخته شده یا صندوق پستی به جای آدرس مسکونی

 

همه این نمونه ها باید به عنوان تقلب علامت گذاری شوند، بنابراین چه اتفاقی رخ می دهد زمانی که دستگاه ای تقلب ها را پیش بینی می کند؟

 

استفاده از یادگیری ماشینی تحت نظارت برای ایجاد نمره ریسک تقلب

مشتری سفارش می دهد  ⇓

مشتری سفارش می دهد  ⇓

 

ML ویژگی هایی را ایجاد می کند  ⇓

ML ویژگی هایی را ایجاد می کند  ⇓

مدل نمره ریسک را پیش بینی میکند⇓

مدل نمره ریسک را پیش بینی میکند⇓

در نقطه معامله، مدل به هر مشتری نمره ریسک در مقیاس 1-100 می دهد. هرچه امتیاز بالاتر باشد، احتمال تقلب بیشتر است.

 

میزان ریسک مناسب برای کسب و کار خود را انتخاب کنید و برای نسبت معامله هایی که می خواهید مجاز باشید، آستانه هایی تعیین کنید.

 

تعیین آستانه ریسک مناسب برای کسب و کار شما

 

مرحله بعدی این است که از خود بپرسید ، آستانه ریسک مناسب برای کسب و کار من چقدر باید باشد؟

 

تحلیل آستانه و دقت و فراخوانی

 

تعیین آستانه ریسک مناسب شامل انجام تجزیه و تحلیل داده ها بر اساس اصول دقت و یادآوری است. این یک عمل متعادل کننده پیچیده بین:

  • نکات مثبت واقعی (تعداد زیادی از متقلبان را مسدود می کنیم)
  • نکات مثبت کاذب (چه تعداد افراد خوب را مسدود می کنیم)
  • منفی های کاذب (تعداد متقلبان را مجاز می دانیم)

 

تحلیل آستانه و دقت و فراخوانی

 

 

مقیاس پذیری در اینجا بسیار مهم است. برای دژینو، نرخ پذیرش معمول ما معمولاً بالاتر از 98 یا 99٪ است ، بنابراین تقریباً همه معاملات تأیید می شوند. محدوده کوچکی از معاملات رد شده است که در آنجا بهینه سازی انجام می شود.

 

“تجزیه و تحلیل ریسک می پرسد که چقدر می توانید 100٪ پذیرش داشته باشید بدون اینکه هزینه تقلب خیلی زیاد شود”

 

سطح مناسب ریسک برای هر مشاغل متفاوت است. یک کسب و کار با حجم بالای معاملات با تعداد زیاد اما ارزش ریالی کم  (به عنوان مثال تحویل غذا) ممکن است آستانه خطر را بسیار بالا تنظیم کند، به طوری که آنها می توانند اطمینان حاصل کنند که حداقل معاملات واقعی را مسدود می کنند.

 

تحلیلگران تحقیق ما در این محاسبات متخصص هستند و می توانند به شما کمک کنند آستانه های مناسب متناسب ریسک خود را پیدا کنید. با ما در ارتباط باشید 🙂 

 

چند سوال اساسی در زمینه اجرا کردن یادگیری ماشین!

 

آیا کسب و کار شما به مدل یادگیری ماشین با داده های خودتان نیاز دارد؟

 

همیشه بهترین راه برای تشخیص تقلب یک کسب و کار استفاده از داده های خود مشتری خواهد بود. مدل های مختلف تجاری می توانند چرخه و مقادیر سفارش مشتری بسیار متفاوتی داشته باشند. به عنوان مثال، طبیعی است که شخصی هر روز از یک کار تحویل غذا سفارش دهد، در حالی که این امر برای فروش آنلاین لباس بسیار غیر معمول است.

 

از جنبه های دیگر نیز تغییرات زیادی وجود دارد، به عنوان مثال ممکن است فقط چند دقیقه طول بکشد تا مشتریان از یک سایت بلیط سفارش دهند، اما سفارش برنامه تاکسی می تواند تا زمانی که مسافر سوار شود طول بکشد.

 

برخلاف سایر ارائه دهندگان تقلب، ما برای هر یک از مشتریان خود یک مدل 100٪ شخصی سازی می کنیم، بنابراین پیش بینی ها براساس سیگنال های تقلب فقط در مشتری آنها انجام می شود و ایجاد پیش بینی های خاص تر و عملکرد بهتر را رقم می زند.

 

اگر اطلاعات کافی برای یادگیری مدل خود ندارید، چه می کنید؟

 

همیشه این احتمال وجود دارد که یک کسب و کار آنلاین اطلاعات کافی برای یادگیری سریع مدل خود را نداشته باشد. یک کسب و کار ممکن است حجم فروش بسیار کمی داشته باشد، عمدتا از طریق شرکتهای وابسته به فروش برسد، یا گاهی اوقات ورود به سیستم برای جمع آوری داده ها در قالب مناسب تنظیم نشده است.

 

اگر اطلاعات کافی برای یادگیری سریع مدل خود موجود نیست مشکلی ندارد. برای راه اندازی سریع کسب و کار شما، ما از یک مدل کلی بر اساس الگوهای تقلب قدیمی که قبلاً دیده ایم استفاده خواهیم کرد. ما هیچ یک از داده های مشتری را بین مشاغل به اشتراک نمی گذاریم، اما می توانیم دوباره از الگوریتم هایی که قبلاً یادگیری آن کامل شده است استفاده کنیم. این امر انتخاب آسان اجزای سازنده کتابخانه را برای ما آسان می کند و این بدان معناست که شما می توانید فقط در یک هفته استفاده از مدلی را برای کشف تقلب شروع کنید.

 

از آنجا که ما از این رویکرد مدل خرد استفاده می کنیم، می توانیم برای ایجاد یک مدل بزرگتر نیمه سفارشی ، مواردی را که برای کسب و کار فردی شما مناسب ترند انتخاب کنیم. به محض اینکه مدل روی داده های شما کار کند شروع به انطباق و تطابق با مشتری شما می کند، بنابراین موثرتر می شود. وقتی اطلاعات، بازپرداخت و بررسی دستی بیشتری به آن می دهیم مدل بهبود می یابد.

 

چرا استفاده از داده های قدیمی تر و نه فقط داده های جدید در یادگیری ماشین تحت نظارت مهم است؟

 

ما دریافتیم که در طی یک ماه تقریباً 30٪ تقلب ها تکرار می شوند، این بدان معناست که تا 70٪ تقلب ها در یک ماه هنوز ثبت نشده اند. یعنی اگر ما فقط از داده های جدید استفاده می کردیم، مدل نمی توانست تقلب پنهان (که هنوز یک تقلب مجدد ایجاد نکرده اند) را از بقیه مشتریان اصلی جدید تشخیص دهیم.

 

نتیجه گیری

یکی از ابزارهای مهمی که ما در دژینو ازآن استفاده می کنیم برای تشخیص تقلب کسب و کارها، سیستم یادگیری ماشین تحت نظارت(Supervised machine learning system) است. این نورش در کنار چندین روش دیگر ما باعث شده تا 95 درصد تقلب های کسب و کار ها را تشخیص دهیم.

ارسال نظر

enemad-logo