این پایان نامه در مورد داده کاوی و با عنوان استفاده از داده کاوی برای ضد پولشویی و کشف تقلب می باشد. هدف از این پایان نامه شناسایی جرایم پولشویی در بانکها با استفاده داده کاوی می باشد. 

 

 

داده‌کاوی عبارت است از تحلیل داده‌‌ها به‌منظور کشف روابطِ از قبل نامعلومی که اطلاعات مفیدی ارائه می‌کنند. کشف تقلب به یکی از جا افتاده‌ترین کاربرد‌های داده‌کاوی چه در صنعت و چه در دولت تبدیل شده است. هر چند بسته‌‌های نرم‌افزاری تجاری مختلفی با محیط تعاملی آسان برای کاربران، در حال حاضر در دسترس هستند که انجام کار‌های پیچیده داده‌کاوی را به‌ظاهر آسان می‌کنند و الگوریتم‌های داده‌کاوی بسیاری برای کشف تقلب مورد استفاده قرار گرفته‌اند، اما کاربرد آن‌ها، همچنان از چارچوب سنتی داده‌کاوی یعنی انتخاب ویژگی، نمایندگی، گرداوری و مدیریت داده‌‌ها، پیش‌پردازش، داده‌کاوی، پس‌پردازش و ارزیابی عملکرد پیروی می‌کند.

 

 

 

پرکاربردترین روش‌‌های داده‌کاوي برای کشف تقلب‌‌های مالی عبارتند از مدل‌‌های رگرسیون لجستیک (رایج‌ترین)، شبکه‌‌های عصبی، شبکه‌ استنباط بیزین و درخت تصمیم که همه آن‌‌ها راه‌حل‌‌های قابل توجهي را برای مشکلات ذاتی در کشف و طبقه‌بندی داده‌‌های تقلبي ارائه می‌کنند [17]

 

 

 

 

داده‌کاوی اين توان را دارد که سناریو‌های جدیدی برای کشف نمونه‌‌های پولشویی ارائه دهد.داده‌کاوی به عنوان فرايندي خودکار برای استخراج اطلاعات و الگو‌های جالب توجه، بارز، ضمنی، از قبل ناشناخته و بالقوه مفید از انبار داده‌‌های حجیم، شناخته می شود. . هنگامی که الگوریتم‌‌ها و تکنیک‌‌های داده‌کاوی روی چنین تراکنش‌‌هایی اعمال می شوند، الگو‌های پنهان از جریان وجوه را پرده برداری می‌کنند [21]همراه شدن اطلاعات مشتری و دانش فرد خبره منجر به آن می‌گردد که معاملات مشکوک به طور همروند با زمان اتفاق افتادنشان شناسائی شوند.سیستم ضد پولشويي قابلیت اجرا با الگوریتم‌‌های نظارت شده  و بدون نظارت را به طور هم‌زمان دارد.در این سیستم علاوه بر به کارگیری الگوریتم‌‌های رایج در داده‌کاوی، شاخص‌‌هایی محاسبه می‌شوند که می‌توانند بخوبی ملاکی برای میزان مشکوک بودن عملکرد یک مشتری باشند و بر اساس آن شاخص‌‌ها، داده‌‌های پرت (خارج از محدوده ) تفکیک و شناسائی شوند.

 

 

 

 

 

 

 

 

 

فهرست مطالب


1     فصل اول  کلیات تحقیق    1
1‌.1‌    تعریف مسأله و بیان سئوال‌‌هاي اصلی تحقیق    2
1‌.2‌    اهمیت و ضرورت پژوهش    3
1‌.3‌    اهداف پژوهش    4
1‌.4‌    روش پژوهش    5
1‌.5‌    جامعۀ تحقیق    5

 


2    فصل دوم مطالعه پولشویی، داده‌کاوی و ارتباط این دو دیباچه    8
2‌.1‌    پولشویی و بررسی ابعاد آن    10
2‌.1‌.1‌    مفهوم پولشویی    10
2‌.1‌.2‌    تاریخچه و خاستگاه پولشویی    11
2‌.1‌.3‌    ایران و ریسک پولشويي    13
2‌.1‌.4‌    انواع پولشويي    14
2‌.1‌.5‌    مراحل پولشويي    14
2‌.1‌.6‌    روش‌‌های پولشويي    16

2‌.1‌.7‌    موارد مشکوک به پولشویی در بانک‌ها و مؤسسات اعتباری    19

2‌.1‌.8‌    ضرورت بهره گیری از راه حل‌‌های ضد پولشويي    24
2‌.1‌.9‌    روش‌های مبارزه با پولشویی    25
2‌.1‌.10‌    وظایف و اصول الزامی برای بانک‌ها و مؤسسات اعتباری در مبارزه با پول‌شویی    33
2‌.1‌.11‌    انواع گزارش‌‌های مفید جهت شناسایی موارد مشکوک    42
2‌.2‌    داده‌کاوی    46
2‌.2‌.1‌    تاریخچه داده‌کاوی    46
2‌.2‌.2‌    چارچوبی کلی برای الگوریتم‌های داده‌کاوی    48
2‌.2‌.3‌    کاربرد داده‌کاوی در کشف تقلبات مالی    51

2‌.2‌.4‌    پرکاربردترین روش‌های داده‌کاوي برای کشف تقلب‌های مالی    58

2‌.2‌.5‌    رویکرد داده‌کاوی در حل مسائل پولشویی    60
2‌.2‌.6‌    برخی تحقیقات مرتبط    67
2‌.3‌    جمع بندی    71

 

 

3    فصل سوم ارائه طرح سیستم ضد پولشویی با داده‌کاوی 75

3‌.1‌    روش‌شناسی تحقیق    76
3‌.1‌.1‌    روش تحقیق    76
3‌.2‌    شیوه‌ها و ابزارهای جمع‌آوری داده‌ها    78
3‌.2‌.1‌    بررسی داده‌‌های قابل دریافت    78
3‌.2‌.2‌    بررسی سایر اطلاعات موجود در بانك    79
3‌.2‌.3‌    بررسی محدودیت‌‌های بانك در ارائه اطلاعات    79
3‌.2‌.4‌    بررسی محدودیت‌های بانك اطلاعاتی    79
3.2.5    مشخص شدن داده‌‌های مورد نیاز برای فاز‌های مختلف پروژه .    80
3.2.6    ارائه فرمت دریافت اطلاعات از بانك اطلاعاتی .    80
3.2.7    حجم ، زمان و مکان مورد نیاز جهت ارائه اطلاعات .    81
3‌.2‌.8‌    آمایش داده‌‌ها    81
3.3    جامعه نظری و روش نمونه‌گیری    82
3‌.4‌    مفروضات تحقیق    83
3‌.5‌    شیوه تجزیه و تحلیل داده‌ها    84
3‌.5‌.1‌    مرور پیشینه تحقیق    84
3‌.5‌.2‌    نظرخواهی از خبرگان    85
3‌.5‌.3‌    بررسی اسناد و مدارک آرشیوی    94
3‌.5‌.4‌    طراحی مدل ضد پولشویی بر اساس داده‌کاوی    98
3‌.5‌.5‌    جمع بندی    106

 

 

4    فصل چهارم اجراي تحقیق دیباچه    107
4‌.1‌    جزئیات پیاده‌سازی مدل    108
4‌.1‌.1‌    آمایش داده‌‌ها    108
4‌.1‌.2‌    دسته بندی اطلاعات براساس شاخص‌های خطی و جدا نمودن بخش مشکوک    109
4‌.1‌.3‌    فیلترینگ و جداسازی اطلاعات مناسب    112
4‌.1‌.4‌    خوشه بندی    116
4‌.1‌.5‌    اجرای الگوریتم نظارت‌شده    127
4‌.1‌.6‌    جمع‌آوری نتایج    129
4‌.2‌    ارزیابی    129
4‌.2‌.1‌    نحوه تست    130
4‌.2‌.2‌    محاسبه معیار‌های Precision، Recall، Specificity و Sensitivity    131
4‌.3‌    نتیجه گیری    133

 

 

5    فصل پنجم جمع‌بندی و نتیجه‌گیری دیباچه    134
5‌.1‌    نتیجه گیری    135
5‌.2‌    محدودیت‌های پژوهش    137
5‌.3‌    پیشنهاد برای پژوهش‌‌های آینده    138
6    مراجع    140

 


فهرست شکل‌ها
شکل ‏2 1 مدل CRISP-DM    34

شکل ‏2 2  روش‌های استفاده شده برای کشف انواع تقلبات مالی    36

شکل ‏3 1 فلوچارت کشف موارد پولشوئی با داده‌کاوی    72
شکل ‏4 1  توزیع شاخص MLI    79
شکل ‏4 2  توزیع شاخص MLISQR    79
شکل ‏4 3  نمودار واریز نقدی مشتریان    80
شکل ‏4 4  مراحل ایجاد شاخص MLISQR    81
شکل ‏4 5  جدول داده‌‌های تفکیك شده بر اساس شاخص پولشویی(MLISQR)    82
شکل ‏4 6  هیستوگرام مجموع واریز در خوشه‌بندی ای‌ام    84
شکل ‏4 7  هیستوگرام مجموع برداشت در خوشه بندی ای‌ام    84
شکل ‏4 8  هیستوگرام تعداد واریز در خوشه بندی ای‌ام    85
شکل ‏4 9  هیستوگرام تعداد برداشت در خوشه بندی ای‌ام    85
شکل ‏4 10  خوشه‌بندی توسط کامینز، کوهنن، گروه متناظر    86
شکل ‏4 11  خوشه بندی گروه متناظر مدل اول    87
شکل ‏4 12  خوشه بندی گروه متناظر مدل دوم    88
شکل ‏4 13  خوشه‌بندی گروه متناظر مدل سوم    89
شکل ‏4 14  جدا کردن خوشه اکثریت    90
شکل ‏4 15  خوشه‌بندی توسط کامینز و کوهنن    91
شکل ‏4 16  اجرای الگوریتم‌‌های نظارت‌شده    93

 

فهرست جداول
جدول ‏4 1  معیار‌های ارزیابی    95
جدول ‏4 2  محاسبه معیار‌های ارزیابی برای شبکه عصبی    95