به كارگيری الگوريتم ژنتيك در بهينه سازي درختان تصميم گيري براي اعتبار سنجي مشتريان بانك ها (قسمت اول)

در این مقاله یک مدل مناسب اعتبارسنجی مشتریان بانک ها برای اعطای تسهیلات اعتباری متناسب با هر طبقه مبتنی بر الگوریتم ژنتیک ارایه می شود. الگوریتم های ژنتیک می توانند با انتخاب ویژگی های مناسب و ساخت درختان تصمیم گیری بهینه به اعتبار سنجی مشتریان کمک کنند. 

به كارگيری الگوريتم ژنتيك در بهينه سازي درختان تصميم گيري براي اعتبار سنجي مشتريان بانك ها (قسمت اول)
درختان تصمیم گیری به عنوان یکی از تکنیک های داده کاوی می توانند به اعتبار سنجی مشتریان بانکی بپردازند. مسئله اصلی ساخت درختان تصمیم گیری است که بتوانند به طور بهینه مشتریان را طبقه بندی کنند. 
در این مقاله یک مدل مناسب اعتبارسنجی مشتریان بانک ها برای اعطای تسهیلات اعتباری متناسب با هر طبقه مبتنی بر الگوریتم ژنتیک ارایه می شود. الگوریتم های ژنتیک می توانند با انتخاب ویژگی های مناسب و ساخت درختان تصمیم گیری بهینه به اعتبار سنجی مشتریان کمک کنند. 
در ساخت ایت مدل فرآیند توسعه در شناخت الگو و فرآیند CRISP برای اعتبار سنجی مشتریان به کار رفته است. دل طبقه بندی پیشنهادی مبتنی بر تکنیک های خوشه بندی، انتخاب ویژگی ها، درختان تصمیم گیری و الکوریتم ژنتیک است. این مدل به انتخاب و ترکیب بهترین درختان تصمیم گیری مبتنی بر معیارهای بهینگی و ساخت درخت تصمیم گیری نهایی برای اعتبارسنجی مشتریان می پردازد. 
نتایج نشان می ده که دقت طبقه بندی مدل طبقه بندی پیشنهادی به طور تقریبی از تمام مدل های درخت تصمیم گیری مقایسه شده در این مقاله بالاتر است. هم چنین تعداد برگ ها و اندازه درخت تصمیم گیری و در نتیجه پیچیدگی آن از همه کمتر است. 

مقدمه

بانک ها به منظور آگاهی از نیازمندی ها و رفتار مشتریان خود در اعطای تسهیلات اعتباری باید به شناسایی ویژگی های آن ها بپردازند. این امر منجر به کاهش ریسک های بانکی از جمله ریسک اعتباری می شود. پژوهش ها و کاربردهای متعددی در وزه اعتبارسنجی برای شناسایی مشتریان خوب و بد بانک ها صورت گرفته است. 
روش قضاوتی در اعتبارسنجی به دلیل خطا و زمان زیاد به تدریج جای خود را به روش های پارامتریک و ناپارامتریک داد. روش های پارامتریک مثل پروبیت، لوجیت، تحلیل تمایزی و رگرسیون لجستیک از ابتدای اعتبارسنجی مورد استفاده قرار گرفتند و سپس روش ناپارامتریک و داده کاری مثل درختان تصمیم گیری، شبکه های عصبی و سیستم های خبره به کار گرفته شدند.
درختان تصمیم گیری یکی از تکنیک های داده کاوی با قابلیت فهم بالا و سرعت مناسب در یادگیری الگو، می توانند برای طبقه بندی مشتریان در اعتبارسنجی مفید باشند.
امروزه مسئله اعتبارسنجی به یکی از مسایل مهم مدیران و کارشناسان بانکی تبدیل شده است. در یک بانک، می توان درختان تصمیم گیری متنوعی را برای طبقه بندی و اعتبار سنجی مشتریان ایجاد نمود. از ویژگی های مدل پیشنهادی می توان به موارد زیر اشاره نمود:
افزایش دقت در ساختار و محتوای درختان تصمیم گیری توسط الگوریتم ژنتیک، بهبود درختان تصمیم گیری برای فهم آسان مدل طبقه بندی مشتریان، جلوگیری از اتخاذ تصمیم های احتمالی غلط کارشناسان بانکی در اعتبارسنجی، کاهش نیاز به تحلیل های پرهزینه زمان بر در طبقه بندی مشتریان، انتخاب بهینه ویژگی های اعتبارسنجی مشتریان و در نهایت رضایت مندی آن ها در ارایه تسهیلات اعتباری متناسب با هر طبقه. 
استفاده از الگوریتم های ژنتیک در بهینه سازی درختان تصمیم گیری و انتخاب ویژگی ها علاوه بر حل مسائل مطرح شده این مزیت را نیز دارد: الگوریتم ژنتیک در یک زمان با مجموعه ای از راه حل ها کار می کند ولی الگوریتم های استنتاج حریصانه راه حل جزیی را در هر مرحله بررسی می کنند. 
مسئله اصلی ساخت درختان تصمیم گیری است که بتوانند به طور بهینه به طبقه بندی مشتریان خوب و بد بانک ها بپردازند. به نظر می رسد استفاده از تکنیک های بهینه سازی مثل الگوریتم های ژنتیک در انتخاب ویژگی ها و ایجاد درختان تصمیم بهینه برای اعتبارسنجی مشتریان بانک ها مفید است.
الگوریتم های انتخاب ویژگی ممکن است در بهینه محلی قرار گیرند و از طرف دیگر تعامل بین ویژگی ها را در نظر نمی گیرند و فرض می کنند، روابط بین ویژگی ها خطی بوده و ویژگی ها مستقل از هم می باشند. هم چنین الگوریتم ها تنها از برخی معیارها برای انتخاب ویژگی استفاده می کنند. 
الگوریتم های درختان تصمیم گیری در فرایند رشد درخت حریص هستند. در برخی از الگوریتم ها حساسیت بیشتری نسبت به برخی از ویژگی ها برای تفکیک شدن وجود دارد. 
آن ها درختانی با اندازه بزرگ  پیچیده تولید می کنند که در نتیجه دارای دقت کم در طبقه بندی در مجموعه  داده تست و ارزیابی و تناسب بیش از حد است. درختان تصمیم گیری نسبت به داده های زیاد در ویژگی ها تمایل نشان می دهند و در قسمت های پایینی درخت تمایلی به افزایش دقت و کاهش تناسب بیش از حد ندارند. 
این الگوریتم ها در فرایند خود تنها از برخی معیارها و توابع در ساخت درخت تصمیم گیری استفاده می کنند. 
در این مقاله مدلی مناسب برای اعتبارسنجی مشتریان بانک ها مانند بانک ملت برای اعطای تسهیلات اعتباری متناسب با هر طبقه مبتنی بر الگوریتم ژنتیک ارایه می شود.

پیشینه پژوهش

پژوهش های متنوعی روی کاربرد روش های پارامتریک و ناپارامتریک در اعتبارسنجی صورت گرفته است. نگاره های 2 و 3 به ترتیب به کار گیری الگوریتم های ژنتیک در انتخاب ویژگی ها و ساخت درختان تصمیم گیری اشاره دارد. این پژوهش ها مربوط به سایر حوزه های علوم و کسب و کار است. از نتایج آن ها می توان در اعتبارسنجی مشتریان بانک ها استفاده نمود. 
نقاط قوت مدل ارائه شده، در مقایسه با برخی مدل های مشابه داخلی و خارجی و به طور موردی شامل این موارد است:
  1. به کارگیری روش های آماده سازی و پیش پردازش داده ها
  2. استفاده از خوشه بندی در پیش پردازش داده ها به منظور افزایش احتمالی دقت و کاهش پیچیدگی طبقه بندی مشتریان
  3. تلفیق چندین الگوریتم انتخاب ویژگی مبتنی بر رویکردهای فیلتر، Wrapper و طرح جاسازی شده برای افزایش انعطاف پذیری و دقت طبقه بندی در ساخت درختان تصمیم گیری به جای استفاده از یک طبقه کننده
  4. تولید و مقایسه درختان تصمیم گیری متنوع و استفاده از آن ها در شرایط مختلف مطالعه موردی بر خلاف پژوهش های دیگر که تنها از یک نوع الگوریتم یا مدل در مطالعه ای خاص استفاده شد
  5. بهینه سازی درختان تصمیم گیری توسط الگوریتم ژنتیک بر خلاف تحقیقات قبل که تنها مدل طبقه بندی را ساخته و سعی در بهبود آن نداشتند
  6. استفاده از معیار پیچیدگی در بهینگی تصمیم گیری علاوه بر معیار دقت طبقه بندی
  7. به کارگیری روش های هوش مصنوعی و شناخت الگو در اعتبارسنجی مشتریان و انتخاب ویژگی های اعتبارسنجی
  8. وجود نگرش فرآیندی شناخت الگو و داده کاوی در اعتبارسنجی مشتریان بانک بر خلاف برخی پژوهش های دیگر درباره این حوزه 

ویژگی های اعتباری مشتریان در مدل

مجموع ویژگی های اعتباری مشتریان دریافت کننده تسهیلات شامل موارد زیر است. ویژگی "کد نوع رکورد" ویژگی هدف است. 
تاریخ تنظیم قرارداد (اسمی)، کد سرپرستی (اسمی)، شماره شعبه (اسمی)، شماره درخواست (اسمی)، نوع متقاضی (اسمی)، کد محلی (اسمی)، نام مشتری (اسمی)، شماره شناسنامه (اسمی)، تاریخ تولد (اسمی)، کد محل شناسنامه (اسمی)، کد حوزه (اسمی)، کد نوع درخواست (اسمی)، تاریخ اولین سر رسید (اسمی)، تاریخ آخرین سررسید (اسمی)، تعداد اقساط (اسمی)، درصد سهم بانک (عددی)، مبلغ قرارداد (عددی)، مبلغ استفاد شده (عددی)، چگونگی استفاده از تسهیلات (اسمی)، مبلغ استفاده شده (عددی)، کد نوع وثیقه (اسمی)، ارزش وثیقه (عددی)، آخرین مانده بدهی (عددی)، کد نوع بخش (اسمی)، رشته فعالیت (اسمی)، کد نوع قرارداد با بانک (اسمی)، هدف از دریافت تسهیلات (اسمی)، محل مصرف تسهیلات (اسمی)، مورد مصرف تسهیلات (اسمی)، نوع رکورد تکلیفی یا غیر تکلیفی (اسمی)، تاریخ ایاد رکورد (اسمی)، تاریخ (ماه و سال)، نام و نام خانوادگی بر عکس شده (اسمی)، کد اعتباری (اسمی)، کد نوع رکورد (اسمی)، کد سرفصل حساب (اسمی) و تاریخ گردش (اسمی). 

تعریف عملیاتی مفاهیم مدل

درختان تصمیم گیری: درختان تصمیم شامل اجزایی است:
  1. گره ها که با نام های مشخصات یا ویژگی های اشیا برچسب گذاری شده اند
  2. برگ ها که معادل طبقات مختلف هستند.
یک درخت تصمیم شامل چند گره درونی و چند برگ است. همه گره های درونی شامل دو یا چند گره فرزند هستند. هر تصمیم در یک گره قرار دارد. گره آخر خروجی نهایی را نشان می دهد که در درخت تصمیم گیری دارای مقدار گسسته است. 
بهینگی درختان تصمیم گیری: در بررسی بهینگی درختان تصمیم گیری سه عامل در نظر گرفته می شود
  1. نرخ نمونه های طبقه بندی شده صحیح (درصد مشاهده های درست طبقه بندی شده)
  2. پیچیدگی درخت تصمیم گیری که شامل تعداد برگ ها و اندازه درخت است
  3. تعداد ویژگی های پیشگو موجود در درخت تصمیم گیری
اندازه درخت: به تعداد شاخه ها تا رسیدن به برگ در درخت تصمیم گیری ارتباط دارد و برابر با مجموع تعداد برگ ها و گره ها در یک درخت تصمیم گیری است. 
طبقه مشتریان در ویژگی هدف: شامل سه طبقه مشتریان جاری، سررسید گذشته و مطالبات معوقه است. مشتریان جاری، مشتریانی هستند که دچار رفتار عدم بازپرداخت تسهیلات دریافتی نشده اند. مشتریان سر رسید گذشته مشتریانی هستند از مدت بازپرداخت تسهیلات اعتباری آن ها سه ماه گذشته است. مشتریان مطالبات معوقه مشتریانی هستند که از مدت بازپرداخت آن ها بیش از شش ماه گذشته باشد.

مدل پیشنهادی

نمودار مدل پیشنهادی را نشان می دهد که به فرآیند ساخت و آزمون درخت تصمیم گیری در اعتبار سنجی مشتریان حقیقی و حقوقی بانک اشاره دارد. پس از این که سه مرحله اول از فرآیند توسعه در شناخت الگو انجام شد، پیش پردازش داده ها صورت گرفت. می توان روش خوشه بندی را برای پیش پردازش داده ها به کار برد. 
در انتخاب ویژگی ها، روش جستجو، و برمبنای الگوریتم ژنتیک است. الگوریتم های انتخاب ویژگی مبتنی بر رویکرد فیلتر به ارزیابی موارد زیر در مجموعه ویژگی ها می پردازند: همبستگی بین ویژگی ها با هم و با ویژگی هدف، سازگاری زیر مجموعه ویژگی ها با مقادیر ویژگی هدف، دقت طبقه کننده C4.5.
الگوریتم با تابع ارزیاب Wrapper با طبقه بندی C4.5، مبتنی بر رویکرد Wrapper است. انتخاب ویژگی مبتنی بر درخت تصمیم گیری ژنتیکی: به علت این که این الگوریتم از یک الگوریتم طبقه بندی هم چون درخت تصمیم گیری ژنتیکی برای انتخاب ویژگی های مناسب استفاده می کند، مبتنی بر رویکرد طرح جاسازی شده در انتخاب ویژگی ها است. الگوریتم درخت تصمیم گیری ژنتیی برگرفته از است. 
در انتخاب ویژگی مبتنی بر رویکردهای فیلتر و Wrapper توسط الگوریتم ژنتیک از شیوه کدگذاری صفر و یک برای کدگذاری کروموزوم ها (مجموعه ویژگی ها) استفاده می شود. عدد یک و صفر به ترتیب نشان دهنده حضور و عدم حضور یک ویژگی در مجموعه ویژگی ها است. 
یک مجموعه ای از کروموزوم ها به صورت تصادفی می شوند. بعد از این مرحله نوبت به ارزیابی تک تک کروموزوم ها توسط توابع ارزیاب می رسد. کروموزوم های برتر مبتنی بر روش چرخ گردان برگرفته از گلدبرگ انتخاب می شوند و برای تولید مجدد، عملیات تقاطع و جهش به طور تصادفی بر روی آن ها صورت می گیرد. 
ابتدا یک عدد احتمالی تعیین می شود. سپس الگوریتم، یک عددی تصادفی را به هر دو کروموزوم تخصیص می دهد. در صورتی که این عدد از عدد احتمالی از قبل تعیین شده بیشتر باشد، عمل تقاطع تک نقطه ای صفر و یک، برگرفته از گلدبرگ صورت می گیرد. سپس عمل جهش تک نقطه ای صفر و یک بر روی کروموزوم های جدید اعمال می شود. 
در ادامه کروموزوم های جدید ایجاد شده، دوباره به وسیله توابع ارزیاب، ارزیابی شده و برترین آن ها جایگزین کروموزوم های صعیف تر از نسل قبل می شوند. نوع عملگر جایگزینی بر پایه شایستگی است. شرط خاتمه این الگوریتم رسیدن به تعداد معینی تکرار الگوریتم یا ماکزیمم تعداد نسل ها است. 


منبع: نشریه مدیریت فناوری اطلاعات، دوره 2، شماره 4، بهار و تابستان 1389، از صفحه 23 تا 38
https://www.sid.ir/fa/journal/ViewPaper.aspx?ID=114990

 
كلمات كليدی: اعتبارسنجی، تعریف اعتبارسنجی، اعتبار سنجی مشتریان، اعتبارسنجی مشتریان، اعتبار سنجی چک، اعتبار بانکی افراد، سایت اعتبارسنجی


نظر شما
نام
پست الكترونيک
وب سایت
متنی که در تصویر می بینید عینا تایپ نمایید
نظر
مقالات بیشتر
مقالات مرتبط
.
.
2019© کلیه حقوق مادی و معنوی این سایت متعلق به شرکت توسعه زیر ساخت های فناوری اطلاعات سیگما میباشد.