مدل رتبه بندی اعتباری هیبریدی با استفاده از الگوریتم های ژنتیک و سیستم های خبره فازی (مطالعه موردی: موسسه مالی و اعتباری قوامین)
سیستم های خبره می توانند به ساخت مدل های
رتبه بندی اعتباری مشتریان بانک ها کمک کنند. در اینجا، انتخاب ویژگی های مهم در رتبه بندی اعتباری اهمیت دارد.
همچنین ممکن است مقائیر ویژگی ها، به صورت فازی بیان شوند. مسئله این است، چگونه می توان به کمک الگوریتم ژنتیک، انتخاب ویژگی ها را بهبود بخشید، به گونه ای که این ویژگی ها به منزله ورود در سیستم خبره فازی مورد استفاده قرار گیرند.
این نوشتار به ارائه مدل رتبه بندی اعتباری هیبریدی با ترکیب انتخاب ویژگی ها، مبتنی بر الگوریتم ژنتیک و سیستم خبره فازی می پردازد. پژوهشی که در این مورد انجام گرفت، از نظر نتایج، کاربردی و از هدف، توصیفی از نوع مطالعه مورد است.
برای آموزش و آزمون مدل، از مجموعه داده های
رتبه بندی اعتباری موسسه مالی و اعتباری قوامین استفاده شده است. پس از پیش پردازش داده ها، به کمک الگوریتم ژنتیک ویژگی ها انتخاب شدند و از طریق مصاحبه با فردی خبره و به کارگیری منطق فازی، دامنه تغییرات ویژگی های منتخب تعیین شده و سپس قوانین فازی رتبه بندی اعتباری ایجاد شدند.
برای تحلیل داده ها از ابزار وکا و ماژول سیستم استنتاج فازی در نرم افزار متلب استفاده شده است. نتایج نشان می دهد، دقت طبقه بندی مدل پیشنهادی نسبت به سایر روش های مقایسه شده در این مقاله بیشتر است. قوانین فازی ایجاد شده این مدل را می توان برای
رتبه بندی اعتباری مشتریان بانکی به کار برد.
مقدمه
بانک برای شناسایی مشتریان خود در اعطای تسهیلات اعتباری، نیاز اساسی به شناسایی و رتبه بندی اعتباری آن ها دارد. در حال حاضر مدل ها و روش های مختلفی برای رتبه بندی اعتباری مشتریان بانک وجود دارد.
هدف اصلی آنها، طبقه بندی مشتریان به طبقه های مشتریان خوش حساب و مشتریان بد حساب است، بنابراین رتبه بندی اعتباری، در دامنه وسیع مسائل طبقه بندی قرار می گیرد.
به طور کلی روش های رتبه بندی اعتباری را می توان به دو گروه عمده روش های پارامتریک (مانند پروبیت، لوجیت، تحلیل تمایزی و رگرسیون لجستیک) و روش های ناپارامتریک و داده کاوی (مانند درختان تصمیم گیری، شبکه های عصبی و سیستم های خبره) تقسیم بندی کرد.
برخی از مدل های ترکیبی در
اعتبارسنجی مورد استفاده قرار گرفته اند، مثل مدل عصبی فازی، مدل فازی ماشین بردار پشتیبان و مدل ترکیبی شبکه های عصبی.
روش های آماری قدیمی، مانند تحلیل تمایزی، رگرسیون لجستیک، تحلیل پروبیت و لوجیت، از ابتدای ظهور رتبه بندی اعتباری مورد استفاده قرار گرفتند. سپس رویکردها و روش های متنوع دیگری چون الگوریتم های فازی، الگوریتم های ژنتیک، شبکه های عصبی و سیستم های خبره ظهور کردند.
یکی از مشکلات استفاده از روش های قدیمی آماری این است که برای ورودی هایی با ابعاد بزرگ مناسب نبوده و در اغلب آن ها فرض بر این است که رابطه خطی میان متغیرها وجود دارد، در حالی که معمولا این رابطه غیر خطی است.
در این پژوهش از مدل ناپارامتریک و هیبریدی سیستم خبره فازی و الگوریتم انتخاب ویژگی ها مبتنی بر الگوریتم ژنتیک، برای ساخت مدل پیشنهادی رتبه بندی اعتباری مشتریان بانکی استفاده می شود.
سیستم خبره می تواند به بانک ها در مورد تصمیم گیری اعطای تسهیلات اعتباری به مشتریان کمک کند و یک سیستم پشتیبان تصمیم باشد.
در اینجا نیز، سیستم خبره رتبه بندی اعتباری به کارشناسان و مدیران بانکی کمک می کند تا در خصوص اعطای تسهیلات اعتباری به متقاضیان، تصمیم گیری کنند. همچنین با استفاده از این سیستم، می توان به نگهداری دانش فرد خبره در بانک ها کمک کرد.
در مقاله ای از روش های انتخاب ویژگی ها مبتنی بر الگوریتم ژنتیک برای انتخاب ویژگی های مهم و ساخت درختار تصمیم گیری در رتبه بندی اعتباری مشتریان بانک ها استفاده شد.
مدل پیشنهادی این مقاله، از یک رویکرد هیبریدی الگوریتم های انتخاب ویژگی ها، خوشه بندی، طبقه بندی و الگوریتم ژنتیک بهره می برد.
مسئله اصلی این مقاله، ساخت یک سیستم خبره است که بتواند به نحو مناسبی، رتبه بندی اعتباری مشتریان خوب و بد بانک ها را انجام دهد. اما چگونه می توان با استفاده از الگوریتم ژنتیک و انتخاب ویژگی ها، به ساخت سیستم خبره فازی برای رتبه بندی اعتباری مشتریان بانک ها و موسسه های مالی پرداخت؟
نظرات کارشناسان و خبرگان تسهیلات اعتباری بانک ها، ممکن است ماهیت دقیقی نداشته باشد. در این خصوص می توان برای استنتاج قوانین در یک سیستم خبره رتبه بندی اعتباری، از منطق فازی بهره جست. پس مدل پیشنهادی در این مقاله به ساخت سیستم خبره رتبه بندی اعتباری فازی می پردازد.
معمولا انبوهی از اطلاعات تکراری و ویژگی های اعتباری مشتریان در پایگاه های داده انباشته می شود که ممکن است، موجب کاهش دقت طبقه بندی و افزایش پیچیدگی مدل رتبه بندی اعتباری می شود.
در این خصوص می توان با استفاده از روش های انتخاب ویژگی، به تعیین ویژگی های مهم در رتبه بندی اعتباری پرداخت. به کارگیری الگوریتم های انتخاب ویژگی در مدل های طبقه بندی دارای فواید زیر است:
- کاهش هزینه استخراج ویژگی ها
- بهبود دقت طبقه بندی
- کاهش زمان یادگیری الگوریتم طبقه بندی
- کاهش تعداد مثال های مورد نیاز برای یادگیری در مدل طبقه بندی
- کاهش تعداد ویژگی ها برای افزایش سرعت محاسبات
در طراحی سیستم خبره فازی رتبه بندی اعتباری، می توان از الگوریتم انتخاب ویژگی ها برای کاهش پیچیدگی سیستم و افزایش دقت طبقه بندی مشتریان بانکی بهره برد. از سوی دیگر، الگوریتم های انتخاب ویژگی فرض می کنند روابط بین ویژگی ها خطی بود و از هم مستقل هستند.
بنابراین تعامل وابستگی بین ویژگی ها را در محاسبات خود در نظر نمی گیرند. همچنین این الگوریتم ها در هنگام انجام فرایند جستجو انجام فرایند جستجو، ممکن است در بهینه محلی قرار گیرند.
در این الگوریتم ها فقط از برخی معیارها برای انتخاب ویژگی استفاده می شود. الگوریتم های ژنتیک، به دلیل قابلیتشان برای رسیدن به راه حل های دقیق یا تخمینی در نواحی جستجوی بسیار بزرگ دنیا واقعی، در مدت زمان مناسب، از پرکاربردترین روش ها برای انتخاب ویژگی هستند.
همچنین به دلیل آن که مسئله انتخاب ویژگی از نوع مسائل سخت است، می توان از الگوریتم ژنتیک در انتخاب ویژگی های استفاده کرد. الگوریتم ژنتیک هنگام انتخاب ویژگی ها، چند متغیر را همزمان مورد بررسی قرار می دهد. چنانچه ویژگی ها تک به تک ارزیابی شوند، تعامل بین آن ها در نظر گرفته نمی شوند.
در این مقاله به ارائه یک مدل پیشنهادی مناسب رتبه بندی اعتباری مشتریان بانک ها و موسسه های مالی با استفاده از رویکرد هیبریدی انتخاب ویژگی ها مبتنی بر الگوریتم ژنتیک سیستم خبره فازی، پرداخته می شود.
پیشینه پژوهش
پژوهش های متنوعی در خصوص به کارگیری روش های آماری، غیر پارامتریک و هوش مصنوعی برای پشتیبانی از فرایندهای رتبه بندی اعتباری بانک ها انجام گرفته است. برای نمونه می توان به کاربرد شبکه های رگرسیون لجستیک، شبکه عصبی، درخت تصمیم گیری، تحلیل تمایزی، ماشین بردار پشتیبان و طبقه بندی های ترکیبی اشاره کرد.
همچنین، در برخی پژوهش ها از سیستم های خبره برای رتبه بندی اعتباری مشتریان بانکی استفاده شده است. در مقاله کومارا در سال 2006، از یک سیستم خبره برای سنجش اعتبار در موسسه های مالی و صادر کردن پذیره نویسی استفاده شده است.
پی.سینها و ژاو در سال 2008، به منظور بهبود طبقه بندی برای وام دادن با روش های داده کاوی، به ترکیب سیستم خبره با این روش ها پرداختند و دانش خبره را با این سیستم دریافت کرده و به منزله ورودی روش های داده کاوی مورد استفاده قرار دادند. در مقاله دیوید و فرانک (2009) به مقایسه ماشین یادگیری و سیستم خبره در امر طبقه بندی و مسائل رگرسیونی پرداخته شده است.
پژوهش های متعددی به کاربرد روش های الگوریتم ژنتیک در انتخاب ویژگی ها گرداخته اند (سایر حوزه های علوم و کسب و کار) که از نتایج آن ها می توان در این مقاله برای ساخت مدل رتبه بندی اعتباری مشتریان بانکی استفاده کرد.
از جمله آن ها میتوان به ترکیب طبقه کننده ها مبتنی بر الگوریتم ژنتیک، به کارگیری الگوریتم های ژنتیک برای انتخاب متغیرهای ورودی و در ترکیب روش هاس انتخاب ویژگی اشاره کرد.
یکی از رویکردها برای بهبود عملکرد طبقه بندی، به کارگیری مدل های هیبریدی به جای استفاده از طبقه کننده های مجزا است که به تازگی در رتبه بندی اعتباری مشتریان بانکی مورد توجه پژوهشگران واقع شده است. در مدل های هیبریدی به جای استفاده از یک طبقه کننده، از روش های مختلف پارامتریک و ناپارامتریک طبقه بندی و خوشه بندی برای بهبود عملکرد طبقه بندی استفاده می شود.
برخی از این مدل ها در رتبه بندی اعتباری عبارتند از:
روش ماشین بردار پستیبان هیبریدی، مدل هیبریدی رگرسیون لجستیک و شبکه های عصبی، مدل هیبریدی روش های خوشه بندی و طبقه بندی.
برخی از موارد برجسته مدل پیشنهادی این مقاله، در مقایسه با مدل های رتبه بندی اعتباری دیگر كه به آنها اشاره شد، عبارتند از:
- استفاده از روش های آماده سازی و پیش پردازش داده ها برای ساخت مدل رتبه بندی اعتباری پیشنهادی
- به كارگیری روش انتخاب ویژگی مبتنی بر الگوریتم ژنتیك، در انتخاب ویژگی های مهم رتبه بندی اعتباری برای طراحی و ساخت سیستم خبره رتبه بندی اعتباری
- استفاده از منطق فازی و الگوریتم ژنتیك برای انتخاب ویژگی های مناسب رتبه بندی اعتباری مشتریان بانكی
- به كارگیری رویكرد هیبریدی (تركیب الگوریتم های انتخاب ویژگی مبتنی بر الگوریتم ژنتیك، منطق فازی و سیستم خبره، در ساخت مدل رتبه بندی اعتباری مشتریان بانكی) به جای استفاده از یك طبقه كننده
- استفاده از منطق فازی در بیان مقادیر ویژگی های رتبه بندی اعتباری برای ساخت قوانین سنجش اعتبار مشتریان در سیستم خبره مدل پیشنهادی.
در برخی از مطالعات و مقاله ها به استفاده از الگوریتم های انتخاب ویژگی در ساخت مدل های طبقه بندی اشاره شده است، اما پس از جستجو و بررسی مطالعات، درخصوص استفاده از روش های انتخاب ویژگی مبتنی بر الگوریتم ژنتیك در طراحی و ساخت سیستم خبره فازی رتبه بندی اعتباری، مطالعه ای دیده نشد.
روش پژوهش
پژوهش پیش رو، از نظر نتایج، کاربردی و از نظر هدف، توصیفی و او نوع مطالعه موردی است.
برای جمع آوری اطلاعات، از داده های موجود در بانك اطلاعاتی موسسه مالی و اعتباری قوامین و پرونده های اعتباری مشتریان استفاده شد.
پایگاه داده موجود، شامل 1133 ركورد و 21 ویژگی است (با احتساب ویژگی هدف، یعنی معوقات). مجموعه داده ها که برای ساخت مدل رتبه بندی اعتباری در این پژوهش به کار می رود، مشتریان حقیقی سال های 1388 و 1389 شهر تهران هستند که از بانک تقاضای وام کرده اند.
متغیرهای مستقل این مجموعه، شامل کد حوزه (اسمی)، کد شعبه (اسمی)، شماره درخواست (اسمی)، نوع وام (اسمی)، کد نوع درخواست (اسمی)، جنسیت (اسمی)، شماره شناسنامه (اسمی)، تاریخ تولد (اسمی)، نرخ وام (عددی)، مقدار وام (عددی)، تعداد اقساط (عددی)، تاریخ درخواست وام (اسمی)، تاریخ واریز وام (اسمی)، تاریخ اولین قسط (اسمی)، تاریخ آخرین قسط (اسمی) و مانده بدهی (عددی)، سابقه کار (عددی)، درآمد (عددی)، وضعیت مسکن (اسمی)، میانگین موجودی حساب در سه ماهه اخیر (اسمی) و متغیر وابسته آن معوقات (اسمی)، است.
اگر تعداد وام های معوق یك مشتری سه وام یا بیشتر از آن باشد، فرد جزء مشتریان بد حساب و اگر كمتر از سه باشد، از دسته مشتریان خو ش حساب است. برای آماده سازی داده ها از روش های زیر استفاده شد:
- حذف ویژگی هایی که دارای مقادیر یکتا هستند
- حذف برخی ویژگی ها، به دلیل عدم ارائه دانش
- حذف تراکنش هایی با مقادیر مفقود
- بررسی وجود اختلال در مجموعه داده
- تغییر قالب مقادیر ویژگی هایی که تاریخ دارند
مدل رتبه بندی اعتباری هیبریدی با استفاده از الگوریتم های ژنتیک و سیستم های خبره فازی (مطالعه موردی: موسسه مالی و اعتباری قوامین)
https://www.sid.ir/fa/journal/ViewPaper.aspx?ID=224738