ریسک اعتباری در صنعت بانکداری به عنوان خطر ناشی از احتمال عدم بازپرداخت تعهدات توسط مشتریان در سر رسید بوده و یکی از مهم ترین ریسک ها در بانک و موسسات مالی به حساب می آید. استقرار نظام
رتبه بندی اعتباری با توجه به حجم انبوه مطالعات معوق بانک ها، یکی از مهم ترین ابزارهای کنترل این نوع ریسک است.
این مقاله با استفاده از شبکه های عصبی توانمند در حئزه پیش بینی و ترکیب آن ها قادر است مشتریان را در دو گروه خوش حساب و بدحساب دسته بندی کند.
مدل پیشنهادی که دارای ساختار و آموزش ماژولار است، مدل ترکیب سلسله مراتبی شبکه های عصبی نام دارد. در مدل یاد شده برای تجریه مساله میان شبکه ها و ترکیب نتایج برای رسیدن به پیش بینی نهایی و همچنین شیوه آموزش آن از رویکردی جدید استفاده شده است.
رویکرد پیشنهادی ابتدا، از الگوریتم گسسته بهینه سازی انبوه ذرات برای کاهش ابعادی و تجزیه مساله میان ماژول های مختلف استفاده می کند. سپس برای آموزش، از شبکه عصبی پرسپترون چند لایه و شبکه عصبی با اتصالات جانبی به دست آمده است. طبق نتایج به دست آمده مدل پیشنهادی توانسته با دقت بسیار بالا رفتار مشتریان را پیش بینی نماید.
مقدمه
فرایند جهانی شدن و به تبع آن تشدید رقابت موسسات مالی و اقتصادی در بازارهای محلی و جهانی، روز به روز ضرورت تقویت و اصلاحات سیستمی را در بنگاه های مالی و سرمایه ای در سرتاسر دنیا افزایش می دهد.
بانک ها نیز از این امر مستثنا نیستند. ایجاد تعادل میان عرضه و تقاضا در منابع و تسهیلات بانکی، مدیریت و کاهش مطالبات معوق و رهایی از سیستم وثیقه محوری از جمله مسائلی است که ضرورت و نیاز پیاده سازی نظان رتبه بندی و
اعتبارسنجی را در سیستم بانکی بیش از سایر مسائل نمایان می سازد.
از انواع مدل ها و روش های مختلفی که برای
اعتبار سنجی مشتریان بانک ها وجود دارد، می توان به مدل های تحلیل ممیزی، مدل های احتمال خطی، لاجیت و پروبیت، مدل های مبتنی بر تئوری قیمت گذاری اختیار معامله و مدل های شبکه های عصبی مصنوعی اشاره کرد.
از جمله مطالعات انجام شده در این زمینه می توان به کارهای دیکن در زمینه طراحی مدل نمره دهی اعتباری، مطالعات آلتمن در طراحی مدل نمره Z و مورگان در طراحی مدل اندازه گیری ریسک اشاره نمود.
روش های آماری، متداول ترین و پرکاربردترین روش ها برای ساختن مدل های رتبه بندی هستند. در حوزه هوش مصنوعی، وست به مقایسه دقت طبقه بندی پنج مدل شبکه عصبی و چهار مدل آماری رگرسیون لجستیک، نزدیک ترین همسایه، آنالیز ممیزی و چگالی کرنل پرداخته است.
در این میان مدل های MLP, RBF, MOE به عنوان مدل های برتر انتخاب شدند. در این مقاله از شبکه های عصبی، ترکیب آن ها و الگوریتم بهینه سازی برای پیش بینی در این حوزه استفاده شده است.
این مفاهیم با مفاهیم آماری بر پایه احتمالات با یکدیگر تلفیق می شوند و مدل ترکیب سلسله مراتبی شبکه های عصبی (خبرگان) را ایجاد می کنند. برای تجزیه مساله میان ماژول های مختلف، ابعاد داده های ورودی بوسیله فرم گسسته الگوریتم بهینه سازی انبوه ذرات بر روی هر ماژول شکسته می شود و ویژگی های برتر از میان کل ویژگی ها به شبکه معرفی می شوند.
این مقاله به لحاظ نوع استفاده از این شبکه ماژولار برای پیش بینی مسائل رتبه بندی و همچنین آموزش آن، دارای نوآوری است. باتوجه به این که برای آموزش شبکه های سلسله مراتبی، اغلب از الگوریتم هایی نظیر ماکسیمم سازی امید ریاضی که محاسبات پیچیده و احتمالی دشواری دارد استفاده می شود، در این مقاله برای آموزش این نوع از شبکه از ترکیب الگوریتم برخط و الگوریتم های رایج آموزش هر یک از ماژول های استفاده شده است.
این موضوع ضمن این که حجم انبوه محاسبات پیچیده را کاهش می دهد، باعث می شود تفسیر احتمالی مدل نیز برقرار باشد. با استفاده از روش پیشنهادی، مقاله حاضر به تهیه و تدوین الگوی
رتبه بندی مشتریان حقوقی یکی از بانک های دولتی خواهد پرداخت.
ساختار مقاله به این صورت است که ابتدا مروری بر پیشینه ادبیات موضوع و مطالعات گذشته بیان می شود. سپس، مدل HMNN و مدل پیشنهادی مطرح و معرفی می شود. پس از آن الگوریتم های بهینه سازی استفاده شده توضیح داده خواهند شد و در بخش ماقبل پایابی به بررسی نتایج اجرای مدل پیشنهادی و مقایسه آن با مدل های دیگر پرداخته می شود. در انتها نیز، نتایج مقاله و تحقیقات آتی بیان خواهد شد.
پیشینه تحقیق
تحقیقات انجام شده در حوزه
رتبه بندی اعتباری مشتریان بانک را می توان در دو گروه عمده کارها و تحقیقاتی که بر پایه روش های آماری انجام گرفته و کارها و پژوهش هایی که بر پایه هوش مصنوعی و تکنیک های مربوط به آن انجام گرفته است، دسته بندی کرد.
در زمینه تحقیقات بر مبنای روش های آماری، شروع کار رتبه بندی اعتباری و توسعه آن در سال های اولیه و ظهور آن به وسیله روش های آماری مختلف بوده است. این روند به لحاظ پایش ادبیاتی موضوع سهم بیشتری در حوزه این نوع مسائل را به خود اختصاص می دهد.
همچنین این روش ها بدلیل حجم محاسبات بالا و وقت گیر بودن و دقت پایین تر نسبت به برخی مدل های شبکه عصبی، در سالیان اخیر کمتر مورد توجه می باشند.
از این رو تمرکز پایش ادبیات موضوع در حوزه مسائل رتبه بندی اعتباری در این مقاله، بر تکنیک های هوش مصنوعی و روش های مرتبط با آن است.
پژوهشی با عنوان (تحلیلی از امتیازدهی اعتباری برای وام های کشاورزی) در تایلند صورت گرفته است که هدف پژوهشگران از انجام این مطالعه، تخمین مدل امتیازدهی اعتباری (تصمیم گیری وام دهی) برای وام های کشاورزی در تایلند بوده است.
آن ها از مدل لاجیت و دو نوع از مدل هایی که به صورت اختصار با شبکه عصبی مصنوعی، یکی با عنوان (شبکه عصبی احتمالی) و دیگری با عنوان (شبکه عصبی چند لایه بازخوردی)، نشان داده می شوندف برای برآورد مدل امتیازدهی اعتباری خود استفاده کرده اند.
نتایج حاصله در این تحقیق نشان می دهد که مدل به طور کلی، در پیش بینی PNN دیگر صحیح برای داده های داخل نمونه، قوی تر از دو مدل بوده است.
همان طور که گفته شد، روش های آماری، متداول ترین و پرکاربردترین روش ها برای ساختن مدل های رتبه بندی هستند، که در این خصوص نیز مقالات بسیاری وجود دارد. می توان گفت که در ابتدا آنالیز ممیزی و رگرسیون تنها مدل هایی بودند که در زمینه رتبه بندی اعتباری استفاده می شدند.
ویگینتون برای اولین بار از رگرسیون لجستیک در زمینه رتبه بندی اعتباری استفاده کرد. او مدل رگرسیون لجستیک را با آنالیز ممییزی مقایسه کرد و نتیجه گرفت که رگرسیون لجستیک، برتر از آنالیز ممیزی است. گرابلوسکی و تالی از آنالیز ممیزی و مدل پروبیت برای رتبه بندی متقاضیان یک فروشگاه بزرگ در آمریکا استفاده کردند.
از زمانی که سیستم های هوش مصنوعی نظیر شبکه عصبی، الگوریتم ژنتیک و سیستم های خبره طراحی و معرفی شدند، استفاده از آن ها در تحقیقات مالی و رتبه بندی اعتباری مرسوم گشته و به سرعت در حال گسترش است.
در این زمینه می توان به کاربرد الگوریتم ژنتیک در رتبه بندی اعتباری توسط شین و لی اشاره کرد که صورت های مالی حسابرسی شده 528 شرکت صنعتی آمریکا را برای تخمین احتمالی ورشکستگی مورد استفاده قرار دادند.
نتایج نشان داد که مدل، به طور متوسط در 80 درصد موارد قابلیت پیش بینی صحیح را دارد. از نتایج محاسباتی توسط تکنیک های جدید داده کاوی که به وسیله تام و کیانگ انجام گرفته، شبکه های عصبی با دقت ترین تکنیک ها و به دنبال آن تجزیه و تحلیل جدا کننده خطی، رگرسیون لجستیک، درختان تصمیم و نزدیک ترین همسایه بوده اند.
در مقایسه با روش های دیگر آن ها نتیجه گرفتند که مدل های شبکه های عصبی با دقت تر، مقاوم تر و قابل پذیرش تر هستند.
هنلی و هند در یک مطالعه جامع، دقت چهار روش مختلق در رتبه بندی را با استفاده از داده های مربوط به یک شرکت فروش پستی بزرگ مقایسه کردند. آن ها در تحقیق خود چهار روش رگرسیون خطی، رگرسیون لجستیک، نزدیک ترین همسایه و درخت تصمیم استفاده کردند.
نتیجه تحقیق حاکی از برتری روش نزدیک ترین همسایه نسبت به سه روش دیگر داشت و رگرسیون لجستیک، رگرسیون خطی و درخت تصمیم از نظر دقت طبقه بندی در رده های بعدی قرار گرفتند.
مالهترا از یک مدل شبکه عصبی پرسپترون چند لایه برای طبقه بندی مشتریان 12 موسسه مالی در آمریکا استفاده و نتایج آن را با روش آنالیز ممیزی مقایسه کرد که مدل شبکه عصبی دقت طبقه بندی بالاتری نشان داد. کیم نیز در مقاله خود از یک روش شبکه عصبی برای طبقه بندی متقاضیان وام استفاده کرد. در نهایت، مدل، دقت کلی 71-84 درصد در داده های آزمایشی را به دست آورد.
دیسای، کروک و آوراستریت، شبکه عصبی پرسپترون چند لایه، شبکه عصبی ترکیب خبرگان، تحلیل جداکننده خطی و رگرسیون لجستی را برای امتیازدهی متقاضیان اعتباری در صنعت اتحادیه اعتباری بررسی کردند.
روش شناسی آن ها شامل اعتبارسنجی ضربدری دوبخشی از داده های زمینه ای بود که از سه اتحادیه اعتباری با فرض هزینه های برابر برای ریسک های اعتباری خوب و بد به دست آمده بودند.
آنها نتیجه گفتند که مدل های شبکه عصبی عملکرد بهتری نسبت به تحلیل جدا کننده خطی دارند اما فقط اندکی از مدل های رگرسیون لجستیک بهتر هستند.
هوآنگ، تی ژنگ و آنگ، الگوریتم ژنتیک دو مرحله ای را برای ارتباط با مساله رتبه بندی اعتباری از طریق ترکیب مزایای استفاده از قوانین اگر-آنگاه و تابع جدا کننده ارائه نمودند. براساس نتایجی که آن ها به دست آوردند، الگوریتم ژنتیک دو مرحله ای دقت بهتری نسبت به مدل های رگرسیون لجستیک، شبکه عصبی MLP, CART و C4.5 داشته است.
معرفی مجموعه داده اعتباری
مجموعه داده و جامعه آماری مورد بررسی در این مقاله، مشتریان حقوقی در سطح شعب بانک سپه در شهر تهران هستند که
تسهیلات اعتباری دریافت نموده اند. بر این اساس، مشتریانی که طبق ضوابط بانک از اهمیت بیشتری برخوردارند، انتخاب شده اند و برای پیش بینی رفتار اعتباری آن ها از نسبت های مالی مربوط به آن ها استفاده شده است که در ادامه توضیح داده خواهد شد.
با توجه به این که هدف این مقاله کلاس بندی مشتریان به دو دسته خوش حساب و بد حساب است، جامعه آماری از نظر وضعیت اعتباری به دو دسته مشتریان خوش حساب (مشتریانی که تسهیلات دریافتی خود را در سر رسید مربوطه قبل از این که تسهیلات سر رسید گذشته شود، تسویه می نمایند) و مشتریان بدحساب (مشتریانی که پس از دریافت تسهیلات، اقدام می نمایند) تقسیم شده است.
تشریح متغیرهای پژوهش
متغیر وابسته
با توجه به این که مشتریان اعتباری به دو دسته خوش حساب و بدحساب تقسیم شده اند، این متغیر می تواند دو حالت صفر و یک را به خود اختصاص دهد. بر این اساس، با توجه به وضعیتی که مشتری دارد، این متغیر یکی از مقادیر صفر و یک را خواهد داشت. اگر مشتری در بازپرداخت تسهیلات نکول کرده باشد تسهیلات سر رسید گذشته یا معوق داشته باشد (t=0) در نظر گرفته می شود و چنانچه بازپرداخت تسهیلات در سر رسید صورت گرفته باشد (t=1) در نظر گرفته می شود.
متغیرهای مستقل
شامل آن دسته از متغیرهایی می شوند که بر ریسک اعتباری مشتری و به عبارتی دیگر بر متغیر وابسته مدل تاثیرگذارند. بنابراین با توجه به بررسی های انجام شده، مجموعه متغیرهایی که به نوعی می توانند بر متغیر وابسته مدل تاثیر گذارند به شرح زیر هستند:
- سرمایه در گردش (بدهی های جاری – دارای های جاری)
- نسبت بدهی جاری (بدهی های جاری به دارایی ها)
- نسبت مالکانه (حقوق صاحبان سرمایه یا ارزش ویژه به جمع دارایی ها)
- نسبت دارایی (دارایی جاری به کل دارایی ها)
- نسبت سریع (آنی) (دارایی جاری منهای موجودی کالا به بدهی جاری)
- نسبت گردش نقد (موجودی نقدی و سپرده ها به بدهی جاری)
- موجودی نقد و سپرده ها به کل دارایی ها
- نسبت جاری (دارایی جاری به بدهی جاری)
- و ...
یک رویکرد ترکیبی جدید برای آموزش مدل ترکیب سلسله مراتبی شبکه های عصبی به منظور رتبه بندی اعتباری در صنعت بانکداری
https://www.sid.ir/fa/journal/ViewPaper.aspx?ID=309729