انواع روش های شبکه عصبی مورد استفاده در
امتیازدهی اعتباری که از دهه 1990 به بعد به صورت رایج از آنها استفاده شده است، عبارتند از: پرسپترون چند لایه ای (MLP)، الگوریتم پس انتشار (BP)، شبکه های عصبی فازی (Fuzzy ANN) و شبکه تابع پایه شعاعی.
ماشین بردار پشتیبان (SVM)، روش دیگری از شبکه های عصبی است که بر اساس حداقل سازی ریسک ساختاری توسط واپلینک (2000) توسعه یافت و به تازگی به عنوان یک تکنیک موثر در امتیازدهی اعتباری استفاده می شود.
روش های پارامتریک دچار این نقیصه هستند که قدرت پیش بینی آن ها به شدت تحت تاثیر داده های پرت، مقادیر فرین و مقادیر گم شده متغیرهای مستقل قرار می گیرد. به همین ترتیب نقض فروض آماری مورد نیاز این روش ها مانند نرمال بودن متغیرها یا استقلال متغیرهای مستقل به کارگیری این مدل ها را دشوار می سازد.
در مقابل، روش درختان طبقه بندی (افراز بازگشتی) در معرض فروض محدود کننده مدل های پارامتریک قرار ندارد. همچنین در این روش، اثر متقابل متغیرهای مستقل در فرآیند مدل سازی و طبقه بندی مشتریان در نظر گرفته می شود.
یکی از محدودیت های روش درختان طبقه بندی، لزوم دسترسی به حجم بالای داده است، برای مثال، حداقل تعداد مشاهدات مورد نیاز برای تخمین مدل درختان طبقه بندی 200 عدد است. در این مطالعه، داده های 1343
مشتری اعتباری مورد استفاده قرار می گیرد و از این نظر محدودیتی وجود ندارد.
علت انتخاب روش درخت رگرسیون و طبقه بندی در بین سایر روش های ناپارامتریک درک شهودی راحت مدل، حجم مناسب نمونه آماری تحقیق و استخراج مستقیم احتمال نکول مشتریان از مدل به صورت طبقه ای متناظر با آنچه در رویکرد IRB بال 2 برای مشتریان خرد اشاره شد، است.
مدل تحقیق: درخت رگرسیون و طبقه بندی
الگوریتم افراز بازگشتی نخستین بار توسط بریمن و فریدمن در سال 1973 برای تخمین مدل درخت رگرسیون و طبقه بندی استفاده شد و بعد از چاپ کتاب درخت رگرسیون و طبقه بندی به صورت گسترده در محافل آکادمیک مورد استفاده قرار گرفت.
در این روش، نمونه انتخابی براساس میزان ارتباط متغیرهای مستقل با متغیر وابسته به دو بخش تفکیک می گردد. بعد از این تفکیک، این فرآیند برای نمونه های جدید ایجاد شده تکرار می شود. در هر مرتبه که تفکیک نمونه انجام می گیرد، نمونه های جدید ایجاد شده تفائت بیشتری نسبت به نمونه اولیه (نمونه مادر) پیدا می کنند.
بدین معنا که اگر نسبت تعداد خوب به بد در نمونه مادر برابر X به 1 باشد، این نسبت برای یکی از نمونه های جدید ایجاد شده بیشتر و برای یکی دیگر کمتر از X به 1 خواهد بود. هدف از فرآیند تقسیم بندی پیدا کردن تفکیکی است که اختلاف این نسبت بین گروه ها را حداکثر کند.
برای تفکیک نمونه باید یک سنجه آماری استفاده شود که حداکثر تمیز را بین نمونه های ایجاد شده برقرار کند. به طور معمول از تابع ناپاکی ند برای این کار استفاده می شود.
همچنین در این روش نیاز به قاعده ای است که میزان تفکیک نمونه ها متوقف شود. برای این کار به طور معمول قیدی تحمیل می شود که برای مثال، تعداد مشاهدات در هر نمونه نباید کمتر از 50 مشاهده باشد.
مدل CART مانند مدل های لاجیت و تحلیل ممیزی برای هر مشاهده احتمال نکول نمی دهد، بلکه براساس اینکه هر یک از مشاهدات در کدام ند قرار بگیرد، می توان نسبت تعداد خوب به بد را در آن ند بعنوان احتمال نکول همه مشاهدات آن ند لحاظ کرد.
آزمون اعتبار مدل طبقه بندی
پیرو مطالعه تاچ (2003)، انواع روش های آماری برای ارزیابی قدرت پیش بینی مدل های طبقه بندی وجود دارد. برخی از روش های مرسوم در این حوزه عبارتند از:
- پروفایل صحت تجمعی (CAP) و شاخص تلخیصی آن نسبت صحت (AR)
- مشخصه عملکرد دریافت کننده (ROC) و شاخص های تلخیصی آن، سنجه ROC و ضرایب پیترا
- نرخ خطای بیزین
- آنتروپی شرطی، فاصله کولباک-لیبر و نسبت آنتروپی اطلاعات شرطی (CIER)
- ارزش اظلاعاتی (شاخص واگرایی و پایداری)
- T کندال و D سامرز
به دلیل خواص آماری مطلوب رایج ترین روش آزمون اعتبار مدل روش رسم منحنی CAP و منحنی ROC و استخراج سنجه های تلخیصی این دو منحنی است. در این تحقیق، از سنجه ROC ها برای تعیین اعتبار مدل طبقه بندی مشتریان استفاده می شود.
داده ها
داده های مورد استفاده در این تحقیق شامل اطلاعات تمام اشخاص حقیقی با درآمد ماهیانه کمتر از 50 میلیون ریال است که در سال های 1391 و 1392 برای نخستین بار از بانک تسهیلات مصرفی کمتر از 500 میلیون ریال دریافت کرده اند و وضعیت حساب آن ها (نکول یا غیرنکول) در یک پنجره یک ساله قابل ردیابی است.
برای اینکه عملکرد مشتریان در یک پنجره یک ساله ردیابی شود، تمام مشتریان در سال های 1391 و 1392 به هشت گروه براساس فصول سال تقسیم شده اند و عملکرد هر گروه یک سال بعد، از این نظر که آیا مشتری نکول کرده و یا نکول نکرده است کد گذاری می شود. اگر مشتری نکول کرده بود، کد 1 و اگر نکول نکرده بود، کد 0 به وی تخیص می یابد. درنهایت، داده های مربوط به 1343 مشتری، پایگاه داده این تحقیق را تشکیل دادند.
برای تخمین مدل طبقه بندی، مهم ترین متغیرهای پیش بینی کننده نکول (متغیرهای مستقل) قابل استخراج از پرونده های اعتباری در سه طبقه ویژگی های شخصیتی، ویژگی های شغلی و سوابق مشتری طبقه بندی شدند. به تمام مشتریانی که طی دوره زمانی 1391 تا 1392 تسهیلات دریافت کردند کدی تخصیص داده می شود تا دو بار در داده ها در نظر گرفته نشوند، یعنی اگر یک مشتری دو بار تسهیلات گرفته باشد، تنها دفعه اول در داده ها وارد می شود.
انتخاب دوره زمانی دو ساله 1391 تا 1392 برای تخمین مدل امتیازدهی اعتباری به دو دلیل انجام گرفته است: 1- متغیرهای کلان اقتصادی تغییر ساختاری طی این دوره کوتاه نداشته اند و مدل طبقه بندی برآورد شده با این داده ها از قدرت پیش بینی مناسبی برای این شرایط اقتصادی برخوردار خواهد بود. 2- به طور معمول بخشی از
ریسک اعتباری مشتریان ناشی از اشتباهات سیاست اعتباری بانک است.
انتظار این است که طی دوره دو ساله سیاست ها و استانداردهای اعتباری بانک تغییر فاحشی نداشته باشند. بنابراین، پیش بینی مدل طبقه بندی اعتباری با فرض ثبات سیاست های اعتباری کنونی بانک معتبر خواهد بود. در نهایت، داده های مربوط به 1343 مشتری پایگاه داده این تحقیق را تشکیل دادند.
نتایج تخمین مدل
با استفاده از روش CART داده های مشتریان اعتباری به 22 ند (Node) طبقه بندی شدند که 12 ند، ند نهایی هستند. معیار قرار گرفتن مشاهدات در ندهای نهایی، در حالی که درصد نکول شدگان در داده های موجود 8.9 درصد است، با طبقه بندی مشتریان به ندهای همگن نرخ نکول بین 0 تا 42.9 درصد متغیر است.
درصدی از کل نکول شدگان را که در هر ند قرار می گیرند، ارزش (Gain) آن ند می نامند، برای مثال میزان Gain 7.6 درصد بدان معناست که 7.6 درصد از کل نکول شندگان در این ند قرار گرفته اند، اما شاخص مناسب تر برای ارزیابی عملکرد ندها، سنجه Index است.
این سنجه نسبت نرخ نکول را در هر ند به نرخ نکول ند مادر (ند 0) نشان می دهد، برای مثال سنجه Index به میزان 483.7 درصد ند بدان معناست که نرخ نکول شدگان در این ند، حدود 5 برابر نکول داده های اولیه تحقیق است، یعنی مشاهداتی که در این ند قرار می گیرند از احتمال نکول بالایی برخوردارند.
برای تحلیل تاثیر کیفیت طبقه بندی مشتریان بر سرمایه مورد نیاز به منظور مواجهه با ریسک اعتباری، درخت طبقه بندی تا پنج سطح ادامه یافته است. انتظار این است که افزایش سطوح طبقه بندی باعث ایجاد همگنی در مشاهدات داخل هر یک از ندها از لحاظ ویژگی های
ریسک اعتباری شود.
سنجه ROC در سطح اول طبقه بندی 0.543 بوده و در سطح طبقه بندی پنجم به 0.702 افزایش یافته است. این، بدان معناست که قدرت پیش بینی مدل افزایش یافته است و ندها از لحاظ ریسک اعتباری همگن تر شده اند.
در نهایت، تاثیر افزایش دقت پیش بینی مدل بر سرمایه مورد نیاز برای مواجهه با ریسک اعتباری نشان داده شده است. در سطح صفر، یعنی نبود طبقه بندی مشتریان نرخ نکول (PD) برابر 8.9 درصد شده است. با فرض آن که هیچ یک از تسهیلات وثیقه ندارند، براساس توافقنامه بال 2 مقدار LGD برای آن ها برابر 45 درصد خواهد بود.
به ازای EAD برابر یک واحد پولی و قرار دادن این پارامترها در معادله سرمایه مورد نیاز برای مواجهه با ریسک اعتباری برابر 5.84 درصد شده است. در سطح دوم، مشتریان به دو طبقه ند 1 با 1290 مشاهده و ند 2 با 53 مشاهده طبقه بندی شدند.
PD1 برابر 26.4 درصد و PD2 برابر 8.1 درصد شده است. با قرار دادن PD1 و PD2 در معادله مقادیر K1 و K2 برابر خواهند شد با 5.70 و 8.87 درصد. به همین ترتیب تا سطح پنجم طبقه بندی محاسبات ادامه می یابد.
با افزایش دقت مدل طبقه بندی (براساس سنجه ROC) سرمایه مورد نیاز رو به کاهش است. به غیر از سطح دوم طبقه بندی که در مقایسه با سطح اول افزایش یافته است. این همان نکته ای است که به دلیل عدم تقعر کامل تابع سرمایه مورد نیاز به لزوم سطح سرمایه مورد نیاز با افزایش دقت مدل کاهش نمی یابد، اما اگر نوع تفکیک طبقات طوری انجام گیرد که مقادیر PD در ناحیه اول و سوم قرار گیرند، امکان صرفه جویی سرمایه ای برای بانک ها وجود نخواهد داشت.
نتیجه گیری
سرمایه یکی از اصلی ترین عواملی است که توسط نهادهای نظارتی و آژانس های رتبه بندی برای بررسی ثبات و سلامت یک بانک بررسی می شود. سرمایه کافی مانند سپر در مقابل انواع ریسک های کسب و کار بانک را بیمه می کند. به عبارت دیگر، انواع زیان های غیر منتظره از طریق سرمایه جذب و از این طریق اعتماد سپرده گذاران به بانک حفظ می شود.
میزان سرمایه بانک بر جایگاه رقابتی آن در بین بانک ها تاثیر دارد. به طور معمول سهامداران نسبت به منابع مالکانه خود در بانک یک حداقل بازدهی انتظار دارند و برای حصول این بازدهی بانک باید محصولات خود را براساس میزان ریسک (یا سرمایه تخصیص داده شده) قیمت گذاری کند.
از سوی دیگر، برای تامین مالی اعتبارات بانک نیاز دارد از عموم مردم سپرده جذب کند. برای این کار جذب اعتماد سپرده گذاران موضوعی ضروری است. سرمایه کافی در جذب این اعتماد بسیار موثر است. اگر بانکی با کمبود سرمایه مواجه شود، این اعتماد کاهش می یابد و اگر سرمایه بیش از نیاز نگهداری کند، هزینه سرمایه افزایش می یابد و در هر دو حالت جایگاه رقابتی آن در بازار تنزل می یابد.
بخشنامه شماره 94/296348 به تاریخ 15/10/1394، بانک مرکزی جمهوری اسلامی ایران که در آن ترجمه بخشی از توافقنامه بال 2 برای بانک های کشور به عنوان یک رهنمود و بدون الزام ابلاغ شده، حاکی از آن است که اجرای توافقنامه بال 2 در نظام بانکی کشور موضوعی اجتناب ناپذیر خواهد بود.
اجرای توافقنامه بال 2 در نظام بانکی کشور با فرصت ها و چالش هایی رو به رو خواهد بود. همان گونه که در این تحقیق نشان داده شد، تقعر تابع سرمایه مورد نیاز فرصت های آربیتراژ جدیدی برای بانک ها به همراه خواهد داشت. آنها می توانند با به کارگیری مدل های طبقه بندی مشتریان خود را طبقه بندی کنند که از یک صرفه جویی سرمایه ای برخوردار شوند.
همان گونه که نشان داده شد، افزایش دقت مدل رتبه بندی داخلی حدود 0.44 درصد صرفه جویی سرمایه ای به همراه داشته است. اگرچه این صرفه جویی سرمایه ای عاملی است که به تشویث بانک ها به اندازه گیری دقیق
ریسک اعتباری مشتریان منجر می شود، اما از جانب بانک مرکزی این مدل های طبقه بندی باید به دقت مورد حسابرسی و نظارت قرار گیرند، به طوری که اطمینان حاصل شود میزان سرمایه بانک به طور واقعی با میزان ریسک اعتباری تناسب دارد.
رويکرد رتبه بندی داخلی بال 2 و سرمايه مورد نياز برای مواجهه با ريسک اعتباری
https://www.sid.ir/fa/journal/ViewPaper.aspx?ID=355758