Econ. Reynaldo Uscamaita Huillca
Aplicación de los modelos de
credit scoring para
My RISK Página 2
OBJETIVO
Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar decisiones acertadas al otorgar un crédito comercial.
La unidad de riesgos estará en la capacidad de adoptar decisiones financieras con el fin de mejorar en tiempo de evaluación de un crédito comercial.
Modelo de riesgo de crédito
My RISK Página 3
Estimación de credit Scoring
Típicamente, varios factores pueden afectar la probabilidad de impago de los prestatarios, en el segmento de las Pymes para aprobar un crédito se considera las siguientes variables: el salario, ocupación, la edad y otras características. Cuando negociamos con clientes corporativos: examinamos nivel de una Pyme, beneficios o el flujo de caja,…, etc. Un modelo de Scoring específicamente combina y ordena diferentes piezas de información para obtener un cálculo adecuado de la probabilidad de Impago y sirve para automatizar y estandarizar la evaluación del riesgo de Impago dentro de una institución financiera.
En esta investigación podemos mostrar cómo se utiliza una técnica estadística para especificar un modelo de credit Scoring. Especialmente, esta cantidad de información de codificada (por ejemplo medir el nivel de deuda/activo) nos ayudara a encontrar una combinación de factores que mejoren la explicación histórica del comportamiento de impago.
Después de aclarar la relación entre credit Scoring y la probabilidad de impago mostramos como estimar e interpretar un modelo. Esta investigación se propone desarrollar la aplicación práctica de investigaciones anteriores para lo cual es necesario nombrar los datos para su respectivo tratamiento estadístico y seleccionar una relación funcional entre variables explicativas y la variable explicada (o impago).
Un paso importante es desarrollar y utilizar la validación de un modelo de credit Scoring. Las técnicas de validación no son aplicadas solamente a modelos de credit Scoring sino también utilizan las agencias de ratios y otras instituciones de miden el riesgo de impago1
Construyendo un Scoring atreves de la probabilidad de impago y el comportamiento de
impago observado
Un Scoring resume la información contenida dentro de las variables exógenas que afectan la probabilidad de impago. Un modelo estándar de credit Scoring es la aproximación de la combinación lineal de las variables exógenas. La letra ݔdenota las variables explicativas (en un número de k) y b coeficiente aproximado a ellos. Se puede representar el escore que se obtiene para el i-esimo impago de la siguiente forma.
ܵܿݎ݁=ܾଵݔଵ+ܾଶݔଶ+ ? +ܾݔ…(1.1)
Es conveniente tener una expresión abreviada, donde se recolecte las columnas b y x en los vectores b y x que se describe de esta forma:
ܵܿݎ݁=ܾଵݔଵ+ܾଶݔଶ+ ? +ܾݔ=࢈´࢞, ࢞=൦ ݔ ࢞ ? ࢞ ൪. ܊= ൦ ܾ ࢈ ? ࢈ ൪ … (1.2)
1 En el caso especifico de cusco las instituciones micro financieras utilizan al central de riesgos INFOCORF
My RISK Página 4
Si el modelo incluye una constante ܾଵ, entonces el valor de ݔ= 1para cada valor i.
Por convención se asume que el vector x determina el coeficiente del vector b. usualmente, se estima sobre la observación básica del comportamiento de impago2. Imagine que se recolecta los
datos anuales de las empresas donde está el valor de cada variable explicativa y el comportamiento de impago. Esto se muestra en el grafico de datos de la tabla 1.13.
Tabla 1.1 grafico de Probabilidad de Scoring
Si una misma empresa puede mostrar más de una vez entonces existe información sobre esta empresa por varios años. Sobre los impagos, si la empresa está por varios años en la categoría de impago; en este caso no se puede usar la observación de los siguientes años en que ocurrió el impago, si una empresa sale de la situación de impago entonces se puede incluir de nuevo al conjunto de datos de la muestra.
La información de Impago es guardado dentro de una variable ݕentonces tomara el valor de 1 si la empresa está en la situación de impago al siguiente año en que se ha recolectado el valor de la variable y se considerara cero si ocurre el caso contrario. De todas maneras el número de observaciones de la muestra es denotado por N.
El objetivo de un modelo de credit Scoring es predecir la alta probabilidad de impago para aquellas empresas que se encuentran en impago y una baja probabilidad para aquellas que no están. Para seleccionar el coeficiente apropiado de b, primero necesitamos juntar el score con la probabilidad de impago. Esto es realizado con la representación de la probabilidad de impago como una función de escore F.
ܲݎܾሺܦ݂݁ܽݑ݈ݐሻ=ܨ(ݏܿݎ݁ݏ) …(1.3)
El score de la función F se debe encontrar entre los intervalos de 0 hasta 1, esto creara un campo de una probabilidad de impago para cada posible escore. Este requerimiento puede ser completado por una función de distribución de probabilidad acumulativa. La función de
2 En un modelo cualitativo de credit scoring, es determinado por el coeficiente de cada factor.
3 Los datos usados para credit Scoring son usualmente datos anuales básicos. Pero uno puede también
Modelo de riesgo de crédito
My RISK
distribución que se considera para este propósito es la distribución logística distribución logística ߉ሺݖሻ es definido como
ecuación (1.3) se obtiene:
ܲݎܾሺܦ݂݁ܽݑ݈ݐሻൌ
El modelo que une la información con probabilidades es una función de distribución logística que se llama modelos logit.
En la tabla 1.2, demostramos la probabilidad relación existe con el grafico. Com
probabilidad de impago. En pocas instituciones financieras el credit Scoring opuesta: los prestatarios de altos montos tienen el más bajo
encuentran frecuentemente co
100. La preferencia para cualquier característica puede ser fácilmente ecuación (1.4) que define un sistema de credit scoring con scores de
trabajar con scores de 0 hasta 100 esta vez (100 es el mejor), se puede transformar el score original utilizando la formula mi
Tabla 1.2 score y probabilidad de impago mediante el
Habiendo recolectado los valores de la variables manera de estimar el coeficiente
acuerdo al principio de ML, los coeficientes seleccionados como una
son maximizados como un comportamiento de impago dado dentro de la muestra observada El primer paso para estimar la máxima probabilidad es mostrar una función de máxima probabilidad. Para un prestatario que está en Impago (
Modelo de riesgo de crédito
distribución que se considera para este propósito es la distribución logística es definido como ߉ሺݖሻൌሺݖሻȀሺͳሺݖሻሻ ሻൌ߉ሺݏܿݎ݁ݏሻൌͳሺ܊Ʋሺ܊Ʋܠܑሻܠ
ܑሻൌ
ͳ
ͳሺെ܊Ʋܠܑ
El modelo que une la información con probabilidades es una función de distribución logística que mos la probabilidad de default asociada como algún score e ilustramos con el grafico. Como se puede ver, el score alto corresponde
probabilidad de impago. En pocas instituciones financieras el credit Scoring tiene una propied de altos montos tienen el más bajo riesgo de crédito. En
frecuentemente contrastados para un conjunto de intervalos, por para cualquier característica puede ser fácilmente encontrada
ecuación (1.4) que define un sistema de credit scoring con scores de -9 hasta 1 pero si deseamos e 0 hasta 100 esta vez (100 es el mejor), se puede transformar el score
miscore=-10 x score +10.
score y probabilidad de impago mediante el modelo de logit
Habiendo recolectado los valores de la variables x y escogiendo la función de distribución manera de estimar el coeficiente b es utilizando el método de máxima verosimilitud
do al principio de ML, los coeficientes seleccionados como una probabilidad (=verosimilitud) un comportamiento de impago dado dentro de la muestra observada El primer paso para estimar la máxima probabilidad es mostrar una función de máxima probabilidad. Para un prestatario que está en Impago (ݕൌͳሻ su probabilidad observada es:
Página 5
distribución que se considera para este propósito es la distribución logística. La función de
ሺሻሻ. Aplicando para la
ܑሻǥሺͳǤͶሻ
El modelo que une la información con probabilidades es una función de distribución logística que de default asociada como algún score e ilustramos la o se puede ver, el score alto corresponde para una alta tiene una propiedad riesgo de crédito. Entonces se por ejemplo de 0 hasta encontrada. Si utilizamos la 9 hasta 1 pero si deseamos e 0 hasta 100 esta vez (100 es el mejor), se puede transformar el score
modelo de logit
y escogiendo la función de distribución F una el método de máxima verosimilitud (ML). De probabilidad (=verosimilitud) un comportamiento de impago dado dentro de la muestra observada. El primer paso para estimar la máxima probabilidad es mostrar una función de máxima
My RISK Página 6 ܲݎܾሺܦ݂݁ܽݑ݈ݐሻ=߉ሺܾ´࢞ሻ … (1.5)
Para los prestatarios que no están en la situación de impago (ݕ= 0) su probabilidad observada es:
ܲݎܾሺ݊݅݉ܽ݃ሻ= 1 - ߉ሺܾ´࢞ሻ … (1.6)
Podemos combinar las dos ecuaciones dentro de una sola formula que generara automáticamente la probabilidad correcta de Impago o no impago. Donde cualquier número incrementara la potencia de 0 para evaluar 1. La probabilidad de la i-esima observación es descrita por la siguiente ecuación:
ܮ=൫߉ሺܾ´࢞ሻ൯௬(1 - ߉ሺܾ´࢞ሻ)ଵି௬ … (1.7)
Asumiendo que los impagos son independientes, la probabilidad de observación en conjunto es el producto de la probabilidad individual4
ܮ=ς ܮே
ୀଵ =ς ൫߉ሺܾேୀଵ ´࢞ሻ൯௬(1 - ߉ሺܾ´࢞ሻ)ଵି௬ … (1.8)
Para propósitos de maximización es más conveniente examinar ݈݊ܮ que es logaritmo de la probabilidad.
݈݊ܮ=σ ݕேୀ ln൫߉ሺ࢈´࢞ሻ൯+ (1 - ݕ)ln(1 - ߉ሺ࢈´࢞ሻ) … (1.9)
Se puede maximizar mediante su primera derivada con respecto para b. Esta derivada (como b es un vector) es descrito en la siguiente ecuación:
݈݀݊ܮ
݀܊=(
ே ୀଵ
ݕ- ߉ሺ܊´ܠሻ)ܠ୧… (1.10)
El método Newton hace un buen trabajo en resolver la ecuación (1.10) con respecto para b, para aplicar este método se necesita la segunda derivada que se representa en la siguiente ecuación:
݀ଶ݈݊ܮ
݀܊݀܊´= - ߉ሺ܊´ܠሻ(
ே ୀଵ
ݕ- ߉ሺ܊´ܠܑሻ)ܠ୧… (1.11)
ESTIMACION DE LOS COEFICIENTES
El primer argumento especificado es el rango de la variable dependiente, que es nuestro caso es el indicador de impago ݕ, el segundo parámetro especificado es el rango de la variable explicativa(s). Antes de profundizar en los códigos veremos de como la función trabaja sobre un ejemplo de datos5. Nosotros hemos recogido la información de impago y 5 variables para la predicción de
4 Dado que hay años en que el ratio de impago es alto, y otras en que es bajo, podemos admitir si el
supuesto independiente es apropiado que el factor que ingresamos dentro de la fluctuación de score promedio es el riesgo de impago.
Modelo de riesgo de crédito
My RISK Página 7
Impago: Capital de trabajo (CT), Utilidades Neta (Utilidad Neta), Ingresos antes de Impuestos e Intereses (EBIT) y Ventas (V), cada uno dividido por el Total de Activos (TA); Deuda en al sistema financiero (ME) dividido por el Total de Patrimonio (TP). Excepto por el valor del mercado todos estos ítem son encontrados en una hoja de balance y el estado de ingresos de la compañía. El valor de mercado es dado por el número es la sumatoria de todas las deudas pendientes con el sistema financiero. Los cinco ratios son aquellos que son conocidos extensamente como Z-score desarrollado por Alman (1968) CT/TA captura la liquidez de la empresa, UN/TA mide los beneficios actuales e históricos, respectivamente. V/TA mide la situación competitiva de la empresa y ME/TP es una medida de mercado en base al patrimonio.
Claro, uno puede considerar otras variables como bueno; para mencionar solo a pocos, estos pueden ser: el flujo de caja sobre los servicios de la deuda, ventas sobre el total de activos (como una medida de aproximación de mercado), volatilidad de la ganancia, la volatilidad del precio de la deuda. También hay varios caminos para capturar un factor de relieve. Los beneficios en un momento puede ser medidos usando EBIT, EBITDA (=EBIT mas depreciación del amortización) o el ingreso neto.
En la tabla 1.3 los datos son ordenados en función al ID de la Empresa y los años requeridos para la estimación. La variable default de la función LOGIT usa todo el rango de datos que han sido introducidos; la constante (si es incluido) aparece como la variable ܥ. Para interpretar el signo de los coeficientes se dice que un alto score corresponde para una alta probabilidad de impago. El signo negativo de los coeficientes. Por ejemplo para EBIT/TA significa que a una baja probabilidad de impago entonces el beneficio se incrementara.
Tabla 1.3 Aplicación de un comando LOGIT sobre los datos con información sobre default como cinco ratios financieros.
My RISK
La estimación de un modelo estándar adecuada organización de datos.
mostrado en la primera derivada, para resolver este problema se utiliza el Para este proceso se requiere
del vector b; la primera derivada del log ecuación (1.10); la segunda derivada ( conduce a la siguiente regla:
ܾଵൌܾെ
El modelo logit tiene la característica que la función de log Una vez que encontramos las raíces pa
encontrado el máximo global de una función Comúnmente se utiliza los valores iníci una constante, mientras los ot
una sola constante se tiene la mejor predicció promedio de ratios de impago
promedio del indicador de impago
la constante ܾଵ igual a ݕത porque el modelo de
solamente tiene una constante sino mas bien se estima de que aplicar la inversa de la función de distribución logística.
La estimación de un modelo estándar de credit scoring se puede modificar en función de datos. La función LOGIT maximiza el log de probabilidad mostrado en la primera derivada, para resolver este problema se utiliza el
Para este proceso se requiere: un conjunto de valores iníciales para los parámetros no conocidos ; la primera derivada del log – probabilidad (la gradiente del vector
ecuación (1.10); la segunda derivada (la matriz hessiana H () dado en (1.11)). El método de newton
െቂௗௗమ భௗబƲቃ ିଵௗ ௗబൌܾെܪሺܾሻ ିଵ݃ሺܾ ሻ …(1,12)
t tiene la característica que la función de log- probabilidad es globalmente cón las raíces para la primera derivada, podemos estar seguros que se ha encontrado el máximo global de una función log - probabilidad.
valores iníciales para establecer la constante y el modelo contiene solo una constante, mientras los otros coeficientes establecen en 0 (Principio de ceteris Paribus
a mejor predicción de una probabilidad de impago
ratios de impago, que se denota por ݕത; esto puede ser computarizado como el valor ndicador de impago de la variable ݕ. Tome en cuenta que no deberíamos establecer
തporque el modelo de probabilidad de impago solamente tiene una constante sino mas bien se estima de ߉ሺܾଵሻ. Para llegar al
la inversa de la función de distribución logística.
߉ିଵሺݕതሻൌሺݕതȀሺͳെݕതሻ…(1.13)
Página 8
icar en función de una el log de probabilidad que es mostrado en la primera derivada, para resolver este problema se utiliza el método de newton. para los parámetros no conocidos (la gradiente del vector ()) dado en la )). El método de newton …(1,12)
es globalmente cóncava. ar seguros que se ha el modelo contiene solo
Principio de ceteris Paribus). Con
n de una probabilidad de impago individual que es el ; esto puede ser computarizado como el valor Tome en cuenta que no deberíamos establecer con una constante llegar al objetivo tenemos
Modelo de riesgo de crédito
My RISK Página 9
Para comprobar que se llega al resultado deseado se examina la predicción de impago de un modelo logit con solo una constante que es mostrado en (1.13):
ܲݎܾሺݕ= 1ሻ= ߉ሺ܊ሻ=1 + exp (-1 ܊ )=
1
1 + exp (- ln (ݕത /(1 - ݕത))) =1 + (1 -1 ݕത)Τݕത=ݕത…ሺ1.14ሻ
Cuando iniciamos el vector de coeficientes (denotado por b en la función), cuando se necesite después podemos iniciar los escores (denotado por bx). Inicialmente se fija cada coeficiente excepto la constante cero. BX es igual a la constante es este escenario. (recuerde que la primera constante es el primer elemento del vector b).
Por conveniencia se resume en las siguientes formulas claves.
ܮܾܽ݉݀ܽ=߉ሺ࢈´࢞ሻ= 1 (1 + expΤ ሺ- ܊´ܠܑሻ) ݈݈݀݊= y୧- ?ሺ܊´ܠܑሻܠܑ ே ୀଵ ܪ݁ݏݏ݅ܽ݊= - ߉ሺ࢈´࢞ሻ൫1 - ߉ሺ࢈´࢞ሻ൯ܠܑܠ´ܑ ே ୀଵ ݈݈݊= y୧ln ( ே ୀଵ ߉ሺ܊´ܠܑሻ) +ሺ1 - y୧ሻln (1 - ߉ሺ܊´ܠܑሻ)
CALCULO DE ESTADISTICOS DESPUES DE LA SIMULACION DEL MODELO
En esta sección se muestra de cómo los estadísticos de la regresión son calculados dentro de la función Logit.
Para evaluar si una variable ayuda a explicar los eventos de impago, se examina el ratio t para la hipótesis que el coeficiente de la variable es cero. Para el j-esimo coeficiente el ratio t es construido como:
ݐ=ܾ/ܵܧ൫ܾ൯…(1.15)
Donde SE es el error estándar estimado de los coeficientes que toma b de la última iteración de Newton y el error estándar estimado de los parámetros son divididos por la matriz Hessiana. En el modelo Logit los ratios t no responden a una distribución t como en el modelo clásico regresión lineal. Más bien es comparado con una distribución normal estándar. Para obtener el p-valué de un test de dos colas, nosotros exploramos la simetría de una distribución normal.
My RISK
En un modelo de regresión lineal se reporta En modelos no lineales que se estima por reporta el Pseudo-ܴଶ sugerido por McFadden función log-probabilidad.
ݏ݁ݑ݀
Se resume el resultado de la función LOGIT
Tabla 1.4 resultado de las funciones definidas del LOGIT
PREDICCION Y ANALISIS DE ESCENARIO
Teniendo especificado un modelo de scoring y deseamos utilizar
impago. Primero se calcula el score de impago (Ecuación (1.1) y (1.4))
ܲݎܾሺ݂݀݁ܽݑ݈ݐ
En la tabla 1.7, se calcula la probabilidad de impago predecir solo necesitan los coeficientes.
Tabla 1.7 predic
6 Note que la aplicación de la ecuación (1.20) mide el significado de la probabilidad de
representa la población.
lineal se reporta un ܴଶ como una medida de todos los mejores ajustes que se estima por el método de máxima probabilidad u
sugerido por McFadden. Esto es calculado como 1 mejores
ݏ݁ݑ݀െܴଶൌͳെܮȀܮ
…(1.17) el resultado de la función LOGIT en la siguiente tabla 1.4.
Tabla 1.4 resultado de las funciones definidas del LOGIT
PREDICCION Y ANALISIS DE ESCENARIO
o un modelo de scoring y deseamos utilizar para predecir l score y después este cálculo se traduce en un valor (1.4))6.
݂݀݁ܽݑ݈ݐሻൌ߉ሺݏܿݎ݁ሻൌ߉ሺ࢈Ʋ࢞ሻൌଵାୣ୶୮ଵሺି࢈Ʋ࢞ሻ…(1.20)
probabilidad de impago en base al modelo y a los cinco ratios. Para predecir solo necesitan los coeficientes.
Tabla 1.7 prediciendo la probabilidad de Impago
Note que la aplicación de la ecuación (1.20) mide el significado de la probabilidad de
Página 10
da de todos los mejores ajustes. el método de máxima probabilidad usualmente se . Esto es calculado como 1 mejores ratios de la
para predecir probabilidades de
después este cálculo se traduce en un valor de probabilidad …(1.20)
en base al modelo y a los cinco ratios. Para
Modelo de riesgo de crédito
My RISK Página 11
Conclusiones
• El razonamiento económico nos demuestra que un modelo de scoring ayuda a predecir la probabilidad de impago de un cliente determinado bajo ciertas condiciones.