Aplicación de los modelos de credit scoring para instituciones microfinacieras.

(1)

Econ. Reynaldo Uscamaita Huillca

Aplicación de los modelos de

credit scoring para

(2)

My RISK Página 2

OBJETIVO

Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar decisiones acertadas al otorgar un crédito comercial.

La unidad de riesgos estará en la capacidad de adoptar decisiones financieras con el fin de mejorar en tiempo de evaluación de un crédito comercial.

(3)

Modelo de riesgo de crédito

My RISK Página 3

Estimación de credit Scoring

Típicamente, varios factores pueden afectar la probabilidad de impago de los prestatarios, en el segmento de las Pymes para aprobar un crédito se considera las siguientes variables: el salario, ocupación, la edad y otras características. Cuando negociamos con clientes corporativos: examinamos nivel de una Pyme, beneficios o el flujo de caja,…, etc. Un modelo de Scoring específicamente combina y ordena diferentes piezas de información para obtener un cálculo adecuado de la probabilidad de Impago y sirve para automatizar y estandarizar la evaluación del riesgo de Impago dentro de una institución financiera.

En esta investigación podemos mostrar cómo se utiliza una técnica estadística para especificar un modelo de credit Scoring. Especialmente, esta cantidad de información de codificada (por ejemplo medir el nivel de deuda/activo) nos ayudara a encontrar una combinación de factores que mejoren la explicación histórica del comportamiento de impago.

Después de aclarar la relación entre credit Scoring y la probabilidad de impago mostramos como estimar e interpretar un modelo. Esta investigación se propone desarrollar la aplicación práctica de investigaciones anteriores para lo cual es necesario nombrar los datos para su respectivo tratamiento estadístico y seleccionar una relación funcional entre variables explicativas y la variable explicada (o impago).

Un paso importante es desarrollar y utilizar la validación de un modelo de credit Scoring. Las técnicas de validación no son aplicadas solamente a modelos de credit Scoring sino también utilizan las agencias de ratios y otras instituciones de miden el riesgo de impago1

Construyendo un Scoring atreves de la probabilidad de impago y el comportamiento de

impago observado

Un Scoring resume la información contenida dentro de las variables exógenas que afectan la probabilidad de impago. Un modelo estándar de credit Scoring es la aproximación de la combinación lineal de las variables exógenas. La letra ݔdenota las variables explicativas (en un número de k) y b coeficiente aproximado a ellos. Se puede representar el escore que se obtiene para el i-esimo impago de la siguiente forma.

ܵܿ݋ݎ݁௜=ܾଵݔଵ௜+ܾଶݔଶ௜+ ? +ܾ௞ݔ௜௞…(1.1)

Es conveniente tener una expresión abreviada, donde se recolecte las columnas b y x en los vectores b y x que se describe de esta forma:

ܵܿ݋ݎ݁௜=ܾଵݔଵ௜+ܾଶݔଶ௜+ ? +ܾ௞ݔ௜௞=࢈´࢞࢏, ࢞࢏=൦ ݔ࢏૚ ࢞࢏૛ ? ࢞࢏࢔ ൪. ܊= ൦ ܾ૚ ࢈૛ ? ࢈࢔ ൪ … (1.2)

1_{En el caso especifico de cusco las instituciones micro financieras utilizan al central de riesgos INFOCORF}

(4)

My RISK Página 4

Si el modelo incluye una constante ܾଵ, entonces el valor de ݔ࢏૚= 1para cada valor i.

Por convención se asume que el vector x determina el coeficiente del vector b. usualmente, se estima sobre la observación básica del comportamiento de impago2_{. Imagine que se recolecta los}

datos anuales de las empresas donde está el valor de cada variable explicativa y el comportamiento de impago. Esto se muestra en el grafico de datos de la tabla 1.13_.

Tabla 1.1 grafico de Probabilidad de Scoring

Si una misma empresa puede mostrar más de una vez entonces existe información sobre esta empresa por varios años. Sobre los impagos, si la empresa está por varios años en la categoría de impago; en este caso no se puede usar la observación de los siguientes años en que ocurrió el impago, si una empresa sale de la situación de impago entonces se puede incluir de nuevo al conjunto de datos de la muestra.

La información de Impago es guardado dentro de una variable ݕ࢏entonces tomara el valor de 1 si la empresa está en la situación de impago al siguiente año en que se ha recolectado el valor de la variable y se considerara cero si ocurre el caso contrario. De todas maneras el número de observaciones de la muestra es denotado por N.

El objetivo de un modelo de credit Scoring es predecir la alta probabilidad de impago para aquellas empresas que se encuentran en impago y una baja probabilidad para aquellas que no están. Para seleccionar el coeficiente apropiado de b, primero necesitamos juntar el score con la probabilidad de impago. Esto es realizado con la representación de la probabilidad de impago como una función de escore F.

ܲݎ݋ܾሺܦ݂݁ܽݑ݈ݐ௜ሻ=ܨ(ݏܿ݋ݎ݁ݏ௜) …(1.3)

El score de la función F se debe encontrar entre los intervalos de 0 hasta 1, esto creara un campo de una probabilidad de impago para cada posible escore. Este requerimiento puede ser completado por una función de distribución de probabilidad acumulativa. La función de

2_{En un modelo cualitativo de credit scoring, es determinado por el coeficiente de cada factor.}

3_{Los datos usados para credit Scoring son usualmente datos anuales básicos. Pero uno puede también}

(5)

Modelo de riesgo de crédito

My RISK

distribución que se considera para este propósito es la distribución logística distribución logística ߉ሺݖሻ es definido como

ecuación (1.3) se obtiene:

ܲݎ݋ܾሺܦ݂݁ܽݑ݈ݐ௜ሻൌ

El modelo que une la información con probabilidades es una función de distribución logística que se llama modelos logit.

En la tabla 1.2, demostramos la probabilidad relación existe con el grafico. Com

probabilidad de impago. En pocas instituciones financieras el credit Scoring opuesta: los prestatarios de altos montos tienen el más bajo

encuentran frecuentemente co

100. La preferencia para cualquier característica puede ser fácilmente ecuación (1.4) que define un sistema de credit scoring con scores de

trabajar con scores de 0 hasta 100 esta vez (100 es el mejor), se puede transformar el score original utilizando la formula mi

Tabla 1.2 score y probabilidad de impago mediante el

Habiendo recolectado los valores de la variables manera de estimar el coeficiente

acuerdo al principio de ML, los coeficientes seleccionados como una

son maximizados como un comportamiento de impago dado dentro de la muestra observada El primer paso para estimar la máxima probabilidad es mostrar una función de máxima probabilidad. Para un prestatario que está en Impago (

Modelo de riesgo de crédito

distribución que se considera para este propósito es la distribución logística es definido como ߉ሺݖሻൌሺݖሻȀሺͳ൅ሺݖሻሻ ሻൌ߉ሺݏܿ݋ݎ݁ݏ௜ሻൌ_ͳ൅ሺ܊Ʋሺ܊Ʋܠܑሻ_ܠ

ܑሻൌ

ͳ

ͳ൅ሺെ܊Ʋܠܑ

El modelo que une la información con probabilidades es una función de distribución logística que mos la probabilidad de default asociada como algún score e ilustramos con el grafico. Como se puede ver, el score alto corresponde

probabilidad de impago. En pocas instituciones financieras el credit Scoring tiene una propied de altos montos tienen el más bajo riesgo de crédito. En

frecuentemente contrastados para un conjunto de intervalos, por para cualquier característica puede ser fácilmente encontrada

ecuación (1.4) que define un sistema de credit scoring con scores de -9 hasta 1 pero si deseamos e 0 hasta 100 esta vez (100 es el mejor), se puede transformar el score

miscore=-10 x score +10.

score y probabilidad de impago mediante el modelo de logit

Habiendo recolectado los valores de la variables x y escogiendo la función de distribución manera de estimar el coeficiente b es utilizando el método de máxima verosimilitud

do al principio de ML, los coeficientes seleccionados como una probabilidad (=verosimilitud) un comportamiento de impago dado dentro de la muestra observada El primer paso para estimar la máxima probabilidad es mostrar una función de máxima probabilidad. Para un prestatario que está en Impago (ݕ௜ൌͳሻ su probabilidad observada es:

Página 5

distribución que se considera para este propósito es la distribución logística. La función de

ሺሻሻ. Aplicando para la

ܑሻǥሺͳǤͶሻ

El modelo que une la información con probabilidades es una función de distribución logística que de default asociada como algún score e ilustramos la o se puede ver, el score alto corresponde para una alta tiene una propiedad riesgo de crédito. Entonces se por ejemplo de 0 hasta encontrada. Si utilizamos la 9 hasta 1 pero si deseamos e 0 hasta 100 esta vez (100 es el mejor), se puede transformar el score

modelo de logit

y escogiendo la función de distribución F una el método de máxima verosimilitud (ML). De probabilidad (=verosimilitud) un comportamiento de impago dado dentro de la muestra observada. El primer paso para estimar la máxima probabilidad es mostrar una función de máxima

(6)

My RISK Página 6 ܲݎ݋ܾሺܦ݂݁ܽݑ݈ݐ௜ሻ=߉ሺܾ´࢞௜ሻ … (1.5)

Para los prestatarios que no están en la situación de impago (ݕ௜= 0) su probabilidad observada es:

ܲݎ݋ܾሺ݊݋݅݉݌ܽ݃݋௜ሻ= 1 - ߉ሺܾ´࢞௜ሻ … (1.6)

Podemos combinar las dos ecuaciones dentro de una sola formula que generara automáticamente la probabilidad correcta de Impago o no impago. Donde cualquier número incrementara la potencia de 0 para evaluar 1. La probabilidad de la i-esima observación es descrita por la siguiente ecuación:

ܮ௜=൫߉ሺܾ´࢞௜ሻ൯௬೔(1 - ߉ሺܾ´࢞௜ሻ)ଵି௬೔ … (1.7)

Asumiendo que los impagos son independientes, la probabilidad de observación en conjunto es el producto de la probabilidad individual4

ܮ=ς ܮே _௜

௜ୀଵ =ς ൫߉ሺܾே௜ୀଵ ´࢞௜ሻ൯௬೔(1 - ߉ሺܾ´࢞௜ሻ)ଵି௬೔ … (1.8)

Para propósitos de maximización es más conveniente examinar ݈݊ܮ que es logaritmo de la probabilidad.

݈݊ܮ=σ ݕே௜ୀ௡ _௜ln൫߉ሺ࢈´࢞࢏ሻ൯+ (1 - ݕ௜)ln(1 - ߉ሺ࢈´࢞࢏ሻ) … (1.9)

Se puede maximizar mediante su primera derivada con respecto para b. Esta derivada (como b es un vector) es descrito en la siguiente ecuación:

݈݀݊ܮ

݀܊=෍(

ே ௜ୀଵ

ݕ௜- ߉ሺ܊´ܠ௜ሻ)ܠ୧… (1.10)

El método Newton hace un buen trabajo en resolver la ecuación (1.10) con respecto para b, para aplicar este método se necesita la segunda derivada que se representa en la siguiente ecuación:

݀ଶ_݈_݊ܮ

݀܊݀܊´= - ෍ ߉ሺ܊´ܠ࢏ሻ(

ே ௜ୀଵ

ݕ௜- ߉ሺ܊´ܠܑሻ)ܠ୧… (1.11)

ESTIMACION DE LOS COEFICIENTES

El primer argumento especificado es el rango de la variable dependiente, que es nuestro caso es el indicador de impago ݕ, el segundo parámetro especificado es el rango de la variable explicativa(s). Antes de profundizar en los códigos veremos de como la función trabaja sobre un ejemplo de datos5_{. Nosotros hemos recogido la información de impago y 5 variables para la predicción de}

4_{Dado que hay años en que el ratio de impago es alto, y otras en que es bajo, podemos admitir si el}

supuesto independiente es apropiado que el factor que ingresamos dentro de la fluctuación de score promedio es el riesgo de impago.

(7)

Modelo de riesgo de crédito

My RISK Página 7

Impago: Capital de trabajo (CT), Utilidades Neta (Utilidad Neta), Ingresos antes de Impuestos e Intereses (EBIT) y Ventas (V), cada uno dividido por el Total de Activos (TA); Deuda en al sistema financiero (ME) dividido por el Total de Patrimonio (TP). Excepto por el valor del mercado todos estos ítem son encontrados en una hoja de balance y el estado de ingresos de la compañía. El valor de mercado es dado por el número es la sumatoria de todas las deudas pendientes con el sistema financiero. Los cinco ratios son aquellos que son conocidos extensamente como Z-score desarrollado por Alman (1968) CT/TA captura la liquidez de la empresa, UN/TA mide los beneficios actuales e históricos, respectivamente. V/TA mide la situación competitiva de la empresa y ME/TP es una medida de mercado en base al patrimonio.

Claro, uno puede considerar otras variables como bueno; para mencionar solo a pocos, estos pueden ser: el flujo de caja sobre los servicios de la deuda, ventas sobre el total de activos (como una medida de aproximación de mercado), volatilidad de la ganancia, la volatilidad del precio de la deuda. También hay varios caminos para capturar un factor de relieve. Los beneficios en un momento puede ser medidos usando EBIT, EBITDA (=EBIT mas depreciación del amortización) o el ingreso neto.

En la tabla 1.3 los datos son ordenados en función al ID de la Empresa y los años requeridos para la estimación. La variable default de la función LOGIT usa todo el rango de datos que han sido introducidos; la constante (si es incluido) aparece como la variable ܥ. Para interpretar el signo de los coeficientes se dice que un alto score corresponde para una alta probabilidad de impago. El signo negativo de los coeficientes. Por ejemplo para EBIT/TA significa que a una baja probabilidad de impago entonces el beneficio se incrementara.

Tabla 1.3 Aplicación de un comando LOGIT sobre los datos con información sobre default como cinco ratios financieros.

(8)

My RISK

La estimación de un modelo estándar adecuada organización de datos.

mostrado en la primera derivada, para resolver este problema se utiliza el Para este proceso se requiere

del vector b; la primera derivada del log ecuación (1.10); la segunda derivada ( conduce a la siguiente regla:

ܾଵൌܾ଴െ

El modelo logit tiene la característica que la función de log Una vez que encontramos las raíces pa

encontrado el máximo global de una función Comúnmente se utiliza los valores iníci una constante, mientras los ot

una sola constante se tiene la mejor predicció promedio de ratios de impago

promedio del indicador de impago

la constante ܾଵ igual a ݕത porque el modelo de

solamente tiene una constante sino mas bien se estima de que aplicar la inversa de la función de distribución logística.

La estimación de un modelo estándar de credit scoring se puede modificar en función de datos. La función LOGIT maximiza el log de probabilidad mostrado en la primera derivada, para resolver este problema se utiliza el

Para este proceso se requiere: un conjunto de valores iníciales para los parámetros no conocidos ; la primera derivada del log – probabilidad (la gradiente del vector

ecuación (1.10); la segunda derivada (la matriz hessiana H () dado en (1.11)). El método de newton

െቂ_ௗ௕ௗమ௟௡௅ భௗ௕బƲቃ ିଵௗ௟௡௅ ௗ௕బൌܾ଴െܪሺܾ଴ሻ ିଵ_݃ሺܾ ଴ሻ …(1,12)

t tiene la característica que la función de log- probabilidad es globalmente cón las raíces para la primera derivada, podemos estar seguros que se ha encontrado el máximo global de una función log - probabilidad.

valores iníciales para establecer la constante y el modelo contiene solo una constante, mientras los otros coeficientes establecen en 0 (Principio de ceteris Paribus

a mejor predicción de una probabilidad de impago

ratios de impago, que se denota por ݕത; esto puede ser computarizado como el valor ndicador de impago de la variable ݕ. Tome en cuenta que no deberíamos establecer

തporque el modelo de probabilidad de impago solamente tiene una constante sino mas bien se estima de ߉ሺܾଵሻ. Para llegar al

la inversa de la función de distribución logística.

߉ିଵ_ሺݕ_തሻൌ_ሺݕ_ത_Ȁሺͳെݕ_തሻ_…(1.13)

Página 8

icar en función de una el log de probabilidad que es mostrado en la primera derivada, para resolver este problema se utiliza el método de newton. para los parámetros no conocidos (la gradiente del vector ()) dado en la )). El método de newton …(1,12)

es globalmente cóncava. ar seguros que se ha el modelo contiene solo

Principio de ceteris Paribus). Con

n de una probabilidad de impago individual que es el ; esto puede ser computarizado como el valor Tome en cuenta que no deberíamos establecer con una constante llegar al objetivo tenemos

(9)

Modelo de riesgo de crédito

My RISK Página 9

Para comprobar que se llega al resultado deseado se examina la predicción de impago de un modelo logit con solo una constante que es mostrado en (1.13):

ܲݎ݋ܾሺݕ= 1ሻ= ߉ሺ܊૚ሻ=_{1 + exp (-}1 _܊ ૚)=

1

1 + exp (- ln (ݕത /(1 - ݕത))) =_{1 + (1 -}1 _ݕ_ത₎_Τ_ݕ_ത=ݕത…ሺ1.14ሻ

Cuando iniciamos el vector de coeficientes (denotado por b en la función), cuando se necesite después podemos iniciar los escores (denotado por bx). Inicialmente se fija cada coeficiente excepto la constante cero. BX es igual a la constante es este escenario. (recuerde que la primera constante es el primer elemento del vector b).

Por conveniencia se resume en las siguientes formulas claves.

ܮܾܽ݉݀ܽ=߉ሺ࢈´࢞࢏ሻ= 1 (1 + expΤ ሺ- ܊´ܠܑሻ) ݈݈݀݊=෍ y୧- ?ሺ܊´ܠܑሻܠܑ ே ௜ୀଵ ܪ݁ݏݏ݅ܽ݊= - ෍ ߉ሺ࢈´࢞࢏ሻ൫1 - ߉ሺ࢈´࢞࢏ሻ൯ܠܑܠ´ܑ ே ௜ୀଵ ݈݈݊=෍ y୧ln ( ே ௜ୀଵ ߉ሺ܊´ܠܑሻ) +ሺ1 - y୧ሻln (1 - ߉ሺ܊´ܠܑሻ)

CALCULO DE ESTADISTICOS DESPUES DE LA SIMULACION DEL MODELO

En esta sección se muestra de cómo los estadísticos de la regresión son calculados dentro de la función Logit.

Para evaluar si una variable ayuda a explicar los eventos de impago, se examina el ratio t para la hipótesis que el coeficiente de la variable es cero. Para el j-esimo coeficiente el ratio t es construido como:

ݐ௝=ܾ௝/ܵܧ൫ܾ௝൯…(1.15)

Donde SE es el error estándar estimado de los coeficientes que toma b de la última iteración de Newton y el error estándar estimado de los parámetros son divididos por la matriz Hessiana. En el modelo Logit los ratios t no responden a una distribución t como en el modelo clásico regresión lineal. Más bien es comparado con una distribución normal estándar. Para obtener el p-valué de un test de dos colas, nosotros exploramos la simetría de una distribución normal.

(10)

My RISK

En un modelo de regresión lineal se reporta En modelos no lineales que se estima por reporta el Pseudo-ܴଶ_{sugerido por McFadden} función log-probabilidad.

݌ݏ݁ݑ݀݋

Se resume el resultado de la función LOGIT

Tabla 1.4 resultado de las funciones definidas del LOGIT

PREDICCION Y ANALISIS DE ESCENARIO

Teniendo especificado un modelo de scoring y deseamos utilizar

impago. Primero se calcula el score de impago (Ecuación (1.1) y (1.4))

ܲݎ݋ܾሺ݂݀݁ܽݑ݈ݐ

En la tabla 1.7, se calcula la probabilidad de impago predecir solo necesitan los coeficientes.

Tabla 1.7 predic

6_{Note que la aplicación de la ecuación (1.20) mide el significado de la probabilidad de}

representa la población.

lineal se reporta un ܴଶ_{como una medida de todos los mejores ajustes} que se estima por el método de máxima probabilidad u

sugerido por McFadden. Esto es calculado como 1 mejores

݌ݏ݁ݑ݀݋െܴଶ_ൌͳെ_ܮȀ_ܮ

଴ …(1.17) el resultado de la función LOGIT en la siguiente tabla 1.4.

Tabla 1.4 resultado de las funciones definidas del LOGIT

PREDICCION Y ANALISIS DE ESCENARIO

o un modelo de scoring y deseamos utilizar para predecir l score y después este cálculo se traduce en un valor (1.4))6_.

݂݀݁ܽݑ݈ݐ௜ሻൌ߉ሺݏܿ݋ݎ݁௜ሻൌ߉ሺ࢈Ʋ࢞࢏ሻൌ_{ଵାୣ୶୮}ଵ_ሺି࢈Ʋ_࢞_࢏_ሻ…(1.20)

probabilidad de impago en base al modelo y a los cinco ratios. Para predecir solo necesitan los coeficientes.

Tabla 1.7 prediciendo la probabilidad de Impago

Note que la aplicación de la ecuación (1.20) mide el significado de la probabilidad de

Página 10

da de todos los mejores ajustes. el método de máxima probabilidad usualmente se . Esto es calculado como 1 mejores ratios de la

para predecir probabilidades de

después este cálculo se traduce en un valor de probabilidad …(1.20)

en base al modelo y a los cinco ratios. Para

(11)

Modelo de riesgo de crédito

My RISK Página 11

Conclusiones

• El razonamiento económico nos demuestra que un modelo de scoring ayuda a predecir la probabilidad de impago de un cliente determinado bajo ciertas condiciones.