LA MOROSIDAD EN LAS ENTIDADES FINANCIERAS:

Anuncio
LA MOROSIDAD EN LAS ENTIDADES FINANCIERAS:
ANÁLISIS EN LA PROVINCIA DE LEÓN
MURES QUINTANA, Mª Jesús
Departamento de Dirección y Economía de la Empresa
Universidad de León
correo-e: [email protected]
GARCÍA GALLEGO, Ana
Departamento de Dirección y Economía de la Empresa
Universidad de León
correo-e: [email protected]
VALLEJO PASCUAL, M. Eva
Departamento de Dirección y Economía de la Empresa
Universidad de León
correo-e: [email protected]
RESUMEN
El riesgo, que es inherente a toda actividad económica, se convierte, en el caso
de las entidades financieras, en un elemento esencial, dadas las características del
negocio que desarrollan, debiendo hacer frente a un conjunto de riesgos, entre los que
destaca el de crédito. Con el fin de valorar la morosidad, como forma de manifestación
de dicho riesgo, se ha realizado un estudio empírico en la provincia de León, en el que
se ha aplicado la técnica de regresión logística, mediante la cual se determinan los
factores que influyen en el comportamiento de pago de los clientes.
Palabras clave: Riesgo de crédito, morosidad, regresión logística.
INTRODUCCIÓN
El desarrollo de cualquier actividad empresarial lleva implícita la asunción de un
determinado conjunto de riesgos, dado el entorno económico actual al que se enfrentan
las empresas. Entendiendo por riesgo, en términos generales, la variabilidad del
beneficio esperado o pérdida de valor económico, en el ámbito de la empresa se pueden
encontrar distintos tipos de riesgo, a los que, en el caso de las entidades financieras o de
crédito, se añaden otro conjunto de riesgos adicionales, que se pueden calificar como
propios de la actividad que desarrollan, de los cuales el riesgo de crédito es el más
importante al que deben hacer frente dichas entidades.
En esta línea, el objetivo de nuestro estudio se centra en el análisis y evaluación de la
morosidad, como una de las formas de manifestación del riesgo de crédito, para lo cual
el presente trabajo comienza con una referencia a la evolución que han seguido los
métodos aplicados en la valoración del riesgo por parte de la entidades financieras, y, en
concreto, en cuanto a dicho riesgo, para desarrollar, a continuación, la técnica de
regresión logística, que es la metodología aplicada en el análisis de la morosidad. Un
último apartado se dedica al riesgo en las entidades financieras, con especial referencia
al de crédito, que se estudia de forma empírica en entidades financieras de la provincia
de León, mediante la aplicación de la técnica anterior a una muestra de clientes de las
mismas, con el fin de determinar las variables que influyen en su comportamiento de
pago, finalizando el trabajo con las conclusiones más relevantes extraídas del mismo.
1. VALORACIÓN DEL RIESGO DE CRÉDITO:
EVOLUCIÓN Y MÉTODOS
Tradicionalmente, la palabra “riesgo” ha tenido, en todas las actividades
económicas, y muy especialmente en las entidades financieras, una connotación
claramente negativa, de ahí que la gestión empresarial se haya caracterizado por la
aversión a la asunción de riesgos por parte de los gestores, quienes tomaban la mayoría
de decisiones tratando de evitar o minimizar cualquier tipo de riesgo, lo que era posible
por la existencia de un entorno caracterizado por una reducida competitividad,
economías cerradas y fuerte proteccionismo de los estados a sus empresas.
En este contexto, el riesgo se contemplaba como una perturbación del normal desarrollo
de la actividad financiera, algo negativo pero inevitable y que, en consecuencia, había
2
que controlar y limitar en la mayor medida posible. Así, en el caso del riesgo de crédito,
los esfuerzos se centraban claramente en intentar distinguir los buenos clientes, los que
devolverían el crédito, de los malos, que no lo harían, interpretándose la morosidad
como una medida fundamental de la calidad del crédito, en cuanto que refleja el nivel de
acierto de la entidad en la selección de sus clientes y en la solución de aquéllos que
resultaron problemáticos. Aún más, riesgo se utilizaba a menudo como sinónimo de
operación.
Sin embargo, la corriente liberalizadora y de competitividad empresarial que se ha
producido, ha convertido el riesgo en rasgo principal de las empresas, haciendo
imposible la estrategia de aversión al riesgo, característica de la gestión empresarial
tradicional. El riesgo en un factor esencial que hay que gestionar de forma adecuada
para obtener una rentabilidad acorde con el nivel de riesgo que se asume, constituyendo
ambos elementos, junto con la solvencia, los tres ejes de la gestión en el ámbito de las
entidades financieras.
Por tanto, se acepta la adecuada gestión del riesgo como elemento fundamental de la
actividad financiera, surgiendo la necesidad de tipificar, cuantificar y controlar los
distintos tipos de riesgos a los que se enfrentan las entidades financieras en el desarrollo
de su actividad, para lo cual se plantean distintas formas o métodos de llevar a cabo esa
gestión.
Las técnicas utilizadas en la valoración del riesgo de crédito eran, en sus inicios, de
corte univariante, contemplando el riesgo en función de una única variable, o de
considerar varias, analizando cada variable por separado. No obstante, la asunción de
riesgos depende de múltiples factores, por lo que las técnicas evolucionaron hacia
modelos que incluyen una combinación de variables.
Dentro de estos modelos de tipo multivariante, podemos distinguir aquéllos de
carácter subjetivo, basados en el criterio y juicio de analistas expertos, quienes
proceden a evaluar el riesgo de crédito y a tomar decisiones al respecto, sobre la base de
sus conocimientos y experiencias acumuladas a través de años de trabajo.
No obstante, el hecho de que varios analistas, a partir de idénticos elementos o factores,
no puedan producir las mismas decisiones, sustenta la idea de que el criterio subjetivo
de evaluación puede ser inconsistente e inestable, lo que hace necesaria la introducción
de modelos objetivos de evaluación, basados en métodos estadísticos, que permiten la
3
uniformidad de las evaluaciones y evitan cualquier irregularidad resultante de una
evaluación efectuada por uno u otro analista, ya que los mismos hechos producirán
idénticos resultados cada vez que se apliquen, independientemente de quien utilice
dichos métodos.
Todas estas herramientas cuantitativas de medición del riesgo de crédito y, por tanto, los
sistemas de control del riesgo, reposan sobre dos piezas básicas, como son el scoring y
el rating, que permiten calificar el riesgo mediante una puntuación o una clasificación
en grupos de riesgo, y que utilizan técnicas estadísticas como el análisis discriminante o
los modelos de probabilidad condicionada, como el probit o logit.
Así pues, queda justificada la utilización de métodos estadísticos en la valoración del
riesgo de crédito, de los cuales hemos aplicado, en el estudio empírico realizado, el
análisis de regresión logística, dadas las características de la variable objeto de estudio,
que es cualitativa dicotómica o binaria, cuyas modalidades son la morosidad o no de un
conjunto de clientes de entidades financieras.
2. METODOLOGÍA: ANÁLISIS DE REGRESIÓN
LOGÍSTICA
Puesto que la metodología aplicada en el estudio empírico es el análisis de
regresión logística, a continuación vamos a desarrollar dicha técnica, describiendo los
aspectos teóricos más relevantes de la misma.
2.1 EL MODELO DE REGRESIÓN LOGÍSTICA
Dentro de las técnicas de predicción o dependencia, que analizan el
comportamiento de una variable dependiente a partir de una serie de variables
independientes, uno de los métodos más utilizados es el análisis de regresión, cuya
aplicación exige el cumplimiento de unos supuestos básicos, en relación con el modelo
y las variables incluidas en él, como el carácter métrico y continuo de la variable
dependiente.
Sin embargo, a menudo se dan, fundamentalmente en el campo económico, fenómenos
que consisten en elegir entre un conjunto de alternativas posibles o en clasificar una
serie de individuos en varios grupos, que no pueden representarse mediante una variable
dependiente continua, lo que obliga a formular modelos específicos para este tipo de
situaciones. De esta forma, surgen los denominados modelos lineales generalizados,
4
como alternativa al análisis de regresión cuando la variable dependiente no es continua,
que modelizan la probabilidad de ocurrencia de un suceso, y utilizan distintas funciones,
según sea el tipo de datos a analizar: si son binarios o dicotómicos (con dos categorías),
categóricos (con más de dos) o discretos (variables de recuento).
2.1.1 Formulación del modelo
Cuando la variable dependiente es dicotómica o binaria, como ocurre en el caso
que analizamos, en el que se considera como variable a explicar la morosidad o no de
un cliente, las dos modalidades de la variable vienen representadas por los valores uno y
cero, que se interpretan como la ocurrencia y no ocurrencia del acontecimiento,
respectivamente, por lo que se denominan también éxito y fracaso.
Puesto que los modelos lineales generalizados modelizan la probabilidad de ocurrencia
de un acontecimiento, en el caso de una variable dependiente dicotómica, permiten
determinar la proporción de individuos que presentan la modalidad uno de dicha
variable, es decir, la probabilidad de éxito, que se expresa como:
i  P( yi )  P( y  1/ x  xi )
por lo que: E( y / xi )  i 1  (1  i ) 0  i
,,
,,
i 1, 2n
i 1, 2n .
Si se quiere estimar el valor de la probabilidad, se puede expresar la variable
dependiente como una función de las variables independientes, para lo cual se pueden
elegir distintos tipos de modelos, de entre los cuales se selecciona el modelo que
constituye la base del análisis de regresión logística.
Una primera posibilidad es considerar el modelo clásico de regresión lineal, que da
lugar al modelo lineal de probabilidad, pues la relación que se establece entre las
variables es lineal:
yi  0  1 x1i   2 x2i     k xki   i
o en forma matricial:
y  X  
y por lo tanto:
E ( y )  X
Lo que sucede es que estamos estimando una probabilidad, que debe tomar valores entre
cero y uno, y el valor estimado a partir del modelo yˆ  Xˆ no garantiza que se verifique
dicha restricción, pudiendo dar valores negativos o superiores a uno, por lo que se
5
considera el modelo de probabilidad lineal truncado, que restringe los valores
estimados al intervalo cerouno:
si X  0
0

   X si 0  X  1
1
si X  1

Sin embargo, esta solución no es satisfactoria, ya que una pequeña variación del valor
de las variables independientes produce en los extremos un salto muy grande, y esa
discontinuidad provoca que la estimación del modelo sea inestable.
Ello obliga a buscar otros modelos, como el denominado modelo probit, que utiliza la
función de distribución normal estándar:
1 X  12 z 2
   X 
e dz
2 
Debido a su mayor facilidad de cálculo y a su interpretación más directa, es de mayor
aplicación en el análisis de variables dicotómicas el modelo logit o de regresión
logística, que aplica la función de distribución logística:
( X) 
eX
1

X
1 e
1  e X
Basándonos en estas consideraciones, el modelo de regresión logística o logit puede
formularse en términos de probabilidad, a través de la función logística, como:
i 
e0 1x1i 2 x2i k xki
  x  x k xki
1  e 0 1 1i 2 2i

1
1 e
(0 1x1i 2 x2i k xki )
,, i  1 , 2  n
que estima la probabilidad de que se produzca el evento o de que un individuo elija la
opción uno, dados determinados valores de las variables explicativas, aunque tiene el
inconveniente de que no es lineal respecto a las variables independientes.
Por tanto, se trata de buscar una expresión del modelo como una función lineal de las
variables explicativas, lo que facilita su interpretación, y esto se consigue mediante la
inversa de la función logística, que es el logit o logaritmo de la odds o ventaja de que un
suceso ocurra, y se interpreta como la preferencia de elegir la alternativa uno de la
variable respuesta, frente a la alternativa cero:
  
logit i   ln  i   0  1 x1i   2 x2i     k xki , , i  1 , 2  n
1  i 
6
Una última expresión del modelo de regresión logística es la que estima la ventaja o
preferencia (odds) de un individuo por la modalidad uno frente a la categoría cero de la
variable dependiente, definiéndose como el cociente entre la probabilidad de que ocurra
un acontecimiento y la probabilidad de que no ocurra, que es su complementaria:
i
 e
1 i
0  1 x1i   k xki
 e  0  e 1x1i    e  k xki  e  0 (e 1 ) x1i  (e  k ) xki
,, i  1, 2  n
2.2 ESTIMACIÓN DEL MODELO DE REGRESIÓN LOGÍSTICA
Una vez formulado el modelo de regresión logística, es preciso estimar los
parámetros del mismo, para determinar la probabilidad de que acontezca el suceso.
Como la variable dependiente es dicotómica, los errores no se distribuyen normalmente,
por lo que no puede aplicarse el método de mínimos cuadrados y es preciso acudir al
método de máxima verosimilitud, que permite estimar el valor de los parámetros
desconocidos que maximizan la probabilidad de obtener el conjunto de observaciones,
esto es, la función de verosimilitud, que se define a partir de la contribución de las
observaciones a dicha función:
n
L()  P( y1 , y2  yn )   i i (1  i )
y
1 y
i
i 1
Dado que este método permite obtener estimaciones de los coeficientes j que
maximizan la función de verosimilitud, hay que derivar dicha función respecto a los
parámetros, obteniéndose un conjunto de (k+1) ecuaciones, que se denominan
ecuaciones de verosimilitud y cuya expresión es la siguiente:
n
 [ yi   i ]  0
i 1
n
 xij[ yi  i ]  0
,,
j 1, 2k
i 1
Sustituyendo el valor de las probabilidades en función de los parámetros de interés, ,
las ecuaciones de verosimilitud resultan en la siguiente expresión:

 y i xi   
n
i 1
n

x

ˆ i xi


i
 x ˆ
i 1  1  e i 
i 1
n
1
de la que se obtiene el denominado vector de estimadores de máxima verosimilitud:
ˆ  ( X VX ) 1 X Vy *
7
donde: y *  Xˆ  V 1 ( y  ˆ ) y siendo X la matriz que contiene los datos de las k
variables explicativas para cada elemento, incluido el término constante, y V la varianza
estimada de los valores observados, que es una matriz diagonal de orden n y cuyo
elemento general es el producto de las probabilidades complementarias estimadas ˆ i 1  ˆ i  .
Además del método de máxima verosimilitud, existen otros métodos alternativos para
estimar el valor de los parámetros, entre los que puede citarse el método iterativo de
mínimos cuadrados ponderados, análogo al anterior, así como el método de mínimos
cuadrados ponderados no iterativo y el de análisis de la función discriminante, si bien
presentan algunos inconvenientes que limitan su aplicación.
2.3 INTERPRETACIÓN DEL MODELO DE REGRESIÓN LOGÍSTICA
Como hemos expuesto, mediante el análisis de regresión logística se trata de
determinar la probabilidad de que un evento concreto ocurra, en función de los valores
observados para las variables independientes y de los coeficientes estimados por el
modelo. Una vez estimado el valor de los parámetros, es necesario proceder a su
interpretación, indicando el significado que tiene cada coeficiente en dicha probabilidad.
En el modelo de regresión logística, al ser la variable dependiente categórica, el efecto
de la probabilidad no es lineal, sino que varía con el valor de la variable independiente,
por lo que es preciso expresar la variable dependiente como una función lineal de las
variables independientes, lo que se consigue a partir de la transformación logit del
modelo:
 ( x) 
logit[ ( x)]  ln 
   0  1 x1     k xk
1  ( x) 
Esta expresión del modelo facilita la interpretación de los coeficientes de regresión
logística, asimilándose a los de regresión lineal. De esta forma, se interpretan los
parámetros del modelo como el efecto lineal de cambio de una unidad en una variable
independiente en el logaritmo de la razón de probabilidades de un suceso, esto es, cada
coeficiente refleja el cambio en el logit correspondiente a un cambio unitario en la
variable independiente considerada.
Ese cambio en el logit se interpreta mediante la introducción de una medida de
asociación, denominada odds ratio o cociente de ventajas, que se define como la razón
de la odds o ventaja de la probabilidad de ocurrencia de un suceso para un determinado
8
valor de la variable respecto a la odds para otro valor de la misma, y que indica cuánto
más probable (o improbable) es que ocurra el suceso que se analiza entre los individuos
que presentan cada categoría de la variable independiente (xj), esto es:
ˆ

x1 , x0
π̂( x1 )
odds( x1 ) 1  π̂( x1 )
β̂ ( x  x )


e j 1 0
π̂
(
x
)
odds( x0 )
0
1  π̂( x0 )
La odds ratio es, normalmente, el parámetro de interés en regresión logística por su
facilidad de interpretación, pero, debido a que su estimación tiene una distribución
 
ˆ  ˆ ,
asimétrica, las inferencias realizadas se basan en la distribución muestral de ln 
j
que tiende a seguir una distribución normal.
La distinta naturaleza y escala de medida de las variables independientes incluidas en el
modelo de regresión logística, que pueden ser continuas o categóricas, con dos
(dicotómicas) o más (politómicas) categorías, conlleva singularidades en cuanto a la
interpretación de los coeficientes del modelo, por lo que vamos a considerar la
interpretación de los parámetros para cada una de las posibles escalas de medida de las
variables independientes.
 Si se analiza el efecto de una variable independiente dicotómica, codificada
 
ˆ  exp ˆ , por lo que el
con los valores cero y uno, la odds ratio viene dada por: 
1, 0
j
logaritmo de la odds ratio es igual al coeficiente estimado. En este caso, la odds ratio
mide cuánto más probable es que se presente el evento entre aquellos sujetos para los
que la variable toma el valor uno, que entre aquéllos con valor cero. No obstante,
pueden utilizarse otras formas de codificación, que influyen en el cálculo de la odds


ˆ  exp ˆ (a  b) , donde a y b son los
ratio estimada, siendo su expresión general: 
a,b
j
valores que representan cada una de las categorías.
 En el caso de una variable independiente politómica con q categorías, para
su incorporación en el modelo, se construyen (q1) variables ficticias, que son
variables dicotómicas cerouno, por lo que estamos ante el mismo caso que el
anterior, si bien, la odds ratio representa, en este tipo de variables, el factor de
cambio en la odds o ventaja de que ocurra el suceso cuando el sujeto pertenece a la
categoría representada por la correspondiente variable ficticia frente al hecho de que
9
el individuo pertenezca a la categoría de referencia, que suele ser la primera
modalidad de la variable categórica original.
 Cuando se trata de una variable explicativa continua, la odds ratio se
interpreta como la variación en la odds de que ocurra el evento ante un cambio
unitario en la variable, aunque en muchas variables independientes de tipo continuo
que se incluyen en los modelos de regresión logística, es más relevante empíricamente
considerar la influencia de un cambio de c unidades en la variable, siendo la odds
 
ˆ
ratio asociada: 
 exp cˆ j .
x c, x
j
j
2.4 EVALUACIÓN DEL MODELO DE REGRESIÓN LOGÍSTICA
El siguiente paso en el análisis del modelo de regresión logística es la evaluación
del mismo, al objeto de comprobar si las variables explicativas que se incluyen en el
modelo están significativamente relacionadas con la variable respuesta, y de valorar la
bondad y capacidad global del modelo para predecir adecuadamente el comportamiento
de la variable dependiente.
2.4.1 Significación individual de los coeficientes de regresión logística
En primer lugar, se procede a valorar la significación individual de cada variable
explicativa, lo que se realiza mediante la comparación de los valores observados y los
estimados a partir del modelo, tomando como base el logaritmo de la función de
verosimilitud; en concreto, a partir del cociente entre las funciones de verosimilitud del
modelo estimado y de un modelo saturado, que es aquél que contiene todos los
parámetros posibles y, por tanto, ajusta perfectamente a los datos, obteniéndose el
estadístico D, que se denomina deviance (o desvianza).
Planteado el objetivo de valorar la significación de una variable independiente, se
compara el valor del estadístico D para los modelos con y sin la variable incluida en la
ecuación, obteniéndose el estadístico G ó cambio en la deviance debido a la inclusión
de una variable explicativa en el modelo, que también se denomina 2 del modelo, ya
que, bajo la hipótesis nula de que el coeficiente de la variable explicativa cuya
significatividad se trata de evaluar, j, es cero, sigue una distribución 2 con un grado de
libertad, que resulta de la diferencia de grados correspondientes a los dos modelos.
 Verosimili tud sin la variable 
G  2 ln 
 Verosimili tud con la variable 
10
Además del estadístico de cambio en la razón de verosimilitud, se han desarrollado
otros tests similares, estadísticamente equivalentes, como los tests de Wald o de Store.
El primero se define como el cuadrado del cociente entre el estimador de máxima
verosimilitud del parámetro, β̂ j , y una estimación de su desviación típica, obtenida a
partir de la matriz de varianzascovarianzas, para contrastar la hipótesis nula
H 0 : ˆ j  0 , frente a la alternativa: H1 : ˆ j  0 :
2
 ˆ 
Wj   j  ~  2
ˆ ˆ
 S ( j ) 
con uno ó q1 grados de libertad, para variables categóricas con q modalidades.
Por su parte, el test de Score o estadístico de puntuación de Rao se basa en la
distribución de las derivadas del logaritmo de la función de verosimilitud, siendo su
expresión:
n
STj 
 x ji ( yi  y )
i 1
~ N (0 , 1)
n
y (1  y ) ( x ji  x )
2
i 1
Otro modo de evaluar la significatividad de los coeficientes de regresión logística es a
través del estadístico RA de Atkinson, que mide la correlación parcial entre cada variable
independiente y la variable dependiente:


2
W j  2k
ˆ j Sˆ (ˆ j )  2k
RA  

 2 ln L(ˆ 0 )
 2 ln L(ˆ 0 )
donde Wj es el estadístico de Wald, k el número de parámetros estimados y L(ˆ 0 ) la
función de verosimilitud del modelo que contiene sólo el término independiente o
constante, y tomándose el signo del coeficiente de regresión estimado.
2.4.2 Validez del modelo
Para comprobar la validez del modelo en su conjunto, se analiza la significación
global de todos los coeficientes del modelo mediante contrastes de hipótesis, y la bondad
de ajuste del mismo, a través de una serie de coeficientes y estadísticos, que permiten
analizar la adecuación y eficacia del modelo para la predicción de la variable dependiente.
11
Mediante la significación del modelo se trata de analizar si el efecto conjunto de todas
las variables independientes que se han incluido en el modelo, porque su contraste
individual ha resultado significativo y han mostrado, por tanto, su relevancia en la
predicción de la variable dependiente, es también significativo, para lo cual se utiliza el
test G ó de razón de verosimilitud, que compara la función de verosimilitud del modelo
nulo, que sólo contiene el término independiente o constante, y la del modelo estimado,
con las k variables explicativas.
A la hora de afrontar el estudio de la bondad de ajuste del modelo, se trata de analizar
las desviaciones entre los valores observados de la variable respuesta y los estimados a
partir del modelo, a través de una serie de medidas que se clasifican en tres grupos:
 las basadas en pruebas estadísticas de contraste de hipótesis, que se derivan
de la comparación directa entre los valores observados y los estimados, y entre las
que se incluyen los estadísticos Deviance y 2 de Pearson, y la prueba de Hosmer y
Lemeshow.
 las que miden la capacidad o eficacia predictiva del modelo, que se obtienen
de una tabla de clasificación, que resulta del cruce de los valores observados de la
variable dependiente con una variable dicotómica cuyos valores se derivan de las
probabilidades predichas por el modelo estimado. A partir de la tabla, se calculan una
serie de índices que permiten cuantificar el grado o capacidad de predicción del
modelo, y que se asientan, en general, en la reducción proporcional del error (PRE).
 las que son análogas al coeficiente de determinación múltiple (R2) del modelo
de regresión lineal, que se deducen de la analogía entre el logaritmo de la
 
verosimilitud del modelo nulo  2 ln L ˆ 0
y la suma de cuadrados total de la

regresión lineal, y del logaritmo de la verosimilitud del modelo estimado  2 ln L ˆ
con la suma de cuadrados residual, destacando el R2 de Cox y Snell
y el de
Nagelkerke.
2.4.3 Diagnosis del modelo
La evaluación del modelo se completa con la diagnosis o validación del mismo,
en la que se comprueba la posible existencia de datos atípicos y de observaciones
influyentes.
12
Así, al abordar la diagnosis del modelo, deben identificarse, en primer lugar, aquellos
sujetos para los cuales el modelo estimado no realiza un buen ajuste, al diferir sus
valores observados de los predichos. La detección de estos datos atípicos o outliers se
realiza mediante al análisis de los residuos del modelo, distinguiéndose los residuos
deviance, de Pearson, y los residuos de Pearson estandarizados.
Además, debe procederse también a identificar aquellas observaciones influyentes que
provocan en los coeficientes estimados y en las predicciones realizadas un efecto
desproporcionado, porque ejercen una gran influencia en el modelo. Para ello, se
consideran en primer lugar los elementos leverage, que se interpretan como una medida
de la influencia que los valores observados ejercen sobre los estimados, y otros índices
que analizan la influencia de un caso individual son aquéllos que examinan el efecto o
cambio que la eliminación de dicho sujeto tiene sobre el valor de los coeficientes
estimados y de las medidas de bondad de ajuste global, 2 de Pearson y deviance.
2.5 SELECCIÓN DE VARIABLES EXPLICATIVAS
El objetivo de todo análisis de regresión logística, como técnica incluida dentro de
los métodos de análisis de regresión, es obtener un modelo que permita explicar el
comportamiento de una variable dependiente dicotómica a partir de los valores
observados de un conjunto de variables independientes, las cuales se seleccionan desde
un punto de vista sustantivo y estadístico.
Según el criterio sustantivo, el investigador decide incluir aquellas variables que
muestran tener relación con la variable dependiente en función de la base teórica que
sustenta sus hipótesis de investigación, si bien, siguiendo el criterio estadístico, sólo
deben introducirse en el modelo aquéllas que tengan una capacidad de predicción de la
variable respuesta estadísticamente significativa. Combinando ambos criterios, se busca
un modelo parsimonioso, que, con el menor número posible de variables
independientes, presente la mejor bondad de ajuste a los datos y, por consiguiente, un
mayor poder explicativo de la variable dependiente.
En determinaciones situaciones, puede interesar la inclusión en el modelo de todas las
variables científicamente relevantes en la predicción de la variable respuesta, con
independencia de su significación estadística. En este caso, se aplica el método de
especificación confirmatoria.
13
En otras ocasiones, se busca un modelo parsimonioso que consiga el máximo poder
explicativo y la mejor bondad de ajuste a los datos, pero con el menor número posible
de variables. En este caso, hay que seleccionar, entre todas las variables posibles, un
conjunto reducido, lo que se puede realizar a través de métodos secuenciales en que las
variables se seleccionan para su inclusión o eliminación en función exclusivamente de
criterios estadísticos y dentro de los que podemos distinguir:
 Procedimientos hacia delante, que comienzan con el modelo que sólo contiene
el término constante, y se van incorporando al mismo las variables explicativas,
en función de su grado de relación con la variable dependiente y de su
significación estadística.
 Procedimientos hacia atrás, que comienzan de forma inversa a los anteriores,
es decir, todas las variables independientes se encuentran incluidas en el modelo
y se van eliminando del mismo las variables que no predicen la variable
dependiente de forma significativa.
 Procedimientos por pasos sucesivos, que resultan de la combinación de los dos
métodos anteriores, puesto que se van incorporando variables al modelo, como
en el primer procedimiento, pero a cada introducción de una variable le sigue la
comprobación de si alguna de las variables ya incluidas satisface los criterios de
eliminación, por lo que, en este método, puede eliminarse en un paso posterior,
una variable incluida en uno previo.
Otro procedimiento alternativo a los métodos secuenciales es el de todas las
regresiones posibles, que consiste en estimar todos los modelos, teniendo en cuenta las
posibles combinaciones de variables independientes, y elegir entre ellos aquél que mejor
se ajusta, según los criterios previamente establecidos.
3. LA MOROSIDAD EN LAS ENTIDADES FINANCIERAS
La técnica de regresión logística que se ha descrito en el apartado anterior, se ha
aplicado al análisis de la morosidad en las entidades financieras, por lo que vamos a
referirnos al riesgo en dichas entidades, haciendo una breve referencia a los tipos de
riesgos a que se enfrentan, y desarrollando, en mayor medida, el riesgo de crédito, que
se ha valorado empíricamente en una muestra de clientes.
3.1 EL RIESGO EN LAS ENTIDADES FINANCIERAS
14
3.1.1 Concepto y tipos de riesgo
El riesgo es inherente al mundo de los negocios y a la actividad económica,
debido a que ésta se desarrolla en un ambiente de incertidumbre, que constituye una de
las características principales del riesgo, junto con la aleatoriedad. De esta forma, surge
el riesgo como la contingencia, probabilidad o proximidad de un daño o peligro;
concretamente, supone la asunción de la posibilidad de sufrir una pérdida, y además está
asociado al conflicto, es decir, se presenta ante situaciones diferenciadas entre las cuales
es preciso elegir.
De forma más completa, el riesgo puede definirse como la exposición a la posibilidad
de pérdidas económicas y financieras, de daños en las cosas y en las personas o de otros
perjuicios como consecuencia de la incertidumbre que origina el llevar a cabo una
determinada acción. Como se observa en la definición, la incertidumbre es la
característica fundamental del riesgo, presentándose en tres aspectos:
 en cuanto a la posibilidad de que se materialice una pérdida efectiva
 sobre la cuantía de la pérdida
 sobre el instante en que puede materializarse dicha pérdida.
En un entorno de liberalización y mayor libertad de actuación empresarial, las entidades
deben asumir riesgos en su toma de decisiones, a la hora de buscar la máxima
rentabilidad. No obstante, así como el riesgo es una de las características del entorno
económico actual al que se enfrentan las empresas, en el caso de las entidades
financieras se convierte en un rasgo básico, debido a las características de su negocio,
consistente en la concesión de créditos.
Las entidades financieras asumen un riesgo cuando prestan recursos financieros –
conceden créditos–, porque, en realidad, ceden unos recursos –los depósitos– que otros
clientes, con excedentes y que buscan una rentabilidad, les han prestado, sin controlar
posteriormente el destino y la utilización de los mismos.
Por otro lado, el riesgo global en la actividad financiera resulta de la suma de distintos
tipos de riesgos:
a) Riesgo de mercado: supone la probabilidad de pérdida ante movimientos
adversos en los precios de los instrumentos financieros en los mercados donde se tengan
posiciones. En función de su causa, se distingue, a su vez: riesgo de posiciones en
15
divisas, riesgo de tipo de interés/precio, riesgo de operaciones con opciones y otros
riesgos de mercado, como riesgo de correlación, de pago anticipado y de aseguramiento.
b) Riesgo de crédito: corresponde al riesgo de pérdida que se puede producir ante
el incumplimiento de los pagos adeudados a la entidad, y que presenta las siguientes
modalidades: riesgo de contraparte o de sustitución, riesgo país, riesgo de liquidación o
entrega y riesgo de emisor.
c) Riesgo operacional y de tecnología: comprende una variedad de riesgos que se
generan como consecuencia de la posible ocurrencia de sucesos inesperados,
relacionados con la infraestructura operativa y tecnológica, tanto interna como externa,
de la entidad.
d) Riesgo de liquidez: entendiendo por liquidez la capacidad de transformar un
activo en efectivo a los precios existentes en cada momento, sin incurrir en más
pérdidas que las que, en su caso, imponga el mercado, puede definirse este riesgo como
la posibilidad de que una entidad financiera no disponga de liquidez y no pueda hacer
frente a sus compromisos vencidos.
e) Riesgo legal: incluye un conjunto diverso de riesgos debido a que un contrato
no pueda ser ejecutado en los términos previstos, comprendiendo el riesgo de
documentación, el riesgo de legislación específica de cada país y el de capacidad de las
contrapartes.
3.1.2 Riesgo de crédito
De los distintos tipos de riesgo descritos, es el riesgo de crédito el más
importante al que debe hacer frente una entidad financiera, debido a que la actividad
principal que desarrollan se ve afectada en mayor medida por este tipo de riesgo.
De forma genérica, podría definirse el riesgo de crédito como el posible quebranto que
originaría a la entidad una variación en las condiciones y características de una
contrapartida, que pudiese alterar la capacidad de ésta para cumplir con los términos
contractuales de una operación.
Más concretamente, el riesgo de crédito es la incertidumbre derivada de la posibilidad
de sufrir un quebranto por el incumplimiento, ya sea por entrada en mora o impago
definitivo, de alguna o de todas las obligaciones contractuales de la contraparte o
contrapartida en una operación financiera.
16
Como se observa, en la definición del riesgo de crédito se hace referencia a las dos
formas en que puede manifestarse dicho riesgo: el incumplimiento definitivo de las
obligaciones de pago del deudor, lo que deviene en la insolvencia del mismo, o bien, la
entrada en mora de la contrapartida, provocada por el retraso en dicho cumplimiento.
Esta distinción aparece recogida en diversas Circulares del Banco de España, que
realizan una clasificación del crédito respecto a su situación, entendida como estado de
cumplimiento de sus obligaciones de pago ya vencidas y estudio de la capacidad
financiera del deudor para atender a las futuras. En concreto, se consideran como
morosos aquellos créditos y demás operaciones vencidos y no cobrados, sin mediar
novación o prórroga, cuando hayan transcurrido más de tres meses desde su
vencimiento, si bien, con carácter general, se emplea el calificativo de moroso para
designar a la persona o deudor que se atrasa en el pago de sus deudas o en el
cumplimiento de su obligación, al no efectuarlo en la fecha de vencimiento estipulado.
El riesgo de crédito se clasifica en dos grandes tipos de riesgos: el riesgo de
contrapartida, cuyo origen está en el cambio de solvencia, y el riesgo país, que surge
por circunstancias distintas al riesgo comercial habitual, aunque dentro de cada uno de
estos riesgos pueden establecerse, a su vez, otras clasificaciones, según distintos
criterios, como el evento que genera el riesgo o la operación en que se manifiesta.
Por otra parte, existen una serie de factores determinantes del nivel de riesgo que
acompaña a toda operación que las entidades financieras formalizan con sus clientes: en
primer lugar, las características de la operación, que hacen referencia al plazo o
vencimiento del término de la misma, a su importe o cuantía, a la modalidad o tipo de
instrumento de financiación solicitado y a la finalidad o destino de la inversión.
También influye en el nivel de riesgo el conocimiento que se tenga del solicitante, para
lo cual debe obtenerse información, tanto de origen interno, obtenida de bases de datos
de la entidad, como de fuentes externas, que pueden provenir del propio cliente o bien
de terceros, a través de consultas a registros.
Por último, determinan el nivel de riesgo las garantías aportadas por el cliente, cuya
presentación exige la entidad como medio para reducir el riesgo.
3.2 ANÁLISIS EMPÍRICO
17
Una vez presentados los riesgos a que deben enfrentarse las entidades
financieras y, en especial, el de crédito, el presente trabajo se completa con un estudio
empírico, cuyo objetivo es analizar y valorar la morosidad, como forma de
manifestación de dicho riesgo, en las entidades financieras.
Para llevar a cabo dicho estudio, se ha aplicado la técnica de regresión logística, a partir
de la cual se determinan los factores que tienen mayor influencia en la morosidad de
una muestra de clientes de entidades financieras, centrándonos en el caso de personas
físicas –no se consideran, por tanto, personas jurídicas o sociedades– en las operaciones
de crédito o préstamo que han formalizado para financiar la compra de bienes o la
realización de actividades profesionales.
3.2.1 Selección de variables
En base a los aspectos teóricos del modelo de regresión logística, el fenómeno
de la morosidad se ha modelizado a través de una variable dependiente o respuesta
dicotómica, siendo sus modalidades la ocurrencia y no ocurrencia de dicho
acontecimiento, es decir, la morosidad y no morosidad de la operación, que se han
codificado con los valores uno y cero, respectivamente.
Por lo que se refiere a las variables independientes o predictoras que permiten
explicar el comportamiento de la variable dependiente, se han seleccionado teniendo en
cuenta la información que las entidades consideran a la hora de conceder créditos. A
este respecto, hay que destacar que son tres los factores que devienen en la concesión
del crédito: la personalidad del solicitante, que determina el riesgo de crédito (si el
cliente pagará), así como la capacidad, referente a la disponibilidad de ingresos para
pagar, y el capital, relativo a su situación financiera y patrimonial, que establecen el
límite de crédito que puede concederse (si podrá pagar y cuánto).
Sin embargo, además de los factores personales, profesionales y patrimoniales del
cliente que las entidades tienen en cuenta a la hora de estudiar la concesión de créditos,
el hecho de que un solicitante pueda hacer frente al pago también depende de las
características de la operación que se formalice.
De acuerdo con las consideraciones anteriores, las variables independientes
seleccionadas para su posible inclusión en el modelo se clasifican en dos bloques: por
un lado, variables relativas a la operación de crédito o préstamo, entre las que
consideramos el importe solicitado, la duración o plazo de devolución del crédito, el
18
destino de la inversión, la procedencia de la operación y las garantías aportadas; por
otro lado, variables relativas al perfil del solicitante, esto es, a sus características
personales y profesionales, como la edad, el estado civil, cargas familiares, su situación
laboral, ingresos, si ofrece compensaciones a la entidad o si tiene otras operaciones en
las que se ha producido impago.
Cada una de estas variables, con sus respectivas categorías, aparece en el anexo A1.
3.2.2 Muestra de entidades financieras
Con el fin de determinar cuáles de las variables descritas son más relevantes y
contribuyen en mayor medida a la explicación de la variable dependiente, que, como
hemos comentado, es la probabilidad de que un cliente sea moroso, hemos considerado
una muestra de clientes de entidades financieras, que se ha seleccionado mediante un
muestreo por conglomerados en dos etapas.
En la primera etapa, se consideró el tipo de entidad de la cual extraer la muestra de
clientes, e intentando tener en cuenta las peculiaridades y disparidades entre las distintas
entidades financieras, se seleccionaron tres tipos: un banco, una caja de ahorros y una
cooperativa de crédito, las tres con implantación en la provincia de León.
Determinadas las tres entidades de las que extraer la muestra de clientes, se tomó una
muestra de conglomerados, considerando como tales las oficinas de las entidades y
resultando un total de nueve sucursales, tres correspondientes a cada entidad, dentro de
cada una se seleccionó una muestra aleatoria de clientes, entre todos aquéllos que tenían
formalizada una operación de crédito o préstamo, fueran morosos o no.
El procedimiento de selección por azar dio como resultado una muestra total de 70
clientes, de los cuales 18 son morosos y 52 cumplen con sus obligaciones de pago.
Como se observa, aunque la proporción de clientes morosos es muy inferior a la de no
morosos en la mayoría de entidades financieras, la muestra de casos seleccionados recoge
una proporción elevada de clientes morosos en comparación con los clientes no
morosos, en concreto un 26% de clientes morosos frente a un 74% de clientes no
morosos en la muestra. Esto nos obliga a tomar con precaución los resultados obtenidos a
partir de la muestra, ya que pueden no ser extrapolables a la población de clientes de la
que se ha extraído la muestra, en la que la proporción de clientes morosos es bastante
más pequeña, respecto a los clientes no morosos.
3.2.3 Análisis de resultados
19
Para analizar la muestra seleccionada de clientes, con el objetivo de determinar
las variables más significativas en la predicción de la morosidad y estimar, a partir del
modelo, la probabilidad de que un cliente sea moroso, se aplicó el análisis de regresión
logística, que puede aplicarse a cada potencial variable independiente, en un estudio
univariante, lo que permite determinar la relación entre cada variable explicativa y la
explicada, el sentido de la misma y su significación.
No obstante, puesto que, como en cualquier otro fenómeno económico, en el
comportamiento de pago de un deudor y, por consiguiente, en la morosidad, influye más
de una variable o factor, es preciso estimar un modelo multivariante, para lo cual pueden
aplicarse distintos métodos de selección de variables.
Una posibilidad es aplicar los métodos de selección de variables hacia atrás, que
comienzan con todas las variables independientes incluidas en el modelo, y se van
eliminando aquéllas que no explican de forma significativa la variable dependiente, si
bien, presentan exactamente ese inconveniente, ya que deben introducirse todas las
variables en el modelo, lo que supone estimar todos los coeficientes de las variables,
cuando en realidad sólo algunas de ellas son significativas.
Por todo lo anterior, y teniendo en cuenta que el objetivo del estudio es encontrar un
modelo parsimonioso que, con el menor número posible de variables, tenga una elevada
eficacia predictiva, se va a aplicar para la selección de las variables explicativas alguno de
los métodos forward o hacia delante, que comienzan con un modelo que contiene sólo la
constante, para ir añadiendo después las variables independientes en función de su
significatividad y su relación con la variable dependiente. Además, una vez incorporada
la primera variable en el modelo, se contempla la posibilidad de eliminar alguna de las
variables ya incluidas, si deja de ser significativa en la explicación de la variable
dependiente.
En el programa SPSS, los métodos de selección de variables hacia delante pueden
seguir como criterios para la introducción de variables el estadístico de Wald o el test de
razón de verosimilitud o 2 del modelo. En este caso, hemos considerando como criterio
el 2 del modelo, ya que si se aplica el método hacia delante basado en el cambio que
tiene lugar en el estadístico de Wald cuando el modelo contiene la variable y cuando se
excluye, el procedimiento concluye tras el primer paso, en el que sale la variable
incluida, al no ser significativo el test, dando lugar al modelo inicial.
20
En base al criterio aplicado, el método se desarrolla en seis pasos, al final de los cuales
el modelo contiene cuatro variables, puesto que cada una de dichas variables contribuye
a mejorar el estadístico 2 del modelo, tal y como se muestra en la tabla siguiente:
Variables en la ecuación
Modelo
final
NUMIMPAG
NUEVARES
TRASPASO
VEHICULO
Cons tante
B
25,484
14,929
13,557
11,765
-13,557
E.T.
205,829
712,545
131,010
131,007
131,002
Wald
,015
,000
,011
,008
,011
gl
1
1
1
1
1
Sig.
,901
,983
,918
,928
,918
Exp(B)
1,2E+11
3046306
772273,2
128712,2
,000
Dos de las variables explicativas incluidas en el modelo hacen referencia a una
característica de la operación, como es el destino de la inversión obtenida, en concreto si
se destina al traspaso de un negocio o bien a la compra de vehículos; otra se refiere al
perfil del solicitante, puesto que recoge si es de nueva residencia en la zona, mientras
que el número de impagos anteriores, si bien hace referencia a la operación, también
guarda relación con el cliente, por cuanto que es un indicador de su personalidad y
naturaleza respecto al pago de sus deudas.
A la vista de los coeficientes del modelo, se observa que las cuatro variables influyen
positivamente en la probabilidad de que un cliente sea moroso, ya que todos tienen
signo positivo. Esto significa que cuando la variable independiente aumenta en una
unidad, el logaritmo de la odds de la probabilidad de ser un cliente moroso aumenta en el
valor del coeficiente respectivo. Además, el valor de los coeficientes es muy alto, lo que
implica que cambios en los valores de las variables independientes provocan grandes
aumentos del logaritmo de la odds ratio.
Una vez estimado el modelo a partir de los datos observados, el siguiente paso es
valorar su significatividad global, puesto que la significación individual de cada
coeficiente se ha considerado para la inclusión de las variables en la ecuación del
modelo, mediante su contribución a la mejora del estadístico 2 del modelo. Este
estadístico o test de razón de verosimilitud se aplica también para valorar la
significación del modelo, siendo su valor de 71’92, que resulta ser significativo.
Respecto a la bondad del ajuste, además del estadístico 2 del modelo, el programa
calcula coeficientes similares al R2 calculado en regresión lineal, concretamente el R2 de
21
Cox y Snell y el R2 de Nagelkerke, cuyos valores respectivos, de 0’639 y 0’939,
muestran que el ajuste realizado es bueno, al ser próximos a uno.
Otro estadístico utilizado para valorar la bondad de ajuste del modelo es la prueba de
Hosmer y Lemeshow, para lo cual se agrupan las observaciones, para cada uno de los dos
grupos definidos por la variable dependiente, según una tabla de contingencia,
obteniéndose un resultado significativo.
A su vez, es interesante valorar la capacidad o eficacia predictiva del modelo, lo que se
realiza a partir de la tabla de clasificación que se presenta a continuación, en la que se
recogen los valores observados para la variable dependiente, distinguiendo entre
clientes morosos (1) y no morosos (0), y los valores pronosticados según el modelo
estimado, que permite predecir la probabilidad de que un cliente sea moroso, y
utilizando un punto de corte de 0’5 para dichas probabilidades, clasificar a los
individuos o clientes de la muestra en cada uno de los dos grupos.
Tabla de clasificacióna
Pronosticado
Modelo
final
Obs ervado
MOROSIDA
MOROSIDA
no
sí
51
1
1
17
no
sí
Porcentaje global
Porcentaje
correcto
98,1
94,4
97,1
a. El valor de corte es ,500
Como se observa, la capacidad predictiva del modelo es alta, puesto que se consigue
una tasa de aciertos del 97’1%, de los cuales están correctamente clasificados un 98’1%
de clientes no morosos y un 94’4% de clientes morosos.
CONCLUSIONES
Con el presente trabajo, se ha pretendido analizar la morosidad en las entidades
financieras, como forma de manifestación del riesgo de crédito, que es el principal tipo
de riesgo que asumen dichas entidades, tomando como ámbito geográfico la provincia
de León.
Por ello, se ha comenzado por justificar la aplicación de técnicas estadísticas en la
evaluación de los riesgos a que se enfrentan las entidades financieras, y, especialmente
el riesgo de crédito. Debido a la necesidad de que la valoración del riesgo se lleve a
22
cabo de una forma objetiva, los métodos aplicados han evolucionado, pasando de
fundamentarse en decisiones personales y subjetivas de expertos, a aplicar modelos
matemáticos y estadísticos que permiten basar las decisiones en resultados objetivos,
entre los que podemos citar el análisis discriminante y los modelos de probabilidad
condicionada, como la regresión logística, que es la metodología aplicada en el trabajo.
Por esta razón, se ha procedido a describir brevemente los aspectos teóricos más
relevantes de dicha técnica, relativos a la formulación del modelo, a la estimación de los
parámetros del mismo y a su interpretación, así como a la evaluación de la significación,
tanto individual como del modelo en su conjunto, y la bondad de ajuste y validación del
mismo.
Todas estas consideraciones, que se han desarrollado desde una perspectiva teórica, se
han llevado a la práctica, mediante la aplicación de la técnica expuesta al estudio del
riesgo de crédito en las entidades financieras, por lo que se ha procedido a describir los
riesgos a que se enfrentan dichas entidades en el desarrollo de su actividad, con especial
referencia al riesgo de crédito, cuya principal manifestación es la morosidad.
A continuación se ha realizado el estudio empírico, relativo al análisis de la morosidad
en una muestra de clientes de tres tipos de entidades: banco, caja de ahorros y
cooperativa de crédito, con el fin de determinar los factores de mayor influencia en la
probabilidad de que sean morosos, de entre un conjunto de variables independientes
seleccionadas para su inclusión en el modelo por ser relevantes en la predicción de la
morosidad.
En concreto, siguiendo un criterio de significación estadística, se ha estimado un
modelo que contiene cuatro variables, relativas al número de impagos anteriores, si se
trata de un cliente de nueva residencia en la zona, y si la inversión se ha destinado al
traspaso de un negocio o a la compra de un vehículo, y cuya expresión, en términos del
logaritmo de la odds o logit es la siguiente:
 P( y  1) 
ln 
  13,577  25,484 NUMIMPAG  14,929 NUEVARES  13,557TRASPASO  11,765VEHICULO
 P( y  0) 
Como se observa, todas las variables incluidas tienen un efecto positivo en la
probabilidad de ser moroso, dado el signo de los coeficientes respectivos, por lo que un
cambio unitario en el valor de las variables correspondientes, provoca un aumento en el
23
logit de la probabilidad de que un cliente sea moroso en el valor del coeficiente
respectivo.
Por su parte, la evaluación de la validez del modelo determina que tiene una alta bondad
de ajuste y una elevada capacidad predictiva, puesto que clasifica correctamente un
97’1% de los clientes de la muestra, con una tasa de aciertos similar entre los clientes
morosos y los no morosos, todo lo cual muestra que la técnica de regresión logística es
una alternativa adecuada al análisis discriminante, que venían utilizando las entidades
financieras en la evaluación de la morosidad, permitiendo la inclusión de variables
explicativas tanto cualitativas como cuantitativas y no exigiendo la existencia de
normalidad en la población de la que procede la muestra.
BIBLIOGRAFÍA
1. Abad, F.; Vargas, M. (2002): Análisis de datos para las Ciencias Sociales con SPSS.
Granada: Ed. José Carlos Urbano Delgado, S.L.
2. Aldrich, J.H.; Nelson, F.D. (1984): Linear Probability, Logit, and Probit Models.
Sage University Paper Series on Quantitative Applications in the Social Sciences,
07-045. Beverly Hills: Sage Publications.
3. Alonso Martínez, C. (2001): "Credit scoring y consentimiento en la protección de
datos". Perspectivas del sistema financiero, 72, pp. 85-91.
5. DeMaris, A. (1992): Logit Modeling: Practical Applications. Sage University Paper
Series on Quantitative Applications in the Social Sciences, nº 07-086. Newbury Park:
Sage Publications.
6. Doldán Tié, F.; Rodríguez López, M. (2002): La Gestión del Riesgo de Crédito.
Métodos y modelos de Predicción de la Insolvencia Empresarial. Madrid: Ed. AECA
Monografías.
7. González Sánchez, M. (2000): "Nuevas tendencias en la gestión de riesgos: riesgo de
crédito". Perspectivas del sistema financiero, nº 69, pp. 59-92.
8. Hand, D.J. (2001): "Modelling consumer credit risk". IMA Journal of Management
Mathematics, vol.12, nº 2, pp.139-155.
9. Hosmer, D.W.; Lemeshow, S. (2000): Applied Logistic Regresion, 2ª edición. New
York: John Wiley & Sons.
24
10. Jovell, A.J. (1995): Análisis de regresión logística. Madrid: Centro de
Investigaciones Sociológicas.
11. Kleinbaum, D.G. (1994): Logistic Regression: A Self-Learning Text. New York:
Springer-Verlag.
12. Liao, T.F. (1994): Interpreting Probability Models: Logit, Probit, and Other
Generalized Linear Models. Sage University Paper Series on Quantitative
Applications in the Social Sciences, nº 07-101. Thousand Oaks: Sage Publications.
13. Menard, S.(2002): Applied Logistic Regression Analysis, 2ª edición. Sage University
Paper Series on Quantitative Applications in the Social Sciences, nº 07-106.
Thousand Oaks: Sage Publications.
14. Ruiz, G.; Jiménez, J.I.; Torres, J.J. (2000): La gestión del riesgo financiero. Madrid:
Ediciones Pirámide.
15. Salas, V.; Saurina, J. (2002): "Credit Risk in Two Institucional Regimes: Spanish
Commercial and Savings Banks". Journal of Financial Services Research, vol. 22, nº
3, pp. 203-224.
16. Saurina Salas, J. (1999): "Determinantes de la morosidad de las Cajas de Ahorros
españolas". Investigaciones Económicas, vol. XXII, nº 3, pp. 393-426.
17. Soler, M.; Mirò, A. (2001): "Enfoques cuantitativos para el riesgo de crédito de
particulares y su aplicación a realidades nacionales diferentes". Perspectivas del
sistema financiero, nº 72, pp. 43-51.
18. Thomas, L.C. (2000): "A Survey of Credit and Behavioural Scoring: Forecasting
financial risk of lending to consumers". International Journal of Forecasting, vol.
16, nº 2, pp. 149-172.
19. Tomàs, J.; Amat, O.; Esteve, M. (2002): Cómo analizan las entidades financieras a sus
clientes. Barcelona: Ediciones Gestión 2000.com.
ANEXO
Anexo A1. Variables
Variable
individu
morosida
importe
plazo
Categorías
Número de individuo
1, si el cliente es moroso; 0, si no lo es
Importe del crédito, en miles de euros
Duración de la operación, en meses
25
vivienda
vehiculo
activida
cancedeu
traspaso
otrgasto
1, si el destino de la inversión es la compra o reforma de vivienda; 0, en otro caso
1, si el destino es la compra de vehículos; 0, en otro caso
1, si el destino es la compra de locales comerciales o activos para actividad profesional; 0, en otro caso
1, si el destino es la cancelación de deudas; 0, en otro caso
1, si el destino de la inversión es mercantil; 0, en otro caso
1, si el destino son otros gastos o compras; 0, en otro caso
1, si es por iniciativa del cliente; 2, de la entidad; 3, campaña de marketing; 4, otra persona física o jurídica; 5,
proceden
otra entidad
tipointe
1, si fijo; 0, si es variable
garperso 1, si se aporta garantía personal; 0, en otro caso
garhipot 1, si se aporta garantía hipotecaria o real; 0, en otro caso
garaval 1, si se aporta aval; 0, en otro caso
edad
Edad del cliente, en años
estcivil
1, si es soltero; 2, casado/pareja; 3, separado/divorciado; 4, viudo
cargafam Número de personas a cargo del cliente
1, por cuenta propia; 2, por cuenta ajena funcionario; 3, por cuenta ajena indefinido; 4, por cuenta ajena
slaboral eventual; 5, por cuenta propia y ajena funcionario; 6, por cuenta propia y ajena indefinido; 7, por cuenta propia
y ajena eventual; 8, jubilado/prejubilado; 9, desempleado
ingresos Ingresos medios mensuales, en euros
antigüed Antigüedad en el trabajo, en años
propviv 1, si posee vivienda sin cargas; 2, posee vivienda con cargas; 3 no posee vivienda
nuevares 1, si es de nueva residencia; 0, en otro caso
nuevocli 1, si es nuevo cliente; 0, en otro caso
compensa 1, si tiene compensaciones; 0, en otro caso
numectas Número de cuentas del cliente
otrasope 1, si tiene otras operaciones activas; 0, en otro caso
numerope Número total de operaciones
imptotop Importe total de las operaciones activas, en miles de euros
numimpag Número de impagos anteriores
duraretr Duración máxima del retraso, en meses
26
Descargar