UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL FACULTAD DE CIENCIAS DE LA INGENIERÍA CARRERA DE INFORMÁTICA Y CIENCIAS DE LA COMPUTACIÓN TEMA: “DISEÑO DEL SISTEMA DE INDICADOR FINANCIERO BASADO EN EL SCORING DE COBRANZAS; PARA USO EMPRESARIAL, 2009” TESIS PREVIA LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN INFORMÁTICA Y CIENCAS DE LA COMPUTACIÓN AUTOR: JOFFRE DANIEL FLORES ESCOBAR DIRECTOR DE TESIS: MAT. MAURICIO GARCIA QUITO – ECUADOR 2010 Del contenido del presente trabajo se responsabiliza el autor ______________________ Daniel Flores Escobar III DEDICATORIA Dedico este trabajo a mi madre por estar siempre a mi lado y quien me supo dedicar todo su esfuerzo para que sea un profesional, además de orientarme e inculcarme principios para luchar en este duro camino. A mis hermanos Diego y Diana quienes han sido los pilares de mi vida y la fuerza para nunca dejarse vencer y siempre luchar hasta culminar cada meta impuesta. Daniel Flores V AGRADECIMIENTO Agradezco a Dios por permitirme alcanzar esta meta y ser mi luz capaz de iluminar todo momento sombrío. A mi madre y hermanos quienes me dieron su apoyo, guía y comprensión sin condición ni medida. A mis abuelitos Jorge y Rosita por estar a mi lado y ser un ejemplo de lucha y sacrificio Quiero agradecer a la Universidad Tecnológica Equinoccial por los conocimientos impartidos en sus aulas a través de sus maestro y en especial al director de este proyecto Mat. Mauricio García por su guía y aportes en este trabajo. Y a todos los que no recuerdo pero que ayudaron a que pueda culminar esta meta. VI ÍNDICE GENERAL DEDICATORIA ........................................................................................................ V AGRADECIMIENTO .............................................................................................. VI ÍNDICE GENERAL ............................................................................................... VII ÍNDICE DE CONTENIDOS ................................................................................. VIII ÍNDICE DE ILUSTRACIONES .............................................................................. XI ÍNDICE DE ECUACIONES .................................................................................. XII ÍNDICE DE TABLAS............................................................................................ XIII RESUMEN ............................................................................................................. XIV SUMMARY............................................................................................................ XVI CAPÍTULO I .............................................................................................................. 1 CAPÍTULO II ........................................................................................................... 14 CAPÍTULO III ......................................................................................................... 34 CAPÍTULO IV .......................................................................................................... 57 CAPÍTULO V ........................................................................................................... 75 BIBLIOGRAFÍA ...................................................................................................... 78 ANEXOS ................................................................................................................... 80 VII ÍNDICE DE CONTENIDOS CAPÍTULO I .............................................................................................................. 1 1. INTRODUCCIÓN .................................................................................................. 1 1.1 PROBLEMA A RESOLVER .......................................................................... 1 1.2 MARCO TEÓRICO ....................................................................................... 2 1.3 JUSTIFICACIÓN ......................................................................................... 11 1.4 OBJETIVOS................................................................................................. 12 1.4.1 Objetivo General ................................................................................... 12 1.4.2 Objetivos Específicos ............................................................................ 12 1.5 HIPÓTESIS .................................................................................................. 13 1.6 ALCANCE ................................................................................................... 13 CAPÍTULO II ........................................................................................................... 14 2. CREDIT SCORING ............................................................................................. 14 2.1 CONCEPTOS ............................................................................................... 14 2.2 MÉTODOS EMPLEADOS EN LA CONSTRUCCIÓN DE SCORE DE CREDITOS............................................................................................................. 21 2.3 REGRESION LOGÍSTICA .......................................................................... 23 CAPÍTULO III ......................................................................................................... 34 3. METODOLOGÍA ................................................................................................. 34 3.1 MODELAMIENTO ...................................................................................... 34 3.1.1 Selección de la muestra.......................................................................... 35 3.1.2 Definición de buenos y malos clientes ................................................... 40 3.1.3 Definición y selección de datos .............................................................. 41 VIII 3.1.4 Análisis preliminar de la Muestra ........................................................... 48 3.1.5 Análisis Multivariado ............................................................................ 50 3.1.6 Diseño del Score Card ........................................................................... 53 3.1.7 Validación del Modelo ........................................................................... 56 CAPÍTULO IV .......................................................................................................... 57 4. DESARROLLO .................................................................................................... 57 4.1 DISEÑO Y DESARROLLO ........................................................................ 57 4.2 HERRAMIENTAS DE DESARROLLO....................................................... 58 4.2.1 Microsoft .Net ....................................................................................... 58 4.2.2 SQL Server 2005 ................................................................................... 60 4.2.3 SPSS...................................................................................................... 61 4.3 DISEÑO DEL SISTEMA ............................................................................. 62 4.3.1 Web Service .......................................................................................... 62 4.3.2 Modelado del Sistema ............................................................................ 64 4.3.3 Casos de Uso ......................................................................................... 65 4.4 Creación del Web Service ............................................................................. 66 4.5 Probador Web Service .................................................................................. 70 CAPÍTULO V ........................................................................................................... 75 5. CONCLUSIONES Y RECOMENDACIONES ................................................... 75 5.1 CONCLUSIONES ............................................................................................ 75 5.2 RECOMENDACIONES ................................................................................... 76 BIBLIOGRAFÍA ...................................................................................................... 78 IX ANEXOS ................................................................................................................... 80 1. ANEXO 1............................................................................................................... 80 2. ANEXO 2............................................................................................................... 84 3. ANEXO 3............................................................................................................... 93 4. ANEXO 4............................................................................................................. 100 X ÍNDICE DE ILUSTRACIONES Ilustración 1. Ejemplo de Transformación ................................................................... 10 Ilustración 2. Concepto de Score ................................................................................. 16 Ilustración 3. Técnicas Para el Desarrollo Scoring Crediticio ...................................... 22 Ilustración 4. Gráfico Función Logística ..................................................................... 25 Ilustración 5. Gráfico de Dispersión ............................................................................ 31 Ilustración 6. Gráfica Resultado Ejemplo Regresión Logística .................................... 33 Ilustración 7. Esquema de Selección de la Muestra ..................................................... 39 Ilustración 8. Distribución de los Sujetos por Rangos de Edad .................................... 48 Ilustración 9. Transformación de una variable ............................................................. 49 Ilustración 10. Diseño del Score Card Cógido Sql ....................................................... 54 Ilustración 11. Características Herramientas .Net ........................................................ 59 Ilustración 12. Sql Server 2005 ................................................................................... 60 Ilustración 13. Funcionamiento de un Web Service ..................................................... 63 Ilustración 14. Caso de Uso ......................................................................................... 66 Ilustración 15. Código .Net Creación del Web Service ................................................ 67 Ilustración 16. Creación Referencia Web .................................................................... 68 Ilustración 17. Busqueda del Servicio Web ................................................................. 69 Ilustración 18. Selección del Web Seervice ................................................................. 70 Ilustración 19. Codigo .Net Creación del Probador Web Service ................................. 71 Ilustración 20. Pantalla Probador Web Service ............................................................ 73 XI ÍNDICE DE ECUACIONES Ecuación 1. Regresión Logística ................................................................................... 8 Ecuación 2. Modelo General ....................................................................................... 25 Ecuación 3. Función Lineal con Parámetros ................................................................ 26 Ecuación 4. Función Logística .................................................................................... 27 XII ÍNDICE DE TABLAS Tabla 1. Ventajas y Desventajas del Scoring Crediticio ............................................... 19 Tabla 2. Número Registros por primeros y últimos dígitos de la Cedula ..................... 37 Tabla 3. Periodo Morosidad en Meses ......................................................................... 44 Tabla 4. Parametrización Scoring Crediticio ............................................................... 74 XIII RESUMEN Este trabajo se ha planteado optimizar y reducir los errores en los análisis de créditos, mediante la creación de una herramienta de evaluación crediticia (Scoring Crediticio) de otorgamiento útil para la toma de decisiones, disminuyendo el riesgo en función del historial de crédito de una persona. En el marco de este estudio y en el transcurso de los capítulos se ha realizado una revisión y descripción del contenido de la investigación para la solución del problema planteado para cual fue objeto este tema de tesis. Es así que reconociendo las características y particularidades de los datos obtenidos; así como el resultado que se desea obtener que esta demarcado en clasificar a un sujeto de acuerdo a su riesgo crediticio para definirlo apto o no para ser sujeto de crédito, se ha escogido la función de regresión logística para la obtención del modelo que mejor se ajusta a las características de los datos que se posee. También que se genero una herramienta Web Service con la finalidad de que cualquier institución o persona que desee consultar el score de un sujeto, pueda acceder a la misma sin importar la plataforma ni las herramientas que posea siendo esta una herramienta flexible con el fin de independizar la arquitectura de una aplicación concreta, lógicamente, dentro de ciertas restricciones, impuestas por la naturaleza de los sistemas de información o sistemas de control automáticos. XIV Además el score se convierte en una herramienta que asume una probabilidad de incumplimiento, tomando en cuenta las similitudes presentadas entre los datos históricos con el fin de discriminar de una manera técnica el otorgamiento de un crédito. Este proyecto parte fundamentalmente de la base de datos la cual debe cumplir con la característica de robustez y confiabilidad ya que para la obtención del score y para que el mismo sea predictivo se necesita de una gran cantidad de datos los cuales juegan un papel muy importante para el cálculo del mismo y además que los datos sean correctos, pero a su ves la muestra de datos obtenidos es pequeña pero que tiene todas las características fundamentales para el modelamiento del score. XV SUMMARY This work is to optimize and reduce errors in credit analysis, by creating a credit assessment tool (Credit Scoring) granting useful for decision making, reducing the risk based on credit history of a person. As part of this study and in the course of the chapters make a review and description of the research content for the solution of the problem which was the subject for this thesis topic. Which also generated a Web Service tool for the purpose of any institution or person you want to see the score of a person, can access it regardless of platform or tools having this being a flexible tool to wean the architecture of a particular application, of course, within certain restrictions imposed by the nature of information systems and automatic control systems. In addition, the score becomes a tool that assumes a probability of default, taking into account similarities between the historical data presented to discriminate in a technical way the granting of credit. This project is mainly from the database which must comply with the property of robustness and reliability as to obtain the score and that it needed to be predictive of a large amount of data which play an important role in the calculation thereof and further XVI that the information is correct, but your see the sample data is small but has all the basic features for modeling of the score. XVII CAPÍTULO I CAPÍTULO I 1. INTRODUCCIÓN En este capítulo se presenta los objetivos principales del trabajo y su justificación, así como la descripción resumida del contenido de la tesis. 1.1 PROBLEMA A RESOLVER La gran mayoría de los préstamos que a diario conceden las entidades financieras podrían ser otorgados mediante técnicas de clasificación, que en base a características propias del cliente, determinen la probabilidad de que en un futuro este pueda hacer frente a sus obligaciones de pago. Permitiendo clasificarle en dos grupos: el integrado por individuos con una elevada probabilidad de devolver el crédito y el de aquellos individuos que, previsiblemente, no harán frente a sus compromisos crediticios. Así de esta manera, mediante la utilización de modelos de scoring para la evaluación del riesgo de crédito, se puede determinar la probabilidad de que una persona incurra en mora o clasificarle como un sujeto apto para acceder a un crédito. 1 1.2 MARCO TEÓRICO Un banco es un tipo muy especial de empresa, que capta dinero del público, lo presta conjuntamente con recursos propios de la entidad a terceros, quienes pagan intereses por el uso de ese dinero. Así, usualmente, los recursos con los que un banco genera sus ingresos son, en parte propios (patrimonio o capital), y mayoritariamente ajenos (depósitos del público). Por ello, dado que la mayoría del dinero que un banco administra no le pertenece, la gestión bancaria requiere un proceso constante de evaluación y medición de los riesgos a los que se exponen los recursos de los depositantes en las operaciones de la entidad. Estos riesgos, en conjunto, se llaman Riesgo Bancario y su administración suele ser regulada por la Superintendencia de Bancos y Seguros (SBS) en el Ecuador y sus pares en todo el mundo. Para regular el riesgo la SBS se crearon varias leyes entre las cuales tenemos la Ley General de Instituciones de Sistema Financiero que dice en el Título IV del Patrimonio Capítulo I Capital y Reservas, en el artículo 47 de esta ley en la que se indica: “Con el objeto de preservar su solvencia, las instituciones del sistema financiero deberán mantener, en todo tiempo, el conjunto de relaciones técnicas que establezca la Junta Bancaria mediante resolución de carácter general, siguiendo los estándares internacionales, especialmente los establecidos por el Comité de Basilea” 1. 1 El acuerdo de Basilea consta de 25 principios que representan los requerimientos mínimos que deben ser implementados por las autoridades bancarias para lograr un sistema de supervisión bancaria efectiva. 2 Entre los acuerdos del Comité de Basilea se encuentran dos principios fundamentales en los cuales se basa la creación y uso de los datos de las instituciones financieras en una base de datos llamada Central de Riesgo los cuales son: Principio 15. Los supervisores bancarios deben determinar que los bancos tengan políticas, prácticas y procedimientos adecuados, que incluyan la estricta regla de CONOCE A TU CLIENTE, lo cual promueve altos estándares de ética y profesionalismo en el sector financiero. Estas medidas previenen que los bancos sean utilizados por elementos criminales, en una forma voluntaria o involuntaria. Principio 21. Los supervisores bancarios deben de asegurarse que cada banco mantenga registros adecuados, diseñados de manera que concuerden con políticas contables consistentes, con prácticas que permitan al supervisor obtener una visión verdadera y precisa de la condición financiera del banco y de la rentabilidad de sus negocios y que el banco haga publicaciones regulares del estado financiero, que reflejen realmente su condición. Y es por eso que la Superintendencia de Bancos y Seguros del Ecuador en una de sus normativas emitidas en marzo del 2008 para la conformación de la Central de Riesgos solicita a todos los Buros de Crédito, que los mismos deberán reportar la información crediticia de los clientes sobre la base de modelos estadísticos predictivos y no sobre la información en bruto que reportan las instituciones bancarias de los clientes. 3 Los comienzos del Credit Scoring se remontan del año 1936 cuando Fisher, introduce el concepto de discriminar objetos dentro de una población específica. Esta idea fue desarrollada más ampliamente por Durand en 1941 donde fue aplicada en un contexto financiero para discriminar entre un “Buen” y un “Mal” pagador. Uno de los modelos estadísticos predictivos denominado scoring crediticio fue inventado por dos matemáticos de Stanford, Bill Fair y Earl Isaac, quienes observaron que los acreedores no buscaban el historial de crédito, sino un pronóstico de aptitud de crédito del individuo. Con el desarrollo de un sistema analítico que hoy en día se conoce como el FICO Score (Fair Isaac Corporation Score) una de las herramientas más usadas a nivel mundial en relación al análisis de riesgo de créditos. La utilización de modelos de credit scoring para la evaluación del riesgo de crédito, y ordenar a los deudores y solicitantes de financiamiento en función de su riesgo de incumplimiento, comenzó en los 70’s pero se generalizó a partir de los 90’s. Esto se ha debido tanto al desarrollo de mejores recursos estadísticos y computacionales, como por la creciente necesidad por parte de las instituciones bancarias de hacer más eficaz y eficiente la originación de financiaciones, y de tener una mejor evaluación del riesgo de su portafolio. El scoring crediticio se refiere al uso de conocimiento sobre el desempeño y características de préstamos en el pasado para pronosticar el desempeño de préstamos en el futuro. Así, cuando un analista de crédito valora el riesgo comparando 4 mentalmente una solicitud de crédito en el presente con la experiencia que este mismo analista ha acumulado con otros clientes con solicitudes parecidas, está aplicando scoring, aunque sea un scoring implícito y subjetivo. De igual manera, cuando un micro prestamista adopta una política de no renovar préstamos a clientes que han tenido atrasos mayores a 30 días en su préstamo anterior, está aplicando scoring, aunque sea un scoring simple y unidimensional. Por eso, aunque el nombre scoring puede sonar nuevo, es una práctica antigua. Los métodos o modelos de credit scoring, a veces denominados score-cards o classifiers, son algoritmos que de manera automática evalúan el riesgo de crédito de un solicitante de financiamiento o de alguien que ya es cliente de una entidad crediticia. Tienen una dimensión individual, ya que se enfocan en el riesgo de incumplimiento del individuo o empresa, independientemente de lo que ocurra con el resto de la cartera de préstamos En una primera aproximación a los mismos, se los puede definir como “métodos estadísticos utilizados para clasificar a los solicitantes de crédito, o incluso a quienes ya son clientes de una entidad evaluadora, entre las clases de riesgo ‘bueno’ y ‘malo’” 2. Aunque originalmente en los 70’s se basaban en técnicas estadísticas (en particular, el análisis discriminante), en la actualidad también están basados en técnicas matemáticas, econométricas y de inteligencia artificial. En cualquier caso, los modelos de credit 2 Hand, D.J. y W.E. Henley. (1997) “Statistical Classification Methods in Consumer Credit Scoring: A Review”, Journal of the Royal Statistical Association Series A, Vol. 160, No. 3, pp. 523-41. . 5 scoring emplean principalmente la información del evaluado contenida en las solicitudes de crédito y/o en fuentes internas y/o externas de información. El resultado de la evaluación se refleja en la asignación de alguna medida que permita comparar y ordenar a los evaluados en función de su riesgo, a la vez cuantifica. Por lo general, los modelos de credit scoring le asignan al evaluado un puntaje o score, o una calificación o rating. Algunos métodos los asignan a grupos, en donde cada grupo tiene un perfil de riesgo distinto; sin embargo, en la práctica esto equivale a una calificación. A su vez, estos ordenamientos de los deudores permiten obtener estimaciones más concretas del riesgo; en general se busca obtener alguna estimación de la probabilidad de incumplimiento del deudor (PD, por probabilidad de default) asociada a su score, rating o calificación. Esta estimación se puede obtener directamente del score en el caso de los modelos econométricos, o también en función de la tasa de incumplimiento (TD, por tasa de default) histórica observada en el grupo de deudores con la misma calificación o score similar. La utilización de modelos de credit scoring para la evaluación del riesgo de crédito, es decir, para estimar probabilidades de default y ordenar a los deudores y solicitantes de financiamiento en función de su riesgo de incumplimiento, comenzó en los 70’s pero se generalizó a partir de los 90’s. Esto se ha debido tanto al desarrollo de mejores recursos estadísticos y computacionales, como por la creciente necesidad por parte de la industria bancaria de hacer más eficaz y eficiente la originación de financiaciones, y de tener una 6 mejor evaluación del riesgo de su portafolio. Estos modelos generalmente se asocian a lo que se ha dado en llamar data mining (minería de datos), que son todos aquellos procedimientos que permiten extraer información útil y encontrar patrones de comportamiento de los datos. Para evaluar el riesgo crediticio o la conveniencia de otorgar un crédito, hay una gran variedad de metodologías disponibles: análisis discriminante, regresión lineal, regresión logística, modelos probit, modelos logit, métodos no paramétricos de suavizado, métodos de programación matemática, modelos basados en cadenas de Markov, algoritmos de particionamiento recursivo (árboles de decisión), sistemas expertos, algoritmos genéticos, redes neuronales y, finalmente, el juicio humano, es decir, la decisión de un analista acerca de otorgar un crédito. Aunque esta última presenta la ventaja de ser más eficaz en tratar las excepciones a la experiencia pasada, los métodos de credit scoring son más eficientes a la vez que sus predicciones más objetivas y consistentes, por lo que pueden analizar y tomar decisiones sobre una gran cantidad de solicitudes de crédito en poco tiempo y a un bajo costo Dada la relevancia en el proceso de gestión crediticia, un punto fundamental de este proyecto es determinar una variable dependiente (bueno/malo), para lo cual se estableció que el modelo estadístico de regresión logística es el más apropiado para el desarrollo de este proyecto. Además se estableció que la regresión lineal no tiene el sustento teórico apropiado para la construcción de modelos con una variable dependiente binaria (por ejemplo, bueno o 7 malo). El término de error en una regresión lineal se asume normalmente distribuido, y este supuesto es violado cuando la variable dependiente sólo puede tomar dos valores. Además, la regresión lineal puede crear probabilidades estimadas mayores que uno y menores que cero. Así se identificó que lo más apropiado para el desarrollo de este proyecto es el modelo de regresión logística ya que es una técnica que sirve para modelar la relación entre la variable dependiente binaria y las variables independientes. Es una forma de modelo lineal generalizado (GLM) y está dado por la fórmula: Ecuación 1. Regresión Logística logit(pi) = log(pi/(1 – pi))=0 + 1x1i + … + kxki Fuente: Análisis de datos multivariantes Elaborado por: Daniel Flores Donde pi es la probabilidad de que una observación tome un valor particular, y los i son los parámetros asociados con cada variable independiente. El modelo resultante de la regresión logística utiliza las variables independientes para predecir la probabilidad de que la variable dependiente tome un valor particular. Este modelo no se basa en el supuesto estadístico de que el término de error está distribuido normalmente ni en el supuesto de homoscedasticidad es decir que los diferentes grupos obtenidos presenten la misma varianza o dispersión (las poblaciones de Y correspondientes a diversos valores de X tienen la misma varianza. Si se cumple, todos los valores de Y que corresponden a 8 diversos valores de X serán igual de confiables cercanía o alejamiento con el cual están distribuidos los valores de Y alrededor de sus medias. Todos los valores de Y correspondientes a diversos valores de X son igualmente importantes), y produce probabilidades estimadas entre 0 y 1, las que serán asociadas a un score. De acuerdo a lo explicado en la metodología de regresión logística, un paso importante en el proceso de desarrollo es determinar que variables independientes tienen una fuerte relación lineal con la función logit de la variable dependiente, es decir la función logit será utilizada para predecir el resultado binario, por ejemplo bueno / malo a sabiendas que existen diferentes factores que pueden inferir en el resultado. Esta función logit es un tipo de regresión en donde la variable dependiente es una variable dummy ejemplo 0 buen cliente 1 mal cliente. En algunos casos una variable puede tener una fuerte asociación con la función logit de la variable dependiente, sin que esta relación sea lineal. Como resultado, esta relación puede no ser detectada o puede producir resultados no esperados. Transformar la variable puede servir para detectar la relación no lineal que de otra manera se perdería, o para fortalecer dicha relación. Típicas transformaciones de variables incluyen la raíz cuadrada, el cuadrado, el binario (indicador), el logaritmo y el inverso. Por ejemplo, la Ilustración 1(a) indica una relación no-lineal entre la Variable 1 y la variable dependiente. Sin embargo, después de aplicar la transformación de raíz cuadrada, mostrada en la Ilustración 1(b), la relación no lineal se convierte en lineal. 9 Ilustración 1. Ejemplo de Transformación A B V a r i a b l e V a r i a b l e D e p e n d i e n t e D e p e n d i e n t e Variable 1 Raíz cuadrada de Variable 1 Fuente: Introducción al análisis de regresión lineal Elaborado Por: Daniel Flores Para este modelo, se empleará metodologías estándares y análisis de distribuciones para hacer lo siguiente: a. Determinar la necesidad de transformación para cada variable independiente; b. Determinar la transformación óptima para cada variable; y c. Considerar la inclusión de las variables transformados en el desarrollo de los modelos. Este proceso asegurará que cada variable sea representada apropiadamente. Es así que mediante esta técnica se logrará clasificar a los individuos dentro de las categorías (bueno/malo) de la variable dependiente, según la probabilidad que tenga de pertenecer a una de ellas dada la presencia de determinadas variables. 10 1.3 JUSTIFICACIÓN El sistema financiero desempeña un papel crucial en el desarrollo de un país, que afecta tanto a la adecuada asignación de recursos en el tiempo como a la correcta valoración del riesgo. En los últimos años, la globalización de la economía de mercado ha disminuido la estabilidad y seguridad del negocio financiero, multiplicando los riesgos a los que se enfrentan estas entidades, entre ellos el riesgo de crédito, o posibilidad de que no se produzca la devolución puntual de una determinada cantidad de dinero que se prestó en el pasado. Por eso se ha visto la necesidad de diseñar una aplicación, la cual ayudará a tener una correcta toma de decisiones con la mayor efectividad posible, basados en un sistema de Scoring de Cobranzas, ya que en el Ecuador las Instituciones Financieras y, Pequeñas y Medinas Empresas PYMES, en los últimos tiempos viene enfrentándose a la problemática de la morosidad, que se situó en el 5.8%3 de los sujetos de crédito en el Ecuador, en el año 2008. En donde este diseño de scoring basado en información historial crediticia como montos que debe a una institución financiera, el tiempo de endeudamiento, morosidad, el número de créditos recibidos, etc. de un determinado sujeto, serán evaluados permitiendo agilizar el proceso de cobro en una empresa asignando una puntuación de forma consistente, determinado las probabilidades de que el sujeto incurra en mora. 3 Fuente: CreditReport Buro de Información Crediticia 11 1.4 OBJETIVOS 1.4.1 Objetivo General Diseñar un modelo de Scoring, utilizando un conjunto de indicadores financieros históricos de la Central de Riesgo, categorizando a los clientes en base a su propensión para hacer un adecuado manejo de los mismos. 1.4.2 Objetivos Específicos Presentar un modelo de score que permita identificar a un cliente con la tipología de riesgoso, para evitar perdidas en un crédito asignado. Analizar de forma automática las características y/o condiciones que un cliente posee para catalogarse como riesgoso. Definir un mecanismo analítico - matemático que constituya de una forma rápida, confiable, exacta y consistente para predecir el riesgo de un solicitante para cumplir con sus deudas en el futuro, es decir minimiza el riesgo de cobranzas. 12 1.5 HIPÓTESIS Demostrar que este sistema de scoring permitirá o no determinar si una persona es sujeto de crédito. Identificar aquellos clientes que tienen la tipología de clientes riesgosos para evitar cualquier tipo de fraude en el crédito asignado. 1.6 ALCANCE Este sistema generará un valor numérico estadísticamente validado en base a análisis descriptivos que permita agilizar la toma de decisiones a la vez que busca reducir el nivel de pérdidas ya que se asigna puntuaciones de forma consistente, determinando las probabilidades de que una solicitud se convierta en una cuenta con buen comportamiento para predecir la recuperación del crédito. El sistema se basará en fórmulas de evaluación de las características relevantes que se obtendrá de la información historial crediticia para predecir la recuperación del crédito. A cada característica se le asigna un valor numérico estadísticamente validado que permita obtener un puntaje mediante el cual se pondrá más afán en la cobranza de una deuda a un cliente. 13 CAPÍTULO II CAPÍTULO II 2. CREDIT SCORING En este capítulo se tratará sobre las definiciones del score crediticio, los métodos empleados para la construcción y sobre la regresión logística que es el método seleccionado para el desarrollo de este proyecto. 2.1 CONCEPTOS Los modelos de scoring crediticio nacen alrededor de los años 1950s cuando Bill Fair y Earl Isaac fundan su compañía dedicada a apoyar las actividades de importantes empresas financieras y de ventas al menudeo. Posteriormente, en los años 1960s se inicia el periodo en el que se desarrolla la industria de las tarjetas de crédito con lo cual los bancos ven una gran posibilidad de empezar utilizar modelos de scoring. Básicamente el credit scoring es un método que se emplea para identificar diferentes grupos dentro de una población cuando no se pueden observar las características que los definen sino únicamente las relaciones con estas. Se denomina credit scoring a un sistema que permite asignar una calificación de riesgo, una puntuación, a un demandante de crédito (cliente real o cliente potencial). 14 Los modelos de scoring crediticio son aplicaciones que permiten apoyar la toma de decisiones. Estos modelos surgen como una necesidad de poder evaluar de forma ágil y rápida las capacidades de endeudamiento de clientes ante la solicitud de un crédito. Aunque existen diversos tipos de compañías y distintos tipo de créditos, la idea general de un modelo de scoring crediticio es, por un lado, seleccionar aquellos individuos que poseen mejores condiciones económicas para retornar a la compañía el valor total del préstamo solicitado; por otra parte, los modelos de scoring crediticio permiten mitigar el riesgo en que se incurriría si se aprueba un crédito a un individuo que no cumple con una capacidad de pago y endeudamiento. En términos más formales el “credit scoring es un método de evaluación del riesgo de crédito que emplea información histórica y técnicas estadísticas, para tratar de aislar los efectos que tienen las características de varios aplicantes sobre la reincidencia y el incumplimiento. El método arroja un puntaje o score que la institución financiera puede emplear para ranquear sus aplicaciones de crédito en términos de riesgo”4. Y con lo mencionado anteriormente predecir el comportamiento de pago futuro de las obligaciones crediticias que contraen las personas en función de su comportamiento crediticio histórico, para lo cuál utiliza toda la información de entidades Reguladas por la Superintendencia de Bancos y Seguros SBS. El credit scoring constituye, por tanto, un problema de clasificación propiamente dicho, pues dado un conjunto de observaciones cuya pertenencia a una determinada clase es 4 Lewis, E.M. (1990) An Introduction to Credit Scoring, San Rafeal: Athena, LIC# 90-92258. 15 conocida a priori, se busca una regla que permita clasificar nuevas observaciones en dos grupos: los que con alta probabilidad podrán hacer frente a sus obligaciones crediticias, y los que, por el contrario, resultarán fallidos. De ahí que para esta investigación se definió que el puntaje obtenido estadísticamente se encuentre dentro de un rango de 1 a 999 siendo 1 el puntaje menor y 999 el mayor puntaje a obtener cuando un sujeto posee el mejor historial crediticio. Ilustración 2. Concepto de Score 20 % Bajo 999 Riesgo 60 % Score 800 600 Buenas Malas 20 % 400 200 Alto Riesgo Muy Buenas Muy malas 1 Fuente: Datos de la Central de Riesgo Elaborado Por: Daniel Flores 16 Así también el grafico muestra el objetivo del cálculo que es exponer el riesgo que actualmente un sujeto representa a un prestamista. Parámetros severos como el historial de crédito, incluyendo historial de pagos, longitud de la historia de la cuenta, préstamos y otros son formulados para producir un número de tres dígitos que oscila entre 1 y 999. Este puntaje se divide en 3 categorías principales: Riesgo Bajo, Riesgo Medio y Riesgo Alto. Además el grafico indica que el 60% de todas las personas con una puntuación de crédito de 550-900 presenta o presentó problemas con su crédito y para obtener uno necesitará de requisitos poco favorables. El 20% de los sujetos no presentan ningún problema en sus créditos obteniendo u score superior a los 700 y no presentan ningún riesgo para las instituciones bancarias al ser sujetos de crédito, y el restante 20% se encuentran con un score entre 1 y 549 los que representan un riesgo alto al ser sujeto de crédito ya que poseen créditos vencidos o en demanda judicial en la institución bancaria. Esto hace que el sistema se base en el desempeño pasado de clientes que tienen características similares a aquellos a ser evaluados. El credit scoring termina, por tanto, siendo un predictor del riesgo, cuya fortaleza no radica en la habilidad para explicar causalidades (por qué algunos clientes incumplen y otros no) sino en la objetividad de la metodología aplicada. 17 Con el score, la institución que utilice el sistema observará un valor numérico el cual significa el riesgo y dependiendo de su valor el usuario aceptará o rechazará una solicitud de préstamo5. Los beneficios no sólo se leen en una reducción de la subjetividad del analista inmersa en la concesión del crédito, al estar los métodos tradicionales apoyados fundamentalmente en información cualitativa mantenida en la mente del evaluador, sino que al basarse en información cuantitativa mantenida en los sistemas de cómputo de la institución financiera y por ende cuantificables a bajo costo, se pueden lograr reducciones de costos de morosidad y de evaluaciones de préstamos de tal forma que se mejore la eficiencia (mejores colocaciones) y por ende la rentabilidad. A la par coexisten tanto ventajas como desventajas en esta metodología, dejando siempre al final la opción al prestamista de optar por un sistema de otorgamiento de créditos subjetivo (scoring implícito) en donde el analista valora el riesgo del prestatario comparando mentalmente las características de un aplicante con su experiencia acumulada de otras aplicaciones similares o por un scoring estadístico que haga uso del conocimiento cuantitativo del desempeño de clientes pasados almacenados en una base de datos con el fin de pronosticar comportamientos futuros. Esto conduce, en virtud de la seriedad académica, a exponer los pros y contras de hacer uso de esta técnica. 5 Estrictamente no todos los métodos conducen a una 'puntuación' o 'scorecard'. Algunos indican directamente la posibilidad de que un cliente sea bueno y si la aprobación del crédito vale la pena. 18 De lo que se pudo realizar el análisis las ventajas y desventajas del uso de un modelo de score se encuentran descritas en la siguiente tabla. Tabla 1. Ventajas y Desventajas del Scoring Crediticio VENTAJAS DESVENTAJAS Requiere de una sólida y extensa base de Cuantifica el riesgo como probabilidad datos Ignora toda información no existente en la Multivariable base de datos Puede ser validado Solo destaca los casos de alto riesgo Puede necesitar de un consultor externo, Consistente por ende genera gastos operativos Su funcionamiento requiere de un sistema Transparente transaccional Fuente: Revisión Bibliográfica Elaborado Por: Daniel Flores La consistencia surge de la homogeneidad en la calificación otorgada a cada grupo de clientes que comparta las mismas características, todas las solicitudes idénticas tendrán por tanto el mismo valor de riesgo predicho; el hecho de contar con un modelo matemático que arroje un valor hace que el proceso de obtención de esta probabilidad 19 sea explícito y como consecuencia de fácil comunicación tanto a nivel de alta gerencia como de analistas. El contar con modelos estadísticos da la posibilidad de contrastación de los mismos, validando los modelos sea con información previa al periodo muestral empleado, permitiendo observar como habría funcionado scoring si hubiera estado implementado al momento de estos desembolsos o verificando, previo a la fase de implementación, la consistencia del modelo con los nuevos clientes. Esta fase suele denominarse backtesting. Del otro lado, se tiene un conjunto de desventajas que se deben considerar antes de incurrir en un proceso de obtención e implementación de un modelo scoring para el otorgamiento de créditos. La disponibilidad de una sólida y extensa información es uno de los principales obstáculos al momento de desarrollar un modelo estadístico. Además, la cantidad de información registrada no debe sólo ser buena sino vasta para que los modelos desarrollados puedan compensar la ausencia de información financiera con mucha capacidad de pronóstico empleando un gran número de características menos significativas. La calidad de las bases de datos es fundamental, no sólo en cantidad de registros almacenados en cada variable (porcentaje bajo de clientes en blanco) sino en la confiabilidad de la información archivada. Por ejemplo, puede ser que la variable sueldo no sea un buen predictor dentro de los modelos tal vez porque los clientes tienden a mentir sobre su salario, por lo que la correlación entre sueldo y riesgo es falsa, o por que los vendedores de crédito adulteran la cifra ante la posibilidad de obtener una aprobación segura del crédito vendido por parte del analista. 20 2.2 MÉTODOS EMPLEADOS EN LA CONSTRUCCIÓN DE SCORE DE CREDITOS Las técnicas más importantes en la construcción de modelos de score crediticio son: Modelos Estadísticos Se consideran los siguientes métodos: Métodos Paramétricos Comprenden técnicas como Análisis Discriminante (Discriminant Analysis) y Regresión Logística (Logistic Regression). Métodos No Paramétricos. Incluye técnicas de Árboles de Decisión, K-Nearest Neighbor (K-NN) y Kernel Density. Modelos de Computación Suave o Soft Computing Se plantean principalmente dos modelos: Redes Neuronales Artificiales (Artificial Neural Networks, ANN). Máquinas Vectoriales de Soporte (Support Vector Machines, SVM). Conjuntos Rugosos (Rough Sets). Modelos Híbridos Estos métodos representan una extensión a los modelos existentes y consisten en una combinación de técnicas estadísticas o de soft computing otros modelos relacionados. 21 La ilustración 3 muestra un organigrama sobre las técnicas mas utilizadas para desarrollar un modelo de score crediticio explicados anteriormente, además de una clasificación de las técnicas influyentes en la construcción del modelo. Ilustración 3. Técnicas Para el Desarrollo Scoring Crediticio Modelos de Scoring Crediticio Modelos Estadisticos Soft Computing Paramétricos Análisis Discriminante Regresion Logística K vecinos más cercanos No Paramétricos Redes Neuronales Arboles de Decisión Densidad de Kernel Modelos Hibrido Fuente: Revisión Bibliográfica Elaborado Por: Daniel Flores El organigrama presenta un resumen de la clasificación de los diferentes modelos para el desarrollo de un scoring crediticio, estos se clasifican en modelos estadísticos del cual se dividen en paramétricos (Análisis Discriminante y Logit) y tres no paramétricos (Árboles de regresión, K vecinos mas cercanos y la densidad de Kernel), además del modelo soft computing del que se deriva los modelos que utilizan redes neuronales y por último también se encuentran los modelos híbridos. 22 Los modelos paramétricos “parten de una función de distribución o clasificación conocida, y reducen el problema a estimar los parámetros que mejor ajusten las observaciones de la muestra”6. Los modelos no paramétricos, conocidos también como métodos de distribución libre pues no se encuentran sujetos a ninguna forma funcional, estos modelos presentan pocas restricciones, por lo que en ocasiones resultan, más fáciles de aplicar que los paramétricos y permiten reconstruir la función de clasificación en todo tipo de situaciones, incluidas aquellas en las que la función sea sencilla y conocida (por ejemplo, lineal). En los modelos de soft computing del que se deriva el modelo de redes neuronales esta conformado por un conjunto de procesadores simples interconectados a los cuales se les denomina nodos, organizados en capas lo que permite el procesamiento de la información. 2.3 REGRESION LOGÍSTICA La Regresión Logística (Logistic Regression, LR) es una técnica estadística ampliamente utilizada en los modelos de score crediticio, así como en otras áreas. Esta técnica considera un conjunto de variables independientes o predictoras y una variable dependiente con dos posibles valores (variable dicótoma) ejemplo: Vota o no vota en unas elecciones Diagnóstico positivo o negativo en una prueba médica 6 Martha Galicia Romero, nuevos Enfoques de Riesgo de Crédito 23 Las principales características que presenta este modelo se resumen en: Variables binarias: Identifica la pertenencia del individuo a cada uno de los grupos analizados: Se identifica con un 1 al individuo que pertenece al grupo cuya probabilidad de pertenencia estimará el modelo. Se identifica con un 0 al individuo que no pertenece al grupo objeto de análisis. Variables explicativas: Son las variables que sirven para discriminar entre los grupos y que determinan la pertenencia de un elemento a un grupo u otro. Pueden ser: Variables cuantitativas que un campo de variación que toma todos los valores reales Variables cualitativas con distintas alternativas u opciones posibles. Resultado del análisis: El resultado es un valor numérico que indica la probabilidad de pertenencia de un elemento al grupo que se le asignó el valor 1, es decir, el grupo objeto de análisis. La función logística es una función de distribución, y como se ha explicado toma los valores entre 1 y 0, tiene la forma de S como se muestra en el siguiente grafico: 24 Ilustración 4. Gráfico Función Logística Fuente: Introducción al análisis de regresión lineal Elaborado Por: Daniel Flores La forma general es: Ecuación 2. Modelo General z 1 1 e z Fuente: Introducción al análisis de regresión lineal Elaborado Por: Daniel Flores 25 Donde Z es la probabilidad de la clase recordando que la variable dependiente posee dos valores posibles. Para el caso de un modelo de score, se consideran dos posibles resultados: un cliente con buen hábito de pago y uno moroso. Para complementar, z obedece al siguiente modelo matemático: Ecuación 3. Función Lineal con Parámetros z w1x1 w2 x2 .... wn xn Fuente: Introducción al análisis de regresión lineal Elaborado Por: Daniel Flores Donde Xi (i = 1,2,..., n) es el conjunto de variables predictoras o conjunto de entrada, es el punto de intersección y Wi es el conjunto de coeficientes o vector de pesos W que ajustan el modelo. En nuestro caso las variables predictoras o Wi podrían ser las siguientes a modo de ejemplo: Monto del crédito. Plazo del crédito. Días de mora. Número de Calificaciones E en la base de la Central de riesgo, etc 26 Puesto que el modelo anterior no es lineal respecto a las variables independientes, se considera la inversa de la función logística, que es el logit o logaritmo de la odds o ventaja de que un suceso ocurra, definiéndose ésta como el cociente entre la probabilidad de que ocurra un acontecimiento y la probabilidad de que no ocurra, que es su complementaria, como puede observarse en la siguiente expresión: Ecuación 4. Función Logística log[ p ] w1 x1 w2 x 2 ..... wn x n 1 p Fuente: Introducción al análisis de regresión lineal Elaborado Por: Daniel Flores En donde p es la probabilidad del resultado de interés, ejemplo: la probabilidad a priori de que un individuo tenga buen hábito de pago o la probabilidad de que un individuo pueda ser moroso o incurrir en fraude. La formulación anterior facilita la interpretación del modelo y de sus coeficientes, que reflejan, de este modo, el cambio en el logit correspondiente a un cambio unitario en la variable independiente considerada. 27 Ejemplo: Predecir la probabilidad de tener tarjeta de crédito basado en los ingresos de una persona. Basado en la siguiente tabla de datos: Rango Ingresos 0-500 #Tarjetas Crédito # Casos 19 6 yi 3,16666667 500-600 0 0 0 600-700 0 0 0 700-800 15 4 3,75 800-900 32 7 4,57142857 900-1000 70 22 3,18181818 1000-1100 163 47 3,46808511 1100-1200 269 56 4,80357143 1200 - 1300 332 58 5,72413793 1300 - 1400 385 59 6,52542373 1400 - 1500 329 43 7,65116279 1500 - 1600 185 26 7,11538462 1600 - 1700 85 9 9,44444444 1700 - 1800 5 2 2,5 1800 - 1900 26 4 6,5 1900 - 2000 0 0 0 2000 - 2100 0 0 0 2100 - 2200 0 0 0 2200 - 2300 2 1 0 2300 - 2400 12 1 12 Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores 28 Variable Dependiente: 1 = Posee Poseer Tarjeta (previamente categorizada ) 0 = No posee Variables que no son cuantitativas: Nivel de Ingresos Nivel de Ingresos Variables Dummy Alto Medio Bajo Alto 1 0 0 Medio 0 1 0 Bajo 0 0 1 Sin Ingresos 0 0 0 Fuente: Tabla de Ejemplo Nivel de Ingreso Elaborado Por: Daniel Flores Creamos tres variables dicotómicas o categóricas las cuales no van a ser numéricas siendo estas unas variables dicotómicas: basándonos en el nivel de ingresos la primera de ellas sería “Alto”. Quien lo sea tendrá valor 1 en esa variable y valor cero en las variables “Medio” y “Bajo”. Los de nivel de Ingreso Medio tendrán valor 1 en la segunda variable y cero en las otras, etc. No necesitamos crear, en cambio, una variable llamada “Sin Ingresos”: lo será quien tenga valores cero en las tres anteriores. Esta última es la categoría base de las dummy. 29 Una vez realizada esta transformación, estas variables pueden ser incorporadas en una ecuación de regresión: sus valores sólo pueden variar entre cero y uno y sus coeficientes b indicarán, en cada caso, cuanto aumentan o disminuyen los “odds” de probabilidad del evento que se procura predecir cuando una de estas variables pasa de cero a uno. De lo explicado anteriormente la probabilidad de tener tarjeta de crédito se verá reflejada en la siguiente la función logística = Elaborado Por: Daniel Flores Donde: = Probabilidad de poseer Tarjeta de Crédito = Probabilidad de no poseer Tarjeta de Crédito Puesto que los datos se encuentran agrupados por el ingreso anual, la variable es la media del grupo. Así por ejemplo de la tabla indicada anteriormente de 6 personas con un ingreso de entre 0 y 500 dólares su media es de 19/6, observando que hay 20 rangos de ingresos diferentes de la muestra tomada. 30 Obteniendo el siguiente grafico (Ilustración 5) Ilustración 5. Gráfico de Dispersión 14 12 10 Y 8 6 4 2 0 0 500 1000 1500 2000 2500 3000 Ingresos Fuente: Microsoft Excel Datos de Ejemplo Elaborado Por: Daniel Flores Así pues arbitrariamente a manera de ejemplo se determinó que la probabilidad de poseer una tarjeta de crédito basada en los ingresos de una persona sería la siguiente: = exp ( 1 + 1 + exp ( 1 + ) 2 ) Fuente: Revisión Bibliográfica Elaborado Por: Daniel Flores Donde: es la probabilidad de que un sujeto posea una tarjeta de crédito con un ingreso 31 . Interpretándose la misma de la siguiente manera: Cuando el ingreso es mayor existe la posibilidad de poseer mayor número de tarjetas de crédito basándonos en la media obtenida con el grupo de ejemplo. Para lo cual previamente toco realizar una nueva reagrupación de los datos basándonos en la tabla de ejemplo anterior para no obtener valores igual a 0 y verificar que el modelo no sea rechazado. Rango #Tarjetas Ingresos Credito 0-500 # Casos yi 19 6 3,16666667 700-800 15 4 3,75 800-900 32 7 4,57142857 900-1000 70 22 3,18181818 1000-1100 163 47 3,46808511 1100-1200 269 56 4,80357143 1200 - 1300 332 58 5,72413793 1300 - 1400 385 59 6,52542373 1400 - 1500 329 43 7,65116279 1500 - 1600 185 26 7,11538462 1600 - 1700 85 9 9,44444444 1700 - 1800 5 2 2,5 1800 - 1900 26 4 6,5 2300 - 2400 12 1 12 Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores 32 Donde se obtuvo la gráfica ajustada en la que se observa la curva logística. Ilustración 6. Gráfica Resultado Ejemplo Regresión Logística yi 14 12 10 Y 8 6 yi 4 2 0 0 500 1000 1500 2000 2500 3000 Ingresos Fuente: Microsoft Excel Datos de Ejemplo Elaborado Por: Daniel Flores Con la imagen se puede demostrar que los puntos se ajustan a una curva en forma de s en la que se observa que a mayor ingreso existe mayor probabilidad de obtener o poseer mayor número de tarjetas de crédito. 33 CAPÍTULO III CAPÍTULO III 3. METODOLOGÍA En este capítulo trataremos sobre la metodología utilizada para el desarrollo del modelo del scoring y las fases que incluye el modelamiento. 3.1 MODELAMIENTO El modelo busca determinar el riesgo de no pago o incumplimiento futuro asociado a una operación crediticia, ordenando la población y dando la posibilidad de manejar ofertas comerciales diferenciadas por punto de corte. Dando adicionalmente la facilidad de utilizar múltiples puntos de corte que van desde el rechazo (punto mas bajo) hasta la aprobación inmediata (puntaje más alto otorgando rápidamente el índice de riesgo asociado a esa evaluación). Las fases que incluyen el proceso de modelamiento son las siguientes: 1. Selección de la muestra 2. Definición de buenos y malos clientes 3. Definición y selección de datos 4. Análisis preliminar de los datos 5. Análisis multivariado 6. Diseño del scorecard 7. Validación del modelo 34 3.1.1 Selección de la muestra Con la finalidad de desarrollar un sistema scoring es necesario contar con una muestra de clientes que tengan información historial credticia. Este requerimiento genera una dicotomía entre dos elementos de decisión. La muestra debe incorporar información suficiente acerca de las diferentes conductas de pago de los clientes (buena y mala conducta en los extremos) a fin de identificar las mejores características que lograrán recoger estos comportamientos. Es aquí justamente donde se genera el conflicto, dado que con esta muestra se necesita definir el criterio de bueno y malo a emplear para encontrar las características relevantes en el modelo. Para esto, en cambio, se necesitará información histórica suficiente y por lo tanto un razonable horizonte temporal. Para el caso de esta tesis de fijará un período de 72 meses, de información de datos de la base de la Central de Riesgo donde se encuentra información consolidada de los prestamos otorgados por las instituciones reguladas por la misma, contando con información que a la vez recoja una madurez adecuada (comportamiento estable). El período de observación es el tiempo t en el que el investigador decide situarse y observar el desempeño del cliente. Es este período de desempeño o performance el que va a ser empleado para predecir el comportamiento futuro. En el punto de resultado se asigna una calificación (bueno o malo) al cliente con base en un resumen del comportamiento en el periodo de desempeño. De ahí la importancia de madurez de la 35 cartera para no calificar como bueno a un cliente que es malo, pero que no logra denotar un comportamiento porque inicia a pagar su obligación. Integrada la información de deudores directos del Sistema Crediticio, se puedo obtener una muestra de aproximadamente un 1% de personas registradas en la base de datos integrada de la Central de Riesgo (obteniendo una muestra de las personas que tienen en su documento de identificación el dígito verificador último digito igual a 3). Adicionalmente se obtuvo una muestra con la información de la central de riesgo de cédulas cuyo último dígito sea igual a 8, esta muestra se utilizó para la validación final del modelo (backtesting). Para efectos de análisis se tomaron datos reportados por Instituciones Financieras Reguladas por la Superintendencia de Bancos a diferentes fechas desde enero 2002 hasta la ultima fecha de corte que se pudo obtener información reportada por las Instituciones Bancarias a la Superintendencia de Bancos y de la cual se realizará un análisis (backtesting) con la información mencionada hasta enero del 2007 hacia atrás para con esto verificar la probabilidad de predicción que posee el score. Lo explicado en los anteriores párrafos se refleja en la siguiente tabla donde mostramos el número total registros en la base datos de la Central de Riesgos reportada por las instituciones reguladas por la Superintendencia de Bancos, divididos por el último digito de la cédula de identidad y los primeros dos dígitos de la misma, de las cuales se 36 tomaron muestras aleatorias como se indicó de las cédulas que su último digito termina en 3 y en 8. Tabla 2. Número Registros por primeros y últimos dígitos de la Cedula Fuente: Direccion Nacional del Registro Civil Elaborado Por: Daniel Flores 37 3.1.1.1 Período de performance Como se mencionó anteriormente es importante escoger un período que reflejando la actual población de clientes muestre un comportamiento estable de cartera. Un indicador útil es la tasa de morosidad. tasademorosidad # demalosclientes # totaldeclientes Donde: # demalosclientes : Es el número de clientes malos # totaldeclientes : Es el total de clientes De tal forma que el indicar representa el porcentaje de clientes cuyo crédito se encuentra en estado de vencido en relación con el total de clientes. La tasa de morosidad se construye por período de cosecha (fecha de venta de las operaciones de crédito) y tiene por objeto mostrar en forma gráfica y por mes de colocación la relación clientes malos sobre total de clientes7, con el fin de señalar los períodos en que esta razón se estabiliza como equivalentes a un comportamiento estable de la cartera. Un periodo se considera como estable en la medida que la razón de la cosecha t presente pequeñas variaciones en relación a la cosecha t-1 y t+1. En términos estadísticos se 7 Credit Scoring and its Aplication, Lyn Tomas, David Edelman and Jonathan Crook 38 puede argumentar que se necesita, durante la ventana temporal elegida, que la razón tasa de morosidad siga una distribución uniforme. La elección de periodos con tasas de morosidad decrecientes no implica necesariamente una mejora en el comportamiento de la cartera, puede ser que estas cosechas por ser cercanas a la fecha actual estén reflejando carteras poco maduras y por ende no comparables con otros periodos de análisis. A este tipo de estudios se los conoce como análisis de cosechas. El siguiente esquema sintetiza la importancia del proceso de selección de la muestra, un acertado periodo de performance, con lo cual aseguramos que la definición de bueno y malo permita modelar un adecuado comportamiento de pago en el futuro. Ilustración 7. Esquema de Selección de la Muestra Fuente: Credi Report Buro de Información Creditica Elaboración Credit Report Buro de Información Crediticia 39 Así también que en el esquema arriba expuesto se puede observar que identificando las características del sujeto en el punto de observación basado en la información histórica que se posee se definirá si este sujeto es bueno o malo y a su vez se podrá verificar que tan predictor es el mismo al verificar su comportamiento basado en el score con información a fechas de corte de posteriores. 3.1.2 Definición de buenos y malos clientes La implementación de un modelo credit score requiere la definición de buen y mal cliente. Establecer que un cliente es malo no implica necesariamente que todos los restantes sean buenos. En el camino se pueden encontrar al menos dos definiciones adicionales. Los 'indeterminados' o aquellos casos que no se pueden definir como buenos o como malos, y los ' experiencia insuficiente' o aquellos casos en que la cuenta, producto de su poco o corto uso, no se puede definir como buena sin caer en un juicio prematuro. Resulta evidente que la definición escogida no va a afectar la metodología empleada para calificar al cliente. (esta asume que la definición crea una partición). Sin embargo, la forma como definamos buenos y malos sí va a tener efecto sobre los resultados del scoring. Cuando se habla de malos se busca describir al conjunto de clientes, que dada la experiencia no quiere seleccionar para su actividad intermediadora. Para el caso de los 40 modelos de riesgo, usualmente esta definición hace alusión a esa cartera que de conocer su comportamiento no se hubiese aceptado. De aquí se sigue que la definición de bueno y malo se basará prácticamente en el comportamiento de pago de los clientes: mora máxima histórica, mora promedio, contadores de mora (número de veces que ha caído en mora o reincidencia). Este criterio de selección es mucho más deseable pues asocia el criterio de bondad a una tasa de rendimiento, decidiendo la elección de bueno o malo con base en la máxima pérdida que se está dispuesto a asumir. Es evidente que estas definiciones pasan por un grado de subjetividad siendo tan conservadoras como lo quiera la entidad o viceversa. 3.1.3 Definición y selección de datos Como se mencionó inicialmente una de las dificultades que puede afrontar un modelo scoring es la escasez de una buena base de datos o incluso la ausencia de esta. Es importante, por ende, contar no sólo con una base de datos sino con un sistema de información adecuadamente construido con una lógica de almacenamiento de datos que permita contar con una codificación o representación numérica de las características cualitativas y cuantitativas que servirán para la aplicación de técnicas estadísticas. La definición y selección de los datos a incluir en el modelo requiere identificar las escalas de medida que pueden presentarse. 41 Existen dos grupos de variables a estudiar: las cualitativas y las cuantitativas. Las primeras son aquellas que no aparecen en forma numérica, sino como categorías o atributos (género, actividad económica, vivienda) y sólo pueden ser nominales u ordinales. Las variables cuantitativas, en cambio son aquellas cuyas categorías pueden expresarse numéricamente. Su naturaleza numérica permite un tratamiento estadístico más elaborado debido a las operaciones matemáticas que permiten. Estas variables pueden ser discretas o continuas. Las primeras son aquellas cuyas categorías sólo pueden tomar valores enteros. Por ejemplo la variable número de cargas familiares, no existe un cliente que pueda tener 2,3 cargas familiares. Las segundas son aquellas cuyas categorías pueden fraccionarse según cualquier entero, por ejemplo la variable salario. Una vez definido los tipos de datos con los que se puede trabajar se procede a seleccionar la información en función de las características disponibles. De lo expuesto se definió que esta tesis por tratarse de un modelo para deudores del sistema financiero ecuatoriano las variables a utilizar son las de un modelo de comportamiento, no de originación por lo tanto se han escogido las siguientes variables de alta importancia y sus combinaciones que mide el comportamiento de un determinado sujeto dentro del periodo de performance las cuales se muestran en la tabla siguiente: 42 COD_TIPO_ID C C C C C C C COD_ID_SUJE TO 1714738331 1714738331 1714738331 1714738331 1714738331 1714738331 1714738331 NUM_OPERA FEC_OPERACI VAL_TOTAL_X VAL_TOTAL_ VAL_VENCID VAL_DEM_JU VAL_CART_C COD_CALIFIC FEC_CORTE VAL_SALDO VAL_TOTAL CION ON V NDI O DICIAL ASTIGADA ACION 01100017002529 2 9/01/2003 30/06/2009 1570,59 1570,59 1570,59 0 0 0 0 A 4938493456724018 30/06/2009 30/06/2009 16,65 16,65 16,65 0 0 0 0 A 5545119008469610 30/06/2009 30/06/2009 127,33 127,33 127,33 0 0 0 0 A 5545119008469610 30/06/2009 30/06/2009 51,42 51,42 51,42 0 0 0 0 A 01100017002529 2 9/01/2003 31/05/2009 1642,37 1642,37 1642,37 0 0 0 0 A 4938493456724018 31/05/2009 31/05/2009 16,65 16,65 16,65 0 0 0 0 A 4938493456724018 31/05/2009 31/05/2009 97,09 97,09 97,09 0 0 0 0 A VAL_VENC_0 VAL_VENC_1 VAL_VENC_2 VAL_VENC_3 VAL_VENC_6 VAL_VENC_9 VAL_VENC_1 VAL_VENC_2 VAL_VENC_3 VAL_XVENCE VAL_XVENCE VAL_XVENCE VAL_XVENCE _1 _2 _3 _6 _9 _12 2_24 4_36 6 R R_1_3 R_3_6 R_6_12 0 0 0 0 0 0 0 0 0 72,39 73 222,73 462,78 0 0 0 0 0 0 0 0 0 16,65 0 0 0 0 0 0 0 0 0 0 0 0 17,51 35,68 55,18 18,96 0 0 0 0 0 0 0 0 0 2,14 4,02 5,43 8,97 0 0 0 0 0 0 0 0 0 70,17 70,92 217,34 456,05 0 0 0 0 0 0 0 0 0 16,65 0 0 0 0 0 0 0 0 0 0 0 0 97,09 0 0 0 VAL_XVENCE VAL_OPE_CU R_12 PO 739,69 3359,97 0 500 0 360 30,86 360 Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores 43 Las mismas que están definidas por: 1. Número de Operaciones Actuales e Históricas que posee el sujeto a calcular el scoring, esto es cuantos prestamos un sujeto obtenido a través de instituciones financieras dentro de un rango de tiempo. 2. Cantidad de Calificaciones E que de acuerdo a la Superintendencia de Bancos esta se clasifica de la siguiente manera: Tabla 3. Periodo Morosidad en Meses CALIFICACION PERIODO DE MOROSIDAD EN MESES TIPO DE RIESGO MAYOR A HASTA Riesgo Normal ---- Uno Riesgo Potencial Uno Tres Deficiente Tres Seis Dudoso Recaudo Seis Nueve Perdida Nueve En adelante Fuente: Superintendencia de Bancos y Seguros Elaborado Por: Daniel Flores 3. Saldo por vencer de 1 a 30 días.- Es el valor por vencer que consiste en la sumatoria de todos los dividendos por pagar en el plazo mencionado. 44 4. Saldo por vencer más de 1 a 3 meses.- Es el valor por vencer que consiste en la sumatoria de todos los dividendos por pagar en el plazo mencionado 5. Saldo por vencer más de 3 a 6 meses.- Es el valor por vencer que consiste en la sumatoria de todos los dividendos por pagar en el plazo mencionado 6. Saldo por vencer más de 6 a 12 meses.- Es el valor por vencer que consiste en la sumatoria de todos los dividendos por pagar en el plazo mencionado 7. Saldo por vencer más de 12 meses.- Es el valor por vencer que consiste en la sumatoria de todos los dividendos por pagar en el plazo mencionado 8. Valor que no devenga intereses de 1 a 30 días.- Es el valor que no genera interés cuando una operación crediticia se encuentra vencida en el rango de tiempo indicado. 9. Valor que no devenga intereses más de 1 a 3 meses.- Es el valor que no genera interés cuando una operación crediticia se encuentra vencida en el rango de tiempo indicado. 10. Valor que no devenga intereses más de 3 a 6 meses.- Es el valor que no genera interés cuando una operación crediticia se encuentra vencida en el rango de tiempo indicado. 11. Valor que no devenga intereses más de 6 a 12 meses Es el valor que no genera interés cuando una operación crediticia se encuentra vencida en el rango de tiempo indicado. 45 12. Valor que no devenga intereses más de 12 meses.- Es el valor que no genera interés cuando una operación crediticia se encuentra vencida en el rango de tiempo indicado. 13. Valor vencido de 1 a 30 días.- Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 14. Valor vencido más de 1 a 2 meses.- Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 15. Valor vencido más de 2 a 3 meses.- Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 16. Valor vencido más de 3 a 6 meses Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 17. Valor vencido más de 6 a 9 meses.- Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 18. Valor vencido más de 9 a 12 meses.- Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 19. Valor vencido más de 12 a 24 meses Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 46 20. Valor vencido más de 24 a 36 meses Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 21. Valor vencido más de 36 meses.- Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 22. Valor vencido de comisión Es el valor total vencido que consiste en la sumatoria de todos los dividendos que están en mora en el rango de tiempo indicado. 23. Valor en demanda judicial.- Es el valor de una operación que se encuentra en proceso de Demanda Judicial por parte de la institución financiera. 24. Cartera castigada.- Es el valor establecido como dudoso de recaudar por parte de la Institución Financiera. 25. Edad.- La edad en años de la persona a consultar el score, en este caso nos encontramos con un problema ya que no de todos las personas con crédito en el sistema ecuatoriano se posee la edad o a su vez depende de la calidad de la información que poseamos ya que esta puede no ser tan confiable y nos encontremos con valores inesperados como se indica en la ilustración 8. 47 Ilustración 8. Distribución de los Sujetos por Rangos de Edad Fuente: Instituciones Financieras Ecuatorianas Elaborado Por: Daniel Flores 3.1.4 Análisis preliminar de la Muestra En un principio todas las variables existentes en la base de datos deben ser seleccionadas, e incluso analizadas para que a partir de estas construir nuevas variables denominadas variables simples o de combinaciones de características como se describe en la ilustración 9. 48 Ilustración 9. Transformación de una variable Z4 X2 La variable fecha de apertura de la operación se puede transformar en la fecha en la que por primera vez fue reportada en la Central De Riesgo. Elaborado Por: Daniel Flores Así pues la ilustración 9 explica como una variable de entrada Z4 como por ejemplo la fecha de nacimiento se puede convertir en la edad siendo esta una variable de salida X2. Además en este análisis es necesario decidir sobre un esquema de segmentación para definir si se divide la muestra en subgrupos siempre y cuando estas tengan información especial o distintiva, en el caso de esta tesis no va a ser necesario ya que la muestra que se posee es homogénea. 49 3.1.5 Análisis Multivariado En esta etapa se validará la calidad y cantidad de información que se posee a través de un análisis exhaustivo de los mismos los cuales se dividen en: 3.1.5.1 Análisis Univariado El objetivo de esto es validar la calidad por cada variable en la muestra seleccionada. Este estudio cumple con los siguientes propósitos: Verificar con la integridad de los datos Detección de valores extremos Tratamiento por datos faltantes 3.1.5.2 Análisis Bivariado El objetivo de este análisis es evaluar la relación entre las variables independientes y las variables dependientes por ejemplo Variable Dependiente: Variable Dicotómica (1 Si es mayor a 60 dias de vencido en un préstamo otorgado por una institución financiera o 0 en caso contrario) 50 Variables Independientes Monto del préstamo otorgado, que tipo de crédito (vivienda, consumo, microcrédito, etc), montos vencidos, etc. Es así que a modo de ejemplo en las 2 siguientes tablas se puede identificar que se uso la combinación de las variables el valor por vencer a las cuales se les realizó una suma, el valor en mora siempre y cuando sea mayor a 2 meses, y un conteo de las operaciones las que cumplan con las dos condiciones anteriores. De los cuales se obtuvo los coeficientes de media y comparación, permitiendo analizar el comportamiento actual y pasado, verificando que estos valores se encuentran dentro de los rangos óptimos definidos para el modelamiento del score. Así también en la segunda tabla se realiza una combinación de variables como son los valores de cartera castigada y valores en demanda judicial a los cuales se les suma dentro de un rango de tiempo de los últimos 24 meses que se tiene en la información de la Central de Riesgo. Y de igual manera se obtuvieron los coeficientes y se observó que los ratios o coeficientes de medida y comparación se encuentran dentro de los parámetros aceptables. 51 Ejemplo: ¿Ha tenido una o más operaciones con mora mayor o igual a 2 meses en los últimos 24 meses, pero el total de deuda por vencer es mayor o igual a 0.33333 del deuda total tomando en cuenta los últimos 3 meses? La variable se denominara rfp3_2_cd_con Bivariada (sólo buenos y malos) Población Total rfp3_2_cd_con BMRatio MBRatio Total Malo Tasa de Malos %Total Total %Total 0 (no) 1.17 0.85 77,123 18,143 23.5% 94.6% 77,123 94.6% 1 (sí) 0.09 10.56 4,379 3,469 79.2% 5.4% 4,379 5.4% Total de deuda en cartera castigada o demanda judicial en los últimos 24 meses. La variable se denominará deuda_castplus Bivariada (sólo buenos y malos) Población Total deuda_castplus BMRatio MBRatio Total Malo Tasa de Malos %Total Total %Total 0 1.38 0.73 74,671 15,485 20.7% 91.6% 74,671 91.6% 0 <- 5000 0.06 16.71 3,804 3,263 85.8% 4.7% 3,804 4.7% 5000 <- 10000 0.03 36.17 787 731 92.9% 1.0% 787 1.0% 10000 <- 20000 0.03 34.35 710 657 92.5% 0.9% 710 0.9% 20000 < 0.01 75.74 1,530 1,476 96.5% 1.9% 1,530 1.9% Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores 52 3.1.6 Diseño del Score Card Diseño del Score Card se basa en los pesos y signos asignados a las características relevantes para identificar comportamiento de pago de un cliente. En su forma más simple es una tabla en la que se listan las variables seleccionadas y sus atributos con el puntaje asignado a cada uno8. Un puntaje negativo indica que la variable estaría premiando al cliente que cumpla con este atributo, mientras que una variable positiva estaría castigando. Un mayor o menor valor significa cuán importante es la variable en la calificación. De acuerdo al análisis realizado para esta tesis el score card que se utilizará será el siguiente: 8 Un score card es una tabla donde se presentan las características (variables) resultantes de la aplicación del modelo logístico, con el valor respectivo del parámetro ajustado para representar el valor de score con el que aporta cada una de las características. 53 Ilustración 10. Diseño del Score Card Cógido Sql set @n_score = -5.0418819189 + @i_b_avgmo_1_ec * 0.426007907 + @i_b_avgmo_2_ec * 0.615325305 + @i_b_avgmo_3_ec * 0.746487979 + @i_b_avgmo_4_ec * 0.835391271 + @i_b_avgmo_5_ec * 0.940640093 + @i_b_avgmo_6_ec * 1.163488941 + @i_b_avgmo_7_ec * 1.305610914 + @i_b_avgmo_8_ec * 1.525070427 + @i_b_wcurr_1_all * 0.633003213 + @i_c1a10_1_all * 0.527885872 + @n_c12_1a10_1_all * 0.435848447 + @n_c3_2a10_1_all * 0.372657094 + @i_cant_calificacion_e_1_all * 1.584073234 + @i_cant_no_devenga_12_1_pd * 0.169503353 + @i_cant_no_devenga_12_2_all * 0.31779479 + @i_cant_no_devenga_24_1_ec * 0.484176497 + @i_cant_por_vencer_12_1_all * 0.383397711 + @i_cant_tipo_riesgo_titular_1_ec * 0.378465063 + @i_cl1 * 0.687503404 + @i_cl2 * 0.495688296 + @i_cl3 * 0.384044386 + @i_cl4 * 0.187988401 + @i_copen_vig_3_1_all * -0.2652798865 + @i_copen_vig_3_1_ec * -0.1950141455 + @i_mnew_1_pd * 0.959436817 + @i_mold_vig_1_all * 0.639567949 + @n_rdt1s3_2_ec * 0.628773397 + @n_rdt1s3_3_ec * 0.281621939 + @i_rdt24_3a10_1_all * 0.538599523 + @i_rdt3_2a10_1_all * 0.936851865 + @i_rdt6_1a10_1_all * 0.302253614 + @i_rfp12_2_all * 0.18566022 + @i_rfp12_3_all * 0.430115998 + @i_rfp3_2_cd * 0.479899586 set @n_score = round(1000/(1+exp(-@n_score)),0) Fuente: Código Sql Elaborado Por: Daniel Flores Y como explicación se indicará la obtención de una de las variables que se utilizan en el diseño del score card, las demás se encuentran en el anexo 3 54 Desarrollo de la variable @i_rdt24_3a10_1_all Si el valor de la variable (@n_rdt24_3a10 < .00001) entonces la variable @i_rdt24_3a10_1_all toma el valor de 1 caso contrario toma el valor de 0 Donde: La variable @n_rdt24_3a10 toma el valor de 0 si @n_deuda_total_24 es igual a 0 caso contrario la variable se calcula de la siguiente manera @n_rdt24_3a10 = @n_d24_3a10/@n_deuda_total_24 Para lo que previamente se debe obtener las siguientes variables: @n_deuda_total_24 @n_d24_3a10 Así pues la variable @n_deuda_total_24 se obtiene de la suma total de los valores que adeuda una persona a las entidades reguladas por la Superintendencia de Bancos en los 24 meses anteriores a la fecha de calculo del credit scoring Y la variable @n_d24_3a10 se obtiene suma de los valores vencidos o en estado de mora con las entidades reguladas por la Superintendencia de Bancos en los 24 meses anteriores a la fecha de calculo del credit scoring 55 3.1.7 Validación del Modelo Para validar el modelo se realizó pruebas de backtesting o pruebas de pasado que tienen como fin probar la predictibilidad del modelo con datos del pasado y compararlos con el score calculado con información actual. Así pues la prueba de backtesting realizada se basó en el historial crediticio del sujeto con la cual se desarrollo una variable de prueba la cual consistía en que si el sujeto a partir de la fecha de calculo del scoring crediticio hasta un año después colocaba 1 si este caía vencido o tenia valores en mora o 0 si este no tenia valores vencidos o en mora en las instituciones reguladas por la Superintendencia de Bancos (Anexo 2). 56 CAPÍTULO IV CAPÍTULO IV 4. DESARROLLO En este capítulo se explicará sobre las herramientas utilizadas para el desarrollo de esta tesis y el sistema diseñado para la explicación del scoring crediticio. 4.1 DISEÑO Y DESARROLLO La aplicación tiene como objetivo ayudar al analista de crédito para que con el historial crediticio pueda darse cuenta que tan apto es una persona para ser sujeto de crédito ya que se basa en la probabilidad de mora del mismo. Además al ser una aplicación Web Service ayuda a que cualquier institución o persona pueda desarrollar su aplicativo y con la información enviada vía XML a través del internet pueda desarrollar sus propias pantallas de acuerdo a los estándares de la institución que desea utilizar. Así también los rangos de aprobación del crédito pueden ser parametrizables de acuerdo a la institución que utilice el sistema. 57 4.2 HERRAMIENTAS DE DESARROLLO 4.2.1 Microsoft .Net Es un entorno de desarrollo integrado (IDE, por sus siglas en inglés) para sistemas operativos Windows. Soporta varios lenguajes de programación tales como Visual C++, Visual C#, Visual J#, ASP.NET y Visual Basic .NET, aunque actualmente se han desarrollado las extensiones necesarias para muchos otros. Visual Studio permite a los desarrolladores crear aplicaciones, sitios y aplicaciones web, así como servicios web en cualquier entorno que soporte la plataforma .NET. Así se pueden crear aplicaciones que se intercomuniquen entre estaciones de trabajo, páginas web y dispositivos móviles. Microsoft .Net es una herramienta de desarrollo que puede usarse para crear plataformas independientes y dispositivos independientes del software. Se puede usar .Net Framework para tener datos disponibles a través del internet como es el caso de esta tesis. Algunas características principales y que se destacan por su relevancia son: Es un potente lenguaje orientado al desarrollo basado en objetos. Permite realizar aplicaciones más robustas y fáciles de depurar. 58 Es un lenguaje más simplificado y uniforme. El código es reutilizable y fácil de leer. Ilustración 11. Características Herramientas .Net Fuente: Curso 2310. Developing web Applications Using Microsoft Visual studio 2008 Elaborado Por: Daniel Flores 59 4.2.2 SQL Server 2005 Ilustración 12. Sql Server 2005 Fuente: Sql Server 2005 Elaborado Por: Daniel Flores Microsoft SQL Server es un sistema de gestión de bases de datos relacionales (SGBD) basado en el lenguaje Transact-SQL, y específicamente en Sybase IQ, capaz de poner a disposición de muchos usuarios grandes cantidades de datos de manera simultánea, así como las siguientes características: Soporte de transacciones. Escalabilidad, estabilidad y seguridad. Soporta procedimientos almacenados. Incluye también un potente entorno gráfico de administración, que permite el uso de comandos DDL y DML gráficamente. 60 Permite trabajar en modo cliente-servidor, donde la información y datos se alojan en el servidor y las terminales o clientes de la red sólo acceden a la información. Además permite administrar información de otros servidores de datos. Microsoft SQL Server constituye la alternativa de Microsoft a otros potentes sistemas gestores de bases de datos como son Oracle, Sybase ASE, PostgreSQL, Interbase, Firebird o MySQL. Es así que en SQL se almacenará los datos que se posee de la información de la Central de Riesgo, y además será en donde se calcule el scoring crediticio convirtiéndose esta en la capa de negocio del sistema, ya que así se evitará que el aplicativo tarde mucho tiempo en obtener los datos y calcular el score. 4.2.3 SPSS Statistical Package for the Social Sciences (SPSS) es un programa estadístico informático. En la actualidad, la sigla se usa tanto para designar el programa estadístico como la empresa que lo produce. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos. 61 De tal forma que en este proyecto el programa SPSS se utilizó para el análisis estadístico de las variables cualitativas del modelo y para obtener una visión de las variables que se deben utilizar en el desarrollo del score. 4.3 DISEÑO DEL SISTEMA 4.3.1 Web Service En concepto, un Web Service es un recurso programable y direccionable mediante una URL. Desde el punto de vista del programador, un Web Service es una clase, que se auto-define usando XML, y que es accesible mediante HTTP. La clase es auto-definida en XML para ofrecer al exterior un interfaz estándar con el que utilizar los métodos que proporciona y es accesible mediante HTTP por ser este el protocolo de aplicación utilizado por los navegadores web. Un servicio web es una herramienta que permite compartir programas lógicos y capacidades con numerosas aplicaciones web y aplicaciones Windows y con aplicaciones que pueden correr sobre otras plataformas. 62 Ilustración 13. Funcionamiento de un Web Service Fuente: Curso 2310. Developing web Applications Using Microsoft Visual studio 2008 Elaborado Por: Daniel Flores Con el grafico anterior se explica como funciona un Web Service que desde cualquier explorador que el cliente utilice coloca la dirección http que desea buscar, el XML Web Service responde con una lista de métodos designados y propiedades en XML. 63 4.3.2 Modelado del Sistema Se presenta a continuación el modelado del sistema, basado en la metodología UML. UML, o Lenguaje de Modelado Unificado es una especificación de notación orientada a objetos, el cual se compone de diferentes diagramas, los cuales representan las diferentes etapas del desarrollo del proyecto. El sistema de acuerdo a su estructura y para el cumplimiento de los objetivos propuestos se compone de la siguiente etapa. El diagrama que he visto conveniente mostrar para su mejor comprensión y tener una mejor visión de cómo está estructurado es el siguiente: Diagrama de caso de uso 64 4.3.3 Casos de Uso Este diagrama representa la funcionalidad completa de un sistema, mostrando su interacción con los agentes externos. Esta representación se hace a través de las relaciones entre los actores y los casos de uso dentro del sistema. Los diagramas de caso de uso definen conjunto de funcionalidades afines que el sistema debe cumplir para satisfaces todos los requerimientos que tiene a su cargo. Esos conjuntos de funcionalidades son representados por los casos de uso. Se pueden visualizar como las funcionalidades son representados por los casos de uso. Se pueden visualizar como las funciones más importantes que la aplicación puede realizar. Proceso de la Información Solicitud Web Service Es el proceso de ingreso de la información correspondiente al número de identificación del sujeto que solicita el crédito. Análisis En este proceso donde se realizará el estudio con los datos que se posee del sujeto para obtener el score crediticio. Aprobación o Negación Al finalizar el proceso de análisis vamos a obtener el Scoring de Aprobación Final del cliente (Aprobada, Analizar Solicitud, Rechazado o Sin Información para obtener score) 65 Ilustración 14. Caso de Uso Aprobado Rechazado Ingreso Solicitud Análisis datos Historial Crediticio Analizar Solicitud Sin Información Elaborado Por: Daniel Flores 4.4 Creación del Web Service Lo primero que se debe realizar es crear un clase que lo llamaremos wsScore, para que el código siguiente sea reconocido con un web service debe crearse con la extensión .asmx. 66 Ilustración 15. Código .Net Creación del Web Service <%@ WebService Language="C#" Class="wsScore" %> using using using using using System; System.Web; System.Web.Services; System.Web.Services.Protocols; System.Data; [WebService(Namespace = "http://tempuri.org/")] [WebServiceBinding(ConformsTo = WsiProfiles.BasicProfile1_1)] public class wsScore : System.Web.Services.WebService { public wsScore() { } //*************************************************************** //**************************** SCORE***************************** //*************************************************************** [WebMethod(Description = "Método Web que obtiene el score de un sujeto")] public DataSet Score(string tipoDocumento, string numeroDocumento, out string mensajeError) { try { mensajeError = string.Empty; if (tipoDocumento != "C") { mensajeError = "Tipo Documento errado"; return null; } if (tipoDocumento == "C") { if (numeroDocumento.Length != 10) { mensajeError = "Longitud de la cedula no valida"; return null; } } if (numeroDocumento.Length > 10) { mensajeError = "Longitud de la cedula no valida"; return null; } DataSet ds = new DataSet(); ds = BD.consultarScore(tipoDocumento,numeroDocumento, out mensajeError); DataSet ds1 = new DataSet(); ds1 = BD.VariablesRelevantesScore(tipoDocumento, numeroDocumento, 0, 36, out mensajeError); return ds; } catch (Exception ex) { mensajeError = ex.ToString(); return null; } } } Elaborado Por: Daniel Flores 67 La primera línea del código indica que se creó un web service <%@ WebService Language="C#" Class="wsScore" %>, el mismo que esta creado en codigo C# y que la clase implementada se llama wsScore. Para poder utilizar el web service creado se debe consumir el mismo de la siguiente manera: Agregar una referencia web como se indica en la siguiente ilustración Ilustración 16. Creación Referencia Web Fuente: Microsoft Visual .Net Elaborado Por: Daniel Flores 68 Como para esta tesis el web service se encuentra en el equipo y no se dispone de una dirección física realizamos la conexión a un servicio web del servicio local Ilustración 17. Busqueda del Servicio Web Fuente: Curso 2310. Microsoft Visual .Net Elaborado Por: Daniel Flores La siguiente pantalla indica los web services diponibles en la máquina local, para el caso de ejemplo debemos conectarnos al web service wsScore que fue creado con el código indicado anteriormente. 69 Ilustración 18. Selección del Web Seervice Fuente: Microsoft Visual .Net Elaborado Por: Daniel Flores Realizamos la conexión con el web service requerido y obtenemos una pantalla en la que confirmamos que la conexión es la requerida. 4.5 Probador Web Service El siguiente código es el desarrollado para realizar las pruebas de conexión con el web service desarrollo y poder verificar que los datos obtenidos con la conexión de la base de datos. 70 Ilustración 19. Codigo .Net Creación del Probador Web Service using using using using using using using using using System; System.Data; System.Configuration; System.Web; System.Web.Security; System.Web.UI; System.Web.UI.WebControls; System.Web.UI.WebControls.WebParts; System.Web.UI.HtmlControls; public partial class _Default : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) { } public CabeceraCR CredencialesGenericas = new CabeceraCR(); protected void btnEjecutar_Click(object sender, EventArgs e) { try { Score.wsScore wsScore = new Score.wsScore(); string MensajeError = string.Empty; DataSet dsDatos = new DataSet(); dsDatos = wsScore.Score(TipoDocumento.Text,NumeroDocumento.Text, out MensajeError); #region Generacion de HTML por resultados if (dsDatos == null) { throw new Exception(MensajeError); } //mostrar resultados. lblError.Visible = false; int tablasVacias = 0; int tablasConDatos = 0; int totalTablas = 0; foreach (DataTable dttTabla in dsDatos.Tables) { if (dttTabla.Rows.Count > 0) tablasConDatos++; else tablasVacias++; totalTablas++; } // Resumen General Label lblResumen = new Label(); lblResumen.Text = "<BR>----------------------------- RESUMEN GENERAL ---------------------------- "; lblResumen.Text += "<BR>Total Tablas: " + totalTablas; lblResumen.Text += "<BR>Tablas con datos: " + tablasConDatos; lblResumen.Text += "<BR>Tablas vacías: " + tablasVacias + "<BR>"; lblResumen.ForeColor = System.Drawing.Color.MidnightBlue; lblResumen.Font.Bold = true; pnlResultados.Controls.Add(lblResumen); 71 // Detalle de Tablas int Contador = 0; foreach (DataTable dttTabla in dsDatos.Tables) { Label lbl = new Label(); lbl.ID = "lbl" + "_" + Contador.ToString(); lbl.Text = "<BR>----------------------------- " + dttTabla.TableName + "----------------------------- "; lbl.Text += "<BR>Total Columnas: " + dttTabla.Columns.Count; lbl.Text += "<BR>Total Filas: " + dttTabla.Rows.Count; lbl.ForeColor = System.Drawing.Color.Salmon; if (dttTabla.Rows.Count == 0) { DataRow dtr = dttTabla.NewRow(); dttTabla.Rows.Add(dtr); } GridView dgv = new GridView(); dgv.ID = "dgv" + "_" + Contador.ToString(); dgv.DataSource = dttTabla; dgv.DataBind(); pnlResultados.Controls.Add(lbl); pnlResultados.Controls.Add(dgv); Contador++; } #endregion } catch (Exception ex) { lblError.Text = ex.Message; lblError.Visible = true; } } } Elaborado Por: Daniel Flores La pantalla obtenida con el desarrollo del web service es la siguiente la cual se obtiene previamente con una conexión con la base de datos desarrollada con los datos de muestra aleatoria obtenidos: 72 Ilustración 20. Pantalla Probador Web Service Probador Ws Score Parametros TipoDocumento 1714738331 NumeroDocumento 1714738331 Ejecutar ----------------------------- RESUMEN GENERAL ----------------------------Total Tablas: 4 Tablas con datos: 4 Tablas vacías: 0 ----------------------------- Table----------------------------Total Columnas: 1 Total Filas: 1 Calificacion ANALIZAR SOLICITUD ----------------------------- Table1----------------------------Total Columnas: 1 Total Filas: 1 Score 673,00 ----------------------------- Table2----------------------------Total Columnas: 2 Total Filas: 6 Indicador Valor Número de instituciones acreedoras actuales 3 Numero de operaciones vencidas 0 Porcentaje de deuda vencida 0.00% Porcentaje utilización de las tarjetas de crédito 22.72% Valor por Vencer de 0 a 1 mes de tarjetas 36.30 Valor por Vencer de 0 a 1 mes de tarjetas y operaciones 108.69 ----------------------------- Table3----------------------------Total Columnas: 2 Total Filas: 4 RangoScore Calificacion 1000 - 700 Aprobado 699 - 400 Analizar Solicitud 399 - 0 Rechazar Sin Información Sin Información para analizar Score Fuente: Pantalla Probador Web Service Elaborado Por: Daniel Flores 73 Por definición en este proyecto y como ejemplo de cómo una institución que utilice este sistema puede poner rangos al scoring para aprobar una solicitud de crédito de un sujeto determinado se puede poner rangos al score, para definir si un sujeto es apto o no al crédito solicitado de acuerdo a la siguiente tabla la cual puede ser parametrizada: Tabla 4. Parametrización Scoring Crediticio Rango Score Respuesta 1000 - 700 Aprobado 699 - 400 Analizar Solicitud 399 - 0 Rechazar Sin Información (Sin Información) analizar Score 74 para CAPÍTULO V CAPÍTULO V 5. CONCLUSIONES Y RECOMENDACIONES En este capitulo trataremos sobre las conclusiones y recomendaciones de utilizar un sistema de scoring crediticio. 5.1 CONCLUSIONES A través del scoring crediticio se puede pronosticar el desempeño de préstamos futuros, basados en el uso del conocimiento cuantitativo acerca del desempeño y características de préstamos pasados registrados en una base de datos electrónica, con la finalidad de optimizar y reducir errores en el análisis crediticio. Para el desarrollo del scoring crediticio se ha utilizado diferentes variables del historial crediticio de un sujeto, con el objetivo de que sea útil para la toma de decisiones minimizando el riesgo, en función de los datos históricos con el fin de preservar la integridad de los recursos preservados. El scoring crediticio no realiza un análisis discriminante, más bien utilizando técnicas matemáticas y estadísticas cuantifica el riesgo al que una institución se somete al entregar un crédito a un sujeto. 75 El scoring crediticio es consistente, por ejemplo dos personas con las mismas características crediticias tendrán el mismo score. Así también en base a la clasificación del score, se evidenció que clientes con altos puntajes en su score presentan menor nivel de riesgo que aquellos con puntajes bajos en su score, ya que estos incurren o han incurrido en mora en su historial de credito. El empleo de un modelo estadístico que permita segmentar la cartera de clientes no solo conduce a un mejor control del riesgo sino que, solo acompañado de una estrategia comercial lleva a incrementar las tasas de rentabilidad de los créditos colocados, permitiendo obtener un promedio mayor de retorno del crédito otorgado. En este estudio se contó con una sólida base de datos que permitió no sólo contar con información fiable sino de calidad permitiendo trabajar con una gran cantidad de variables simples y cruzadas sin la pérdida significativa de información. 5.2 RECOMENDACIONES Una principal recomendación que se puede dar es que el scoring crediticio es un modelo matemático que permitirá dar una probabilidad en base a un 76 historial de datos, y que no se le debe tomar como una herramienta de decisión, más bien a este sistema se lo debe tomar como una herramienta de ayuda muy confiable para la toma de decisiones, ya que al final el juicio humano es decir la decisión de un analista de crédito podría cambiar el resultado final basado en excepciones de experiencias pasadas. Otra de las consideraciones importantes para construir un buen modelo radica en la calidad de los datos escogidos y en la selección adecuada de las variables que influyen en los modelos. Otra recomendación es obtener una base de datos que contenga las siguientes características: estabilidad, madurez y representatividad, todo esto garantiza que luego del análisis los datos se pueda concluir sobre el comportamiento crediticio del cliente a través del score. El grupo establecido como rechazo puede ser considerado como parte de la población sujeto de crédito, eliminando los puntos de corte definidos en el modelo scoring, no obstante, esta sugerencia queda en manos de la institución o persona que va a utilizar. 77 BIBLIOGRAFÍA 1. Anderson T. W., An Introduction To Multivariate Statistical Analysis,Second Edition, Wiley, 1984 2. ALONSO MARTÍNEZ, C. (2001) "Credit scoring y consentimiento en la protección de datos", Perspectivas del sistema financiero, nº 72, pp. 85-91. 3. BANEGAS GARCÍA, C.; GARCÍA MARTÍNEZ, F. (2000) "El riesgo de crédito en la banca ante la nueva regulación del Banco de España", Banca & Finanzas, nº 60, pp. 69. 4. BERTRAN JORDANA, J. (1994) "Control y gestión de los riesgos financieros", Alta Dirección, nº 173, pp. 65-72. 5. LYN TOMAS , DAVID EDELMAN AND JONATHAN COOK , “Credit Scoring and its application”, SIAM Society for Industrial and Applied Mathematics, Filadelfia, 2002, pp. 115-120 6. MONTGOMERY, D., PECK, E., VINING, G. "Introducción al análisis de regresión lineal", Compañía Editorial Continental. Primera edición en español 7. PEÑA, D. (2002) Análisis de datos multivariantes. Madrid: Editorial McGraw-Hill. 8. GONZÁLEZ SÁNCHEZ, M. (2000) "Nuevas tendencias en la gestión de riesgos: riesgo de crédito". 9. SCHREINER, Mark. (1999) "Un Modelo de Calificación del Riesgo de Morosidad para los Créditos de una Organización www.microfinance.com 78 de Microfinanzas en Bolivia", 10. Hand, D.J. y W.E. Henley. (1997) “Statistical Classification Methods in Consumer Credit Scoring: A Review”, Journal of the Royal Statistical Association Series A, Vol. 160, No. 3 11. Lewis, E.M. (1990) An Introduction to Credit Scoring, San Rafeal: Athena, LIC# 9092258. DIRECCIONES ELECTRÓNICAS 12. http://hdl.handle.net/10469/61 13. www.superban.gov.ec. 14. http://www.dspace.espol.edu.ec/handle/123456789/1253 15. http://en.wikipedia.org/wiki/Multinomial_logit 79 ANEXOS ANEXOS 1. ANEXO 1 Análisis SPSS Variable dependiente Original Internal Value Value ,00 0 1,00 1 De acuerdo al calculo del score realizado a los meses de enero Enero 2008, Septiembre 2007, Octubre 2007, Noviembre 2007, Diciembre 2007 y Agosto 2007 se obtuvo la siguiente tabla de frecuencia: 80 Parameter Frequency ESTADO_ENERO_08 ,00 1,00 coding (1) 3097 1,000 6695 ,000 2937 1,000 6855 ,000 2633 1,000 7159 ,000 2790 1,000 7002 ,000 2847 1,000 6945 ,000 1243 1,000 8549 ,000 ESTADO_SEPTIEMB ,00 RE_07 1,00 ESTADO_OCTUBRE ,00 _07 1,00 ESTADO_NOVIEMB ,00 RE_07 1,00 ESTADO_DICIEMBR ,00 E_07 1,00 ESTADO_AGOSTO_ ,00 07 1,00 81 Con la obtención del ODDS de incurrir en mora X_N 5,00 0,00 -5,00 0,00 0,20 0,40 0,60 Probabilidad_nuevoscore 82 0,80 1,00 Al obtener los datos se realiza la regresión lineal, es decir el logaritmo natural de la ODDS de la variable dependiente (esto es el logaritmo de la razón de las proporciones de que un sujeto incurra en mora en un posible crédito) obteniendo el siguiente gráfico. 100,00 PROB_REDON 80,00 60,00 40,00 20,00 0,00 0,00 0,20 0,40 0,60 0,80 1,00 Probabilidad_nuevoscore En el cual se puede verificar que la muestra sigue una tendencia, que como en todo modelo existen casos que se encuentran fuera de del predictor, pero cabe mencionar que estos casos se deben a la calidad de los datos que se obtuvo para predecir el score. 83 2. ANEXO 2 Análisis EXCEL Se realizó pruebas estadísticas de poder discriminatorio en donde se obtuvo la siguiente tabla de resumen % % RANGO BUENOS % BUENOS MALOS MALOS TOTAL TOTAL DIF Puntaje de 1 a 2 411 9,3% 4.007 90,7% 4.418 8,2% 27,09% Puntaje de 3 a 139 1.587 31,7% 3.420 68,3% 5.007 9,3% 47,10% Puntaje de 140 a 620 3.217 50,5% 3.150 49,5% 6.367 11,8% 61,14% Puntaje de 621 a 866 5.427 79,9% 1.367 20,1% 6.794 12,6% 57,12% Puntaje de 867 a 899 4.066 86,7% 626 13,3% 4.692 8,7% 51,32% Puntaje de 900 a 927 4.375 90,9% 440 9,1% 4.815 8,9% 43,43% Puntaje de 928 a 936 4.213 91,7% 383 8,3% 4.596 8,5% 35,55% Puntaje de 937 a 945 6.691 94,1% 417 5,9% 7.108 13,1% 37,46% Puntaje de 946 a 954 5.401 95,4% 263 4,6% 5.664 10,5% 25,76% Puntaje de 955 a 999 4.485 96,2% 178 3,8% 4.663 8,6% 15,76% Total 73,7% 14.251 26,3% 54.124 100,0% 39.873 84 K-S En donde observamos que el nivel de K-S que es la medida de máxima diferencia absoluta entre las distribuciones acumuladas de buenos y malos, en nuestro caso se observa que es mayor al 15 % por lo que se puede explicar que el poder predictivo del scoring es aceptable. Además obtuvimos el coeficiente de Gini que obtuvimos comparando el porcentaje de los buenos contra el porcentaje de los malos clientes para los mismos puntajes obteniendo estos datos con el backtesting realizado. 1,2 1 0,8 0,6 %BA %MA 0,4 0,2 0 1 2 3 4 5 6 7 85 8 9 10 DATOS PERSONALES INDICADORES DEFINICION TIPO ID IDENTIFICACION SCORE BUENO/MALO EN EL SISTEMA C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100000306 0100009380 0100012103 0100013945 0100014570 0100027432 0100028851 0100030634 0100032846 0100035229 0100040724 0100045236 0100047612 0100048735 0100048800 0100053495 0100054998 0100055797 0100058791 0100061068 0100062439 0100065374 0100067768 0100069285 0100075746 0100076496 0100077668 0100077775 0100081876 0100082775 0100084540 0100089978 0100096874 0100098961 970 81 814 964 703 936 973 1 964 643 935 899 899 524 945 953 974 185 290 203 906 899 934 686 145 885 926 957 942 974 947 359 1 875 86 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 1 0 C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100107416 0100111343 0100111376 0100113513 0100117431 0100124668 0100140094 0100140383 0100142173 0100142892 0100144872 0100145093 0100146083 0100147693 0100152461 0100153501 0100156306 0100156819 0100157981 0100161942 0100163641 0100166081 0100166446 0100172410 0100177963 0100181569 0100184506 0100190727 0100193333 0100194885 0100205269 0100205939 0100206630 0100210269 0100210921 0100215839 0100217363 0100221720 0100225168 954 35 943 949 953 962 938 560 903 159 957 933 933 945 941 1 938 932 893 953 581 213 953 1 947 945 964 933 892 1 958 948 485 936 902 842 912 719 927 87 0 1 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100226133 0100229988 0100232388 0100235308 0100237304 0100240803 0100240829 0100241660 0100248665 0100252691 0100256163 0100256759 0100258763 0100258821 0100260249 0100263748 0100264894 0100270487 0100273408 0100275528 0100277599 0100277771 0100294420 0100296698 0100300052 0100304179 0100305317 0100310689 0100311166 0100311885 0100314087 0100315464 0100317882 0100317908 0100318062 0100318203 0100318427 0100318450 0100318518 936 962 836 956 946 974 159 916 54 70 939 99 934 944 888 949 946 953 953 932 939 278 946 943 968 954 955 959 895 957 957 905 914 1 934 928 62 931 928 88 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100318666 0100320035 0100320316 0100325745 0100326602 0100336338 0100338110 0100339605 0100346394 0100346758 0100348747 0100348945 0100356443 0100369396 0100371103 0100371590 0100372440 0100374131 0100396167 0100397058 0100400654 0100409010 0100413798 0100420728 0100421437 0100424324 0100435734 0100439009 0100441542 0100442359 0100442367 0100444603 0100445360 0100459114 0100466481 0100467943 0100476597 0100476944 0100487974 848 790 934 823 948 965 933 856 942 750 766 974 939 921 955 940 786 910 939 959 954 930 958 968 560 732 841 912 889 4 936 974 939 931 948 966 601 134 932 89 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100489921 0100493675 0100494343 0100510585 0100511054 0100511849 0100527969 0100531425 0100542562 0100554583 0100560721 0100561430 0100564707 0100579341 0100590660 0100591890 0100596360 0100597012 0100598564 0100601830 0100609106 0100610427 0100617455 0100620020 0100620699 0100621275 0100640978 0100642297 0100645555 0100651264 0100653260 0100653765 0100654110 0100655943 0100656248 0100659978 0100664424 0100664499 0100666031 553 950 944 954 974 974 963 959 505 906 959 909 928 773 942 26 943 734 879 13 13 951 930 938 947 958 55 951 654 290 516 961 961 821 965 941 962 886 865 90 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0 0 1 0 0 0 0 0 C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100666353 0100669415 0100679059 0100681477 0100699065 0100699990 0100700376 0100706613 0100709450 0100711365 0100719889 0100723881 0100728450 0100729789 0100730514 0100734185 0100735760 0100737964 0100747674 0100755586 0100759265 0100763382 0100763515 0100766138 0100767532 0100768316 0100770700 0100772250 0100774421 0100774462 0100779487 0100783844 0100785385 0100787787 0100788074 0100790534 0100790674 0100791532 0100792993 904 974 904 906 918 957 930 231 883 933 828 974 886 950 933 909 899 888 398 971 906 880 950 209 950 895 955 833 941 947 953 974 942 937 935 937 922 962 959 91 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C C C C C C C C C C C C C C C C C C C C C C C C C C C 0100797059 0100801281 0100804939 0100811793 0100814300 0100814615 0100815596 0100817410 0100820422 0100822030 0100824655 0100825009 0100825199 0100825827 0100828730 0100831601 0100834928 0100835370 0100837863 0100839323 0100840230 0100841162 0100841873 0100843630 0100845353 0100847888 0100852581 890 950 461 964 952 897 879 855 940 912 949 934 919 306 16 950 580 929 960 43 942 915 571 938 463 510 487 92 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3. ANEXO 3 DESARROLLO SQL DEL SCORE CARD set @i_c0 = @i_cant_total_1 - @i_cant_vencido_1 set set set set set set set set set set @i_c10 = @i_c9a10 @i_c8a10 @i_c7a10 @i_c6a10 @i_c5a10 @i_c4a10 @i_c3a10 @i_c2a10 @i_c1a10 @i_cant_judicial_1 = @i_cant_castigada_1 + @i_c10 = @i_cant_vencido_99_1 + @i_c9a10 = @i_cant_vencido_36_1 + @i_c8a10 = @i_cant_vencido_24_1 + @i_c7a10 = @i_cant_vencido_12_1 + @i_c6a10 = @i_cant_vencido_6_1 + @i_c5a10 = @i_cant_vencido_3_1 + @i_c4a10 = @i_cant_vencido_2_1 + @i_c3a10 = @i_cant_vencido_1_1 + @i_c2a10 set set set set set set set set set set set set @i_periodo = (select [Variables].[ValorMenorObtener]( 3,@i_mold)) @n_c3_0 = @i_cant_total_3/@i_periodo - @i_cant_vencido_3/@i_periodo @n_c3_10 = @i_cant_judicial_3/@i_periodo @n_c3_9a10 = @i_cant_castigada_3/@i_periodo + @n_c3_10 @n_c3_8a10 = @i_cant_vencido_99_3/@i_periodo + @n_c3_9a10 @n_c3_7a10 = @i_cant_vencido_36_3/@i_periodo + @n_c3_8a10 @n_c3_6a10 = @i_cant_vencido_24_3/@i_periodo + @n_c3_7a10 @n_c3_5a10 = @i_cant_vencido_12_3/@i_periodo + @n_c3_6a10 @n_c3_4a10 = @i_cant_vencido_6_3/@i_periodo + @n_c3_5a10 @n_c3_3a10 = @i_cant_vencido_3_3/@i_periodo + @n_c3_4a10 @n_c3_2a10 = @i_cant_vencido_2_3/@i_periodo + @n_c3_3a10 @n_c3_1a10 = @i_cant_vencido_1_3/@i_periodo + @n_c3_2a10 set set set set set set set set set set set set @i_periodo = (select [Variables].[ValorMenorObtener]( 12,@i_mold)) @n_c12_0 = @i_cant_total_12/@i_periodo - @i_cant_vencido_12/@i_periodo @n_c12_10 = @i_cant_judicial_12/@i_periodo @n_c12_9a10 = @i_cant_castigada_12/@i_periodo + @n_c12_10 @n_c12_8a10 = @i_cant_vencido_99_12/@i_periodo + @n_c12_9a10 @n_c12_7a10 = @i_cant_vencido_36_12/@i_periodo + @n_c12_8a10 @n_c12_6a10 = @i_cant_vencido_24_12/@i_periodo + @n_c12_7a10 @n_c12_5a10 = @i_cant_vencido_12_12/@i_periodo + @n_c12_6a10 @n_c12_4a10 = @i_cant_vencido_6_12/@i_periodo + @n_c12_5a10 @n_c12_3a10 = @i_cant_vencido_3_12/@i_periodo + @n_c12_4a10 @n_c12_2a10 = @i_cant_vencido_2_12/@i_periodo + @n_c12_3a10 @n_c12_1a10 = @i_cant_vencido_1_12/@i_periodo + @n_c12_2a10 set set set set set set set set @i_periodo = (select [Variables].[ValorMenorObtener]( 24,@i_mold)) @n_c24_0 = @i_cant_total_24/@i_periodo - @i_cant_vencido_24/@i_periodo @n_c24_10 = @i_cant_judicial_24/@i_periodo @n_c24_9a10 = @i_cant_castigada_24/@i_periodo + @n_c24_10 @n_c24_8a10 = @i_cant_vencido_99_24/@i_periodo + @n_c24_9a10 @n_c24_7a10 = @i_cant_vencido_36_24/@i_periodo + @n_c24_8a10 @n_c24_6a10 = @i_cant_vencido_24_24/@i_periodo + @n_c24_7a10 @n_c24_5a10 = @i_cant_vencido_12_24/@i_periodo + @n_c24_6a10 set set set set @n_c24_4a10 @n_c24_3a10 @n_c24_2a10 @n_c24_1a10 set set set set set set set set set set set if if if if if if if if if if if = = = = @i_cant_vencido_6_24/@i_periodo @i_cant_vencido_3_24/@i_periodo @i_cant_vencido_2_24/@i_periodo @i_cant_vencido_1_24/@i_periodo + + + + @n_c24_5a10 @n_c24_4a10 @n_c24_3a10 @n_c24_2a10 @n_d_0 = @n_deuda_total_1 - @n_deuda_vencido_1 @n_d_10 = @n_deuda_judicial_1 @n_d_9a10 = @n_deuda_castigada_1 + @n_d_10 @n_d_8a10 = @n_deuda_vencido_99_1 + @n_d_9a10 @n_d_7a10 = @n_@n_deuda_vencido_36_1 + @n_d_8a10 @n_d_6a10 = @n_deuda_vencido_24_1 + @n_d_7a10 @n_d_5a10 = @n_deuda_vencido_12_1 + @n_d_6a10 @n_d_4a10 = @n_deuda_vencido_6_1 + @n_d_5a10 @n_d_3a10 = @n_@n_deuda_vencido_3_1 + @n_d_4a10 @n_d_2a10 = @n_deuda_vencido_2_1 + @n_d_3a10 @n_d_1a10 = @n_deuda_vencido_1_1 + @n_d_2a10 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 (@n_deuda_total_1 = = = = = = = = = = = 0) 0) 0) 0) 0) 0) 0) 0) 0) 0) 0) set set set set set set set set set set set @n_rdt_0 = 0 else set @n_rdt_0 = @n_d_0/@n_deuda_total_1 @n_rdt_10 = 0 else set @n_rdt_10 = @n_d_10/@n_deuda_total_1 @n_rdt_9a10 = 0 else set @n_rdt_9a10 = @n_d_9a10/@n_deuda_total_1 @n_rdt_8a10 = 0 else set @n_rdt_8a10 = @n_d_8a10/@n_deuda_total_1 @n_rdt_7a10 = 0 else set @n_rdt_7a10 = @n_d_7a10/@n_deuda_total_1 @n_rdt_6a10 = 0 else set @n_rdt_6a10 = @n_d_6a10/@n_deuda_total_1 @n_rdt_5a10 = 0 else set @n_rdt_5a10 = @n_d_5a10/@n_deuda_total_1 @n_rdt_4a10 = 0 else set @n_rdt_4a10 = @n_d_4a10/@n_deuda_total_1 @n_rdt_3a10 = 0 else set @n_rdt_3a10 = @n_d_3a10/@n_deuda_total_1 @n_rdt_2a10 = 0 else set @n_rdt_2a10 = @n_d_2a10/@n_deuda_total_1 @n_rdt_1a10 = 0 else set @n_rdt_1a10 = @n_d_1a10/@n_deuda_total_1 93 set @i_periodo = (select set set set set set set set set set set set if if if if if if if if if if if [Variables].[ValorMenorObtener]( 3,@i_mold)) @n_d3_0 = @n_deuda_total_3/@i_periodo - @n_deuda_vencido_3/@i_periodo @n_d3_10 = @n_deuda_judicial_3/@i_periodo @n_d3_9a10 = @n_deuda_castigada_3/@i_periodo + @n_d3_10 @n_d3_8a10 = @n_deuda_vencido_99_3/@i_periodo + @n_d3_9a10 @n_d3_7a10 = @n_@n_deuda_vencido_36_3/@i_periodo + @n_d3_8a10 @n_d3_6a10 = @n_deuda_vencido_24_3/@i_periodo + @n_d3_7a10 @n_d3_5a10 = @n_deuda_vencido_12_3/@i_periodo + @n_d3_6a10 @n_d3_4a10 = @n_deuda_vencido_6_3/@i_periodo + @n_d3_5a10 @n_d3_3a10 = @n_@n_deuda_vencido_3_3/@i_periodo + @n_d3_4a10 @n_d3_2a10 = @n_deuda_vencido_2_3/@i_periodo + @n_d3_3a10 @n_d3_1a10 = @n_deuda_vencido_1_3/@i_periodo + @n_d3_2a10 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 (@n_deuda_total_3 = = = = = = = = = = = 0) 0) 0) 0) 0) 0) 0) 0) 0) 0) 0) set set set set set set set set set set set @n_rdt3_0 = 0 else set @n_rdt3_0 = @n_d3_0/@n_deuda_total_3 @n_rdt3_10 = 0 else set @n_rdt3_10 = @n_d3_10/@n_deuda_total_3 @n_rdt3_9a10 = 0 else set @n_rdt3_9a10 = @n_d3_9a10/@n_deuda_total_3 @n_rdt3_8a10 = 0 else set @n_rdt3_8a10 = @n_d3_8a10/@n_deuda_total_3 @n_rdt3_7a10 = 0 else set @n_rdt3_7a10 = @n_d3_7a10/@n_deuda_total_3 @n_rdt3_6a10 = 0 else set @n_rdt3_6a10 = @n_d3_6a10/@n_deuda_total_3 @n_rdt3_5a10 = 0 else set @n_rdt3_5a10 = @n_d3_5a10/@n_deuda_total_3 @n_rdt3_4a10 = 0 else set @n_rdt3_4a10 = @n_d3_4a10/@n_deuda_total_3 @n_rdt3_3a10 = 0 else set @n_rdt3_3a10 = @n_d3_3a10/@n_deuda_total_3 @n_rdt3_2a10 = 0 else set @n_rdt3_2a10 = @n_d3_2a10/@n_deuda_total_3 @n_rdt3_1a10 = 0 else set @n_rdt3_1a10 = @n_d3_1a10/@n_deuda_total_3 /* Definicion de d6_xay. Reemplaza a las deuda_vencido_x_6 */ set @i_periodo = (select [Variables].[ValorMenorObtener]( 6,@i_mold)) set @n_d6_0 = @n_deuda_total_6/@i_periodo - @n_deuda_vencido_6/@i_periodo set @n_d6_10 = @n_deuda_judicial_6/@i_periodo set @n_d6_9a10 = @n_deuda_castigada_6/@i_periodo + @n_d6_10 set @n_d6_8a10 = @n_deuda_vencido_99_6/@i_periodo + @n_d6_9a10 set @n_d6_7a10 = @n_@n_deuda_vencido_36_6/@i_periodo + @n_d6_8a10 set @n_d6_6a10 = @n_deuda_vencido_24_6/@i_periodo + @n_d6_7a10 set @n_d6_5a10 = @n_deuda_vencido_12_6/@i_periodo + @n_d6_6a10 set @n_d6_4a10 = @n_deuda_vencido_6_6/@i_periodo + @n_d6_5a10 set @n_d6_3a10 = @n_@n_deuda_vencido_3_6/@i_periodo + @n_d6_4a10 set @n_d6_2a10 = @n_deuda_vencido_2_6/@i_periodo + @n_d6_3a10 set @n_d6_1a10 = @n_deuda_vencido_1_6/@i_periodo + @n_d6_2a10 if if if if if if if if if if if (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 (@n_deuda_total_6 = = = = = = = = = = = 0) set @n_rdt6_0 = 0 else set @n_rdt6_0 = @n_d6_0/@n_deuda_total_6 0) set @n_rdt6_10 = 0 else set @n_rdt6_10 = @n_d6_10/@n_deuda_total_6 0) set @n_rdt6_9a10 = 0 else set @n_rdt6_9a10 = @n_d6_9a10/@n_deuda_total_6 0) set @n_rdt6_8a10 = 0 else set @n_rdt6_8a10 = @n_d6_8a10/@n_deuda_total_6 0) set @n_rdt6_7a10 = 0 else set @n_rdt6_7a10 = @n_d6_7a10/@n_deuda_total_6 0) set @n_rdt6_6a10 = 0 else set @n_rdt6_6a10 = @n_d6_6a10/@n_deuda_total_6 0) set @n_rdt6_5a10 = 0 else set @n_rdt6_5a10 = @n_d6_5a10/@n_deuda_total_6 0) set @n_rdt6_4a10 = 0 else set @n_rdt6_4a10 = @n_d6_4a10/@n_deuda_total_6 0) set @n_rdt6_3a10 = 0 else set @n_rdt6_3a10 = @n_d6_3a10/@n_deuda_total_6 0) set @n_rdt6_2a10 = 0 else set @n_rdt6_2a10 = @n_d6_2a10/@n_deuda_total_6 0) set @n_rdt6_1a10 = 0 else set @n_rdt6_1a10 = @n_d6_1a10/@n_deuda_total_6 /* Definicion de d24_xay. Reemplaza a las deuda_vencido_x_24 */ set @i_periodo = (select [Variables].[ValorMenorObtener]( 24,@i_mold)) set @n_d24_0 = @n_deuda_total_24/@i_periodo - @n_deuda_vencido_24/@i_periodo set @n_d24_10 = @n_deuda_judicial_24/@i_periodo set @n_d24_9a10 = @n_deuda_castigada_24/@i_periodo + @n_d24_10 set @n_d24_8a10 = @n_deuda_vencido_99_24/@i_periodo + @n_d24_9a10 set @n_d24_7a10 = @n_@n_deuda_vencido_36_24/@i_periodo + @n_d24_8a10 set @n_d24_6a10 = @n_deuda_vencido_24_24/@i_periodo + @n_d24_7a10 set @n_d24_5a10 = @n_deuda_vencido_12_24/@i_periodo + @n_d24_6a10 set @n_d24_4a10 = @n_deuda_vencido_6_24/@i_periodo + @n_d24_5a10 set @n_d24_3a10 = @n_deuda_vencido_3_24/@i_periodo + @n_d24_4a10 set @n_d24_2a10 = @n_deuda_vencido_2_24/@i_periodo + @n_d24_3a10 set @n_d24_1a10 = @n_deuda_vencido_1_24/@i_periodo + @n_d24_2a10 if @n_deuda_total_24 = 0 set @n_rdt24_0 = 0 else set @n_rdt24_0 = @n_d24_0/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_10 = 0 else set @n_rdt24_10 = @n_d24_10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_9a10 = 0 else set @n_rdt24_9a10 = @n_d24_9a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_8a10 = 0 else set @n_rdt24_8a10 = @n_d24_8a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_7a10 = 0 else set @n_rdt24_7a10 = @n_d24_7a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_6a10 = 0 else set @n_rdt24_6a10 = @n_d24_6a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_5a10 = 0 else set @n_rdt24_5a10 = @n_d24_5a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_4a10 = 0 else set @n_rdt24_4a10 = @n_d24_4a10/@n_deuda_total_24 94 if @n_deuda_total_24 = 0 set @n_rdt24_3a10 = 0 else set @n_rdt24_3a10 = @n_d24_3a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_2a10 = 0 else set @n_rdt24_2a10 = @n_d24_2a10/@n_deuda_total_24 if @n_deuda_total_24 = 0 set @n_rdt24_1a10 = 0 else set @n_rdt24_1a10 = @n_d24_1a10/@n_deuda_total_24 /*hasta aqui compila*/ /* Definicion de d24m_xay. Reemplaza a las deuda_vencido_x_nl24m */ declare @i_numMesesHist int set @i_numMesesHist = (select datediff(mm,'2002-01-01',@d_fec_corte)) set @i_periodo = (select [Variables].[ValorMenorObtener]( @i_numMesesHist,@i_mold)) --set @i_periodo = (select dbo.fn_get_min_value(30,@i_mold)) /* Ojo que 30 no es constante, representa la máxima cantidad de meses con historia */ set @n_d24m0 = @n_deuda_total_24m/@i_periodo - @n_deuda_vencido_24m/@i_periodo set @n_d24m10 = @n_deuda_judicial_24m/@i_periodo set @n_d24m9a10 = @n_deuda_castigada_24m/@i_periodo + @n_d24m10 set @n_d24m8a10 = @n_deuda_vencido_99_24m/@i_periodo + @n_d24m9a10 set @n_d24m7a10 = @n_@n_deuda_vencido_36_24m/@i_periodo + @n_d24m8a10 set @n_d24m6a10 = @n_deuda_vencido_24_24m/@i_periodo + @n_d24m7a10 set @n_d24m5a10 = @n_deuda_vencido_12_24m/@i_periodo + @n_d24m6a10 set @n_d24m4a10 = @n_deuda_vencido_6_24m/@i_periodo + @n_d24m5a10 set @n_d24m3a10 = @n_deuda_vencido_3_24m/@i_periodo + @n_d24m4a10 set @n_d24m2a10 = @n_deuda_vencido_2_24m/@i_periodo + @n_d24m3a10 /* Definicion de variables relativas históricas */ if (@n_deuda_total_3 > 0) set @n_rdt1s3 = @n_deuda_total_1/@n_deuda_total_3 else set @n_rdt1s3 = 0 if (@n_deuda_por_vencer_3 = 0) set @n_rfp3 = 0 else if (@n_deuda_total_3 = 0) set @n_rfp3 = 1 else if (@n_deuda_por_vencer_3/@n_deuda_total_3 > 1) set @n_rfp3 = 1 else set @n_rfp3 = @n_deuda_por_vencer_3/@n_deuda_total_3 if (@n_deuda_por_vencer_12 = 0) set @n_rfp12 = 0 else if (@n_deuda_total_12 = 0) set @n_rfp12 = 1 else if (@n_deuda_por_vencer_12/@n_deuda_total_12 > 1) set @n_rfp12 = 1 else set @n_rfp12 = @n_deuda_por_vencer_12/@n_deuda_total_12 /* Definicion de b_w_curr */ /* Constante de tolerancia usada: u$s 10 */ set @i_tol = 10 set @i_b_wcurr = 0 if (@n_deuda_judicial_1 > @i_tol) set @i_b_wcurr = 10 if (@n_deuda_castigada_1 > @i_tol) set @i_b_wcurr = 9 if (@n_deuda_vencido_99_1 > @i_tol) set @i_b_wcurr = 8 if (@n_@n_deuda_vencido_36_1 > @i_tol) set @i_b_wcurr = 7 if (@n_deuda_vencido_24_1 > @i_tol) set @i_b_wcurr = 6 if (@n_deuda_vencido_12_1 > @i_tol) set @i_b_wcurr = 5 if (@n_deuda_vencido_6_1 > @i_tol) set @i_b_wcurr = 4 if (@n_@n_deuda_vencido_3_1 > @i_tol) set @i_b_wcurr = 3 if (@n_deuda_vencido_2_1 > @i_tol) set @i_b_wcurr = 2 if (@n_deuda_vencido_1_1 > @i_tol) set @i_b_wcurr = 1 -- else /* Definicion de @n_b_avgmo */ if (@i_copen_12_mas > 0 ) set @n_b_avgmo = @i_mopen/@i_copen_12_mas else set @n_b_avgmo = 0 if (@s_CodDomicilio is null or @s_CodDomicilio ='0' or @s_CodDomicilio ='' or @s_CodDomicilio ='ý¦á¯_ú¨_Ã') --or not_number or invalid set @i_NumDomicilio =-1 else set @i_NumDomicilio = convert(float,@s_CodDomicilio) /* Definición de @s_scorecard */ if (@n_d24m2a10 = 0) set @s_scorecard = 'EC' else if (@n_d24m2a10 > 0 and @n_d_2a10 = 0) set @s_scorecard = 'PD' else if (@n_d24m2a10 > 0 and @n_d_2a10 > 0) set @s_scorecard = 'CD' else set @s_scorecard = 'ERR' 95 /* Definición de variables dummies */ if (3.7 <= @n_b_avgmo and @n_b_avgmo < 6.5 and @s_scorecard = 'EC') set @i_b_avgmo_1_ec = 1 else set @i_b_avgmo_1_ec = 0 if (6.5 <= @n_b_avgmo and @n_b_avgmo < 9.42308 and @s_scorecard = 'EC') set @i_b_avgmo_2_ec = 1 else set @i_b_avgmo_2_ec = 0 if (9.42308 <= @n_b_avgmo and @n_b_avgmo < 12 and @s_scorecard = 'EC') set @i_b_avgmo_3_ec = 1 else set @i_b_avgmo_3_ec = 0 if (12 <= @n_b_avgmo and @n_b_avgmo < 14.75 and @s_scorecard = 'EC') set @i_b_avgmo_4_ec = 1 else set @i_b_avgmo_4_ec = 0 if (14.75 <= @n_b_avgmo and @n_b_avgmo < 18.33333 and @s_scorecard = 'EC') set @i_b_avgmo_5_ec = 1 else set @i_b_avgmo_5_ec = 0 if (18.33333 <= @n_b_avgmo and @n_b_avgmo < 23.25 and @s_scorecard = 'EC') set @i_b_avgmo_6_ec = 1 else set @i_b_avgmo_6_ec = 0 if (23.25 <= @n_b_avgmo and @n_b_avgmo < 32.89286 and @s_scorecard = 'EC') set @i_b_avgmo_7_ec = 1 else set @i_b_avgmo_7_ec = 0 if (32.89286 <= @n_b_avgmo and @s_scorecard = 'EC') set @i_b_avgmo_8_ec = 1 else set @i_b_avgmo_8_ec = 0 if (@i_b_wcurr < 1 ) set @i_b_wcurr_1_all = 1 else set @i_b_wcurr_1_all = 0 if (@i_c1a10 < 1) set @i_c1a10_1_all = 1 else set @i_c1a10_1_all = 0 if (@n_c12_1a10 < .08333) set @n_c12_1a10_1_all = 1 else set @n_c12_1a10_1_all = 0 if (@n_c3_2a10 < .33333) set @n_c3_2a10_1_all = 1 else set @n_c3_2a10_1_all = 0 if (@i_cant_calificacion_e < 1) set @i_cant_calificacion_e_1_all = 1 else set @i_cant_calificacion_e_1_all = 0 if (@i_cant_no_devenga_12 < 1 and @s_scorecard = 'PD') set @i_cant_no_devenga_12_1_pd = 1 else set @i_cant_no_devenga_12_1_pd = 0 if (1 <= @i_cant_no_devenga_12 and @i_cant_no_devenga_12 < 4 ) set @i_cant_no_devenga_12_2_all = 1 else set @i_cant_no_devenga_12_2_all = 0 if (@i_cant_no_devenga_24 < 1 and @s_scorecard = 'EC' ) set @i_cant_no_devenga_24_1_ec = 1 else set @i_cant_no_devenga_24_1_ec = 0 if (1 <= @i_cant_por_vencer_12) set @i_cant_por_vencer_12_1_all = 1 else set @i_cant_por_vencer_12_1_all = 0 if (@i_cant_tipo_riesgo_titular < 1 and @s_scorecard = 'EC') set @i_cant_tipo_riesgo_titular_1_ec = 1 else set @i_cant_tipo_riesgo_titular_1_ec = 0 if (1 <= @i_copen_vig_3 ) set @i_copen_vig_3_1_all = 1 else set @i_copen_vig_3_1_all = 0 if (@i_copen_vig_3 < 1 and @s_scorecard = 'EC') set @i_copen_vig_3_1_ec = 1 else set @i_copen_vig_3_1_ec = 0 if (@i_mnew < 35 and @s_scorecard = 'PD') set @i_mnew_1_pd = 1 else set @i_mnew_1_pd = 0 if (@i_mold_vig < 3) set @i_mold_vig_1_all = 1 else set @i_mold_vig_1_all = 0 if (.01013 <= @n_rdt1s3 and @n_rdt1s3 < .27163 and @s_scorecard = 'EC') set @n_rdt1s3_2_ec = 1 else set @n_rdt1s3_2_ec = 0 if (.27163 <= @n_rdt1s3 and @n_rdt1s3 < .30037 and @s_scorecard = 'EC') set @n_rdt1s3_3_ec = 1 else set @n_rdt1s3_3_ec = 0 if (@n_rdt24_3a10 < .00001 ) set @i_rdt24_3a10_1_all = 1 else set @i_rdt24_3a10_1_all = 0 if (@n_rdt3_2a10 < .00063) set @i_rdt3_2a10_1_all = 1 else set @i_rdt3_2a10_1_all = 0 if (@n_rdt6_1a10 < .00001) set @i_rdt6_1a10_1_all = 1 else set @i_rdt6_1a10_1_all = 0 if (.82696 <= @n_rfp12 and @n_rfp12 < .97327) set @i_rfp12_2_all = 1 else set @i_rfp12_2_all = 0 if (.97327 <= @n_rfp12) set @i_rfp12_3_all = 1 else set @i_rfp12_3_all = 0 if (.33333 <= @n_rfp3 and @s_scorecard = 'CD') set @i_rfp3_2_cd = 1 else set @i_rfp3_2_cd = 0 96 /* Codificación de clusters */ if @i_NumDomicilio in (19602727, 32416715, 100451715, 100453400, 100453465, 100453640, 100455025, 113000975, 113001135, 113001405, 113001780, 113001840, 113002325, 113003555, 113003770, 113003970, 113004235, 113004280, 113004475, 113004540, 113300270, 113300565, 113301155, 113302405, 113304210, 113305005, 12600285, 12600730, 12600845, 12600860, 12600905, 12602255, 12602430, 12602570, 12602595, 12602680, 12603105, 12603165, 12603460, 12603685, 12603795, 12603850, 12603870, 12603980, 12604095, 12604200, 12604225, 12605135, 12605140, 12605290, 12651005, 12651760, 12651805, 12652385, 12653160, 12653505, 12654340, 12655420, 12700175, 12700885, 12705395, 12750395, 12750870, 12750890, 12751455, 12753375, 12754050, 12754565, 12755775, 12800750, 12801355, 12801490, 12802215, 12803360, 12803495, 12806085, 12850015, 12851130, 12853835, 12856045, 145900065 , 145900595, 145901205, 145901250, 145901295, 145901345, 145902285, 145903440 , 145903830, 145903950, 145904360, 145904485, 145905615, 145950090, 145950340 , 145950350, 145950880, 145951910, 145952565, 145953225, 145953580, 145955425 , 145955655, 146001720, 146003250, 146003320, 146003760, 146004305, 146005390 , 146050645, 146050970, 146051365, 146052795, 146053565, 146053780, 146054115 , 146055645, 146100180, 146101140, 146101635, 146102190, 146104300, 146106110 , 146150155, 146150715, 146151685, 146153420, 146155760, 147950875, 147951300 , 147956390, 149250710, 149251785, 149252750, 149253920, 149256445, 149261205 , 149262285, 149266700, 15550455, 15551690, 15555690, 170650165, 170650480, 170652600, 170652635, 170653735, 170655060, 170655495, 170700055, 170700060 , 170700650, 170700755, 170700850, 170703960, 170704155, 17806360, 180901375 , 180905515, 181351745, 181400335, 181400365, 181400675, 181400900, 181401185 , 181401320, 181401630, 181403905, 181405780, 181405900, 181450295, 181451210 , 181452375, 181452945, 181453300, 181453485, 181453585, 181455225, 181455785 , 181502270, 181503190, 181503200, 181504135, 181505105, 181552210, 181553885 , 181554110, 181555830, 181604310, 181604550, 181605835, 18554560, 18556565 , 188456555, 188504555, 18850575, 188506560, 18851175, 18852550, 18856595 , 191301675, 191305520, 19151535, 19151540, 19151545, 19151550, 19151555 , 19151560, 19151565, 19151570, 19151575, 19151580, 19151585, 19151590, 19152950, 19156435, 19550085, 19552725, 19556480, 19601650, 19606485, 196600915 , 196601145, 196601240, 196602015, 196602695, 196602955, 196604195, 196604505 , 196606315, 196652070, 196654105, 196656215, 196700985, 196702240, 196706295, 197750665, 197750945, 197751015, 197756355, 19906615, 199806625, 199806630 , 208001220, 208004415, 208006510, 208050235, 208056505, 208104165, 208106515, 216250760, 216251045, 216251285, 216251290, 216251330, 216251790, 216251795, 216254470, 216255710, 216401170, 216402095, 216403220, 216403690, 216405525, 216502720, 216503005, 216503020, 216503705, 216506500, 21655375, 217200600 , 217200780, 217202175, 217202765, 217203645, 217206140, 217451095, 217453750 , 217456325, 218650230, 218651090, 218653615, 218656300, 32350310, 32350375 , 32350585, 32351445, 32351825, 32352220, 32352885, 32353210, 32353575 ,32353945, 32405160, 40100250, 40100690, 40100910, 40101270, 40102065, 49951520 ,49956665, 51000035, 51000315, 51001485, 51001905, 51002480, 51002620, 51002920 ,51003530 , 51003965, 51004035, 51005465, 51005940, 51050125, 51051430, 51052150 ,51052865 , 51054015, 51054365, 51055820, 51150465, 51150830, 51150990, 51156070 ,51202460 , 51202890, 51203155, 51205305, 59300815, 59300960, 59301735, 59302115 ,59306450 , 61905475, 61950420, 61950445, 61950705, 61951280, 61952160, 61952165 ,61953035 , 61953040, 61953095, 61953515, 61953560, 61956290, 62005550, 62100555 ,62102730 , 62105430, 62150020, 62151465, 62151660, 62152485, 62152905, 62153025 ,62153820 , 62153845, 62154030, 62155010, 62200515, 62200615, 62201370, 62202260 ,62205255, 62250925, 62251110, 62251325, 62252400, 62252975, 62253335, 62255740 ,68306540 , 69006420, 73705790) set @i_cl1 = 1 else set @i_cl1 = 0 if @i_NumDomicilio in 100303290, 100303315, 100352785, 100353490, 100355980, 100400145, 100403800, 100404185, 100503415, 100505750, 100556190, 112901200, 112950290, 112950550, 113052360, 113053340, 113100485, 113100545, 113102605, 113102630, 113153535, 113155195, 113206025, 113252085, 113352520, 113353045, 113401845, 113403765, 114700360, 117300835, (100300100, 100300130 100305165, 100305440, 100353525, 100353590, 100401310, 100401710, 100405910, 100405955, 100550425, 100552060, 112901480, 112903610, 112952710, 112956320, 113053600, 113053665, 113100995, 113101000, 113105180, 113105595, 113200590, 113201230, 113252145, 113253265, 113353270, 113355400, 113404460, 113405020, 117301035, 117305810, ,100300530, 100302020 100351040, 100351215, 100353630, 100353810, 100402820, 100402915, 100455050, 100500955, 100552675, 100553365, 112904455, 112905270, 113051165, 113051190, 113053815, 113054145, 113101380, 113102120, 113150695, 113151495, 113204150, 113205175, 113255385, 113255680, 113400320, 113400790, 113452575, 113453935, 117403345, 117406260, 97 ,100302185, 100351360, 100355490 , 100403115 , 100502380 , 100554080 , 112950280 , 113052280 , 113056075 , 113102140 , 113153255 , 113205240 , 113350825 , 113401645 , 113456120 , 118150385 , if @i_NumDomicilio in 100303290, 100303315, 100352785, 100353490, 100355980, 100400145, 100403800, 100404185, 100503415, 100505750, 100556190, 112901200, 112950290, 112950550, 113052360, 113053340, 113100485, 113100545, 113102605, 113102630, 113153535, 113155195, 113206025, 113252085, 113352520, 113353045, 113401845, 113403765, 114700360, 117300835, (100300100, 100300130 100305165, 100305440, 100353525, 100353590, 100401310, 100401710, 100405910, 100405955, 100550425, 100552060, 112901480, 112903610, 112952710, 112956320, 113053600, 113053665, 113100995, 113101000, 113105180, 113105595, 113200590, 113201230, 113252145, 113253265, 113353270, 113355400, 113404460, 113405020, 117301035, 117305810, ,100300530, 100302020 100351040, 100351215, 100353630, 100353810, 100402820, 100402915, 100455050, 100500955, 100552675, 100553365, 112904455, 112905270, 113051165, 113051190, 113053815, 113054145, 113101380, 113102120, 113150695, 113151495, 113204150, 113205175, 113255385, 113255680, 113400320, 113400790, 113452575, 113453935, 117403345, 117406260, ,100302185, 100351360, 100355490 , 100403115 , 100502380 , 100554080 , 112950280 , 113052280 , 113056075 , 113102140 , 113153255 , 113205240 , 113350825 , 113401645 , 113456120 , 118150385 , 118151180, 118151450, 118153755, 118156530, 12605450, 134600330, 134602555 , 134606105, 166800150, 166800475, 166800735, 166801025, 166801260, 166801275 , 166802450, 166803055, 166803180, 166803195, 166803785, 166803985, 166804005 , 166804205, 166804510, 166805825, 166852310, 166853840, 166855650, 168806395 , 168810735, 168816705, 170600030, 170600080, 170600195, 170600430, 170600785 , 170600855, 170600865, 170601400, 170601440, 170601475, 170602055, 170602265 , 170602275, 170602525, 170602530, 170602540, 170602560, 170602690, 170602825 , 170602855, 170602895, 170602980, 170602985, 170603100, 170603325, 170603475 , 170603925, 170604085, 170604290, 170604325, 170605435, 170655190, 170705620 , 170752025, 170752330, 170754045, 170754090, 170756145, 170800680, 170803230 , 170806605, 177702410, 177706350, 178956415, 181350095, 181350190, 181350210 , 181350635, 181350800, 181350810, 181351625, 181351860, 181352435, 181352775 , 181352830, 181352860, 181353120, 181353355, 181353380, 181353730, 181354065 , 181355230, 181355455, 181355605, 181355840, 196550720, 196551390, 196551770 , 196552155, 196552170, 196553260, 196554010, 196556305, 21650795, 21651255 , 21651435, 21651890, 21653285, 21653545, 21653670, 21653710, 21653860, 21655035 , 21700170, 21702315, 21703655, 21703995, 21705975, 21803500, 21805245, 21855350 , 27606340, 29506470, 29506475, 32355065, 32355950, 32400935, 32400950, 32401335 , 32401410, 32401605, 32401725, 32401775, 32401895, 32401900, 32403305, 32403895 , 32404345, 32451085, 32452545, 32453410, 32454100, 32455115, 32502365, 32502745 , 32505610, 37656345, 39053875, 39056425, 40051125, 40051195, 40051765, 40051885 , 40052340, 40052900, 40054040, 40054070, 40054130, 40056165, 40105405, 40105970 , 40151150, 40152040, 40153435, 40155295, 40156250, 40201835, 40201875, 40202010 , 40205685, 40251055, 40251315, 40252205, 40252455, 40253680, 40256520, 51005310 , 51005500, 51005555, 51100135, 51100745, 51102475, 51102490, 51102760, 51106000 , 58251500, 58252965, 58256535, 61955630, 61956220, 61956230, 62000040, 62000045 , 62000410, 62001415, 62001705, 62002080, 62003295, 62003425, 62003450, 62005315 , 73500255, 73501120, 73505565, 73505805, 73506490, 73550325, 73551665, 73551815 , 73552005, 73553330, 73554215, 73554525, 73556670, 73600005, 73601420, 73601425 , 73601655, 73601700, 73601750, 73602350, 73604445, 73604450, 73606310, 73650390 , 73650775, 73651225, 73652075, 73654160, 73654495, 73656365, 73656370, 73656375 , 73700505, 73701385, 73702230, 73702465, 73702850, 73703650, 73706675, 73706680 , 73750805, 73751695, 73752715, 73754545, 73755040, 75855715, 76900740, 76903275 , 76904520, 76905850, 77050225, 77054480, 77054530, 77054535, 77055745, 77551075 , 77551080, 77551100, 77556335, 78600160, 78606570, 78756590) set @i_cl2 = 1 else set @i_cl2 = 0 if @i_NumDomicilio in (100305915, 100305960, 113006015, 113006100, 113006210, 12605330, 12605360, 12605930, 12606090, 132301600, 132301620, 132305480, 134400010, 134400050, 134400770, 134401925, 134402970, 134403185 ,134403625 , 134405265, 134405845, 134406585, 134451820, 134501800, 134503550 ,134505570 , 134506135, 134550105, 134550560, 134551115, 134551880, 134552810 ,134552990 , 134554490, 134655885, 134700220, 134701105, 134701610, 134702135, 134850240, 134853110, 134905505, 134950460, 134950540, 134951395, 134952090, 134955755, 135001070, 135006195, 135500265, 135502030, 135506170, 138401060, 138401065, 138406550, 139100580, 139101030, 139106430, 139706495, 139752305, 139756575, 152551020, 152552180, 152552640, 152553745, 152553790, 152555510, 156200025, 156200525, 156200940, 156201930, 156202755, 156203000, 156203050, 156206160, 156300510, 156300630, 156303720, 156304020, 156304295, 156305700, 156350670, 156350765, 156352770, 156353395, 156353890, 156355090, 156451235, 156451245 , 156455815, 157000685, 157003605, 157005070, 157250415, 157250490, 157252930, 157253660, 157256200, 159350215, 159350400, 159351050, 159351680, 159353480 , 159356455, 170600625, 170600725, 170602925, 170605015, 170605220, 170605235 , 170605260, 170605325, 170605530, 170605535, 170605540, 170605575, 170606005 , 170606035, 170606050, 170606240, 181355445, 181355545, 21750275, 21750345 , 21753595, 21753775, 21753900, 21754515, 21755995, 40055415, 61955590, 62050500, 62050610, 62051865, 62054430, 62055145, 62056080, 93906405) set @i_cl3 = 1 else set @i_cl3 = 0 98 if @i_NumDomicilio in (12605905, 85610930, 85610965, 85612035, 85612445 , 85613215, 85616720, 93900925, 94253975, 99866710, 113005320, 125150305 , 125150520, 125151265, 125151525, 125152875, 125155215, 125166685, 125201460, 125201740, 125205085, 125250140, 125256245, 125303015, 125303510, 125305800, 125353175, 125355185, 125402420, 125404425, 125405855, 125406115, 125406635, 125406640, 125406645, 125406650, 125406655, 125406660, 125406690, 125453130 , 125454330, 125456235, 12605075, 12605080, 12605370, 12605875, 12606010, 127105640, 127506330, 129456465, 129466695, 134405030, 134405280, 134405795 , 134505635, 134706030, 134750470, 134750840, 134751810, 134753445, 134753675 , 134755580, 134800380, 134800405, 134800495, 134800640, 134801160, 134803170 , 134803350, 134805250, 134806055, 134855150, 135005300, 170600440, 170605110 , 170605410, 170605935, 170605985, 170606020, 170805965, 170806600, 170850075 , 170851755, 170854440, 170855730, 170855860, 170855865, 170855870, 170856065 , 170856175, 170856180, 181355045, 181355560, 181355945, 73505625, 73556060 , 73655770, 73800245, 73800300, 73804000, 73805340, 76955460, 85600450, 85600655, 85600895, 85600930, 85600965, 85602035, 85602320, 85602445, 85603205, 85603215 , 85603570, 85603930, 85603940, 85604240, 85605210, 85605600, 85650120, 85650200 , 85650370, 85651505, 85651510, 85651515, 85652125, 85652225, 85652335, 85652670 , 85653405, 85653805, 85654170, 85654465, 85656205, 85700355, 85701010, 85701305 , 85703125, 85703280, 85703390, 85703430, 85703470, 85705670, 85750700, 85750980 , 85751530, 85752345, 85754230, 85755895, 85800070, 85800110, 85800435, 85800535 , 85800570, 85800620, 85802395, 85803455, 85803725, 85803955, 85804075, 85804125 , 85806130, 87851615, 87852130, 87853880, 87854055, 87856380, 90955470, 91255365 , 93851470, 93851640, 93851915, 93901870, 93902470 ,93902940, 93903030, 93904120 , 93905170, 93905355, 93905585, 93905720, 93905880, 93906095, 93906150, 93906400 , 93951340, 93954275, 93956285, 94000260, 94001855, 94002105, 94004500, 94050115 , 94051850, 94055920, 94056270, 94056275, 94056280 ,94200920, 94202390, 94203235 , 94205660, 94255925, 94301350, 94301595, 94304220, 94305120, 94305155, 94305200 , 94305765, 94305990, 94351830, 94353370, 94353740, 94353990, 94355675, 95055345 , 95105705, 96755725, 97150185, 97151670, 97155735, 97356255, 97900660 ,97906385, 98204435, 98206525, 98356545, 98706580, 98906410, 99201730, 99206440, 99406460 , 99856620) set @i_cl4 = 1 else set @i_cl4 = 0 if @i_NumDomicilio in (125155285, 134455665, 134506155, 134555485, 134755095, 85605205, 85605335, 93856225, 93905055, 93905125, 93905380, 93905695, 93905890, 93906185, 93906265, 94005275, 94100205, 94100605, 94100820, 94102355, 94103915, 94105130, 94106040, 94155100, 99656610) set @i_cl5 = 1 else set @i_cl5 = 0 /* Los casos de información no disponible van al cluster 4 */ if (@i_cl1 = 0 and @i_cl2 =0 and @i_cl3 =0 and @i_cl4 = 0 and @i_cl5 = 0) set @i_cl4 = 1 set @n_score = -5.0418819189 + @i_b_avgmo_1_ec * 0.426007907 + @i_b_avgmo_2_ec * 0.615325305 + @i_b_avgmo_3_ec * 0.746487979 + @i_b_avgmo_4_ec * 0.835391271 + @i_b_avgmo_5_ec * 0.940640093 + @i_b_avgmo_6_ec * 1.163488941 + @i_b_avgmo_7_ec * 1.305610914 + @i_b_avgmo_8_ec * 1.525070427 + @i_b_wcurr_1_all * 0.633003213 + @i_c1a10_1_all * 0.527885872 + @n_c12_1a10_1_all * 0.435848447 + @n_c3_2a10_1_all * 0.372657094 + @i_cant_calificacion_e_1_all * 1.584073234 + @i_cant_no_devenga_12_1_pd * 0.169503353 + @i_cant_no_devenga_12_2_all * 0.31779479 + @i_cant_no_devenga_24_1_ec * 0.484176497 + @i_cant_por_vencer_12_1_all * 0.383397711 + @i_cant_tipo_riesgo_titular_1_ec * 0.378465063 + @i_cl1 * 0.687503404 + @i_cl2 * 0.495688296 + @i_cl3 * 0.384044386 + @i_cl4 * 0.187988401 + @i_copen_vig_3_1_all * -0.2652798865 + @i_copen_vig_3_1_ec * -0.1950141455 + @i_mnew_1_pd * 0.959436817 + @i_mold_vig_1_all * 0.639567949 + @n_rdt1s3_2_ec * 0.628773397 + @n_rdt1s3_3_ec * 0.281621939 + @i_rdt24_3a10_1_all * 0.538599523 + @i_rdt3_2a10_1_all * 0.936851865 + @i_rdt6_1a10_1_all * 0.302253614 + @i_rfp12_2_all * 0.18566022 + @i_rfp12_3_all * 0.430115998 + @i_rfp3_2_cd * 0.479899586 set @n_score = round(1000/(1+exp(-@n_score)),0) 99 4. ANEXO 4 Base de Datos 100 101 102 103 104