Las Voces de Ingenierías: Modelos de ciencia de datos aplicados en la medición del riesgo crediticio bancario
14/12/2022
Autor: Genaro Edgar Pérez García//Argelia Berenice Urbina-Nájera
Cargo: Estudiante de la Maestría en Ciencia de Datos e Inteligencia de Negocios//Profesora investigadora de la Facultad de Tecnologías de Información y Ciencia de Datos 

De acuerdo con el estudio sobre el crédito en México (Comisión Nacional Bancaria y de Valores, 2021), seis de cada 10 personas adultas tienen financiamiento, especialmente, a través de instrumentos informales. Esto es un incrementó en 6 puntos porcentuales (pp), al pasar de 51 al 57 por ciento de la población adulta en 2018. El dato anterior se relaciona positivamente con vivir en localidades urbanas, contar con mayor escolaridad, tener un empleo formal, recibir un mayor salario, ser hombre y tener entre 30 y 39 años.

En general, los solicitantes de algún tipo de crédito a instituciones financieras mexicanas cuentan con un rating, o calificación, tanto al solicitar un crédito como en el comportamiento de la vida de este. Las técnicas para la calificación crediticia surgen para identificar el riesgo de consumo y minimizar el porcentaje de clientes incumplidos. Con lo anterior, las instituciones bancarias o crediticias optimizan sus carteras para lograr un mejor negocio.

Usualmente, el riesgo se mide como la probabilidad que tiene un cliente de incumplir un crédito en un periodo determinado. Para conseguir esto, se mide un conjunto de variables en el pasado reciente fijando un punto en el tiempo (ancla). Después, se estima el desempeño de cada cliente en una ventana de tiempo posterior donde se le etiqueta con una marca dicotómica (bueno-malo) con base en criterios de negocio para determinar dicha característica (SAS, 2009). Por ejemplo, algunas definiciones comunes de malo serían: incumplimiento mayor a 90 días -12 meses después de la apertura del crédito, entrada a cartera vencida en 6 meses posteriores a la calificación, cuenta que causó quebranto a la institución en sus primeros 18 meses.

A pesar de lo complejo que puede ser predecir el comportamiento humano, el avance tecnológico aceleró el desarrollo de modelos de riesgo de crédito de tal manera que se hizo más común la inclusión de técnicas analíticas en la toma de decisiones. Construir dichos modelos es más rápido, más económico y objetivo que el análisis crediticio experto. Además, asignar una calificación reduce drásticamente el tiempo requerido para aprobar una línea de crédito. Otro beneficio subyacente es la objetividad intrínseca, ya que estos modelos se basan en técnicas y métodos científicos.

Para estimar el riesgo crediticio existen modelos tradicionales (Sistemas Expertos o de Calificación) y modernos (Modelo KMV, Modelo de valuación de Merton, Modelo Credimetrics de J. P. Morgan, Modelo Credit Risk +, …) (Saavedra García y Saavedra García, 2010). Estos modelos se han beneficiado del avance tecnológico y la posibilidad de explotar grandes volúmenes de datos a alta velocidad. 

Particularmente, la ciencia de datos permite el uso de modelos basados en el análisis descriptivo, exploratorio, inferencial, predictivo, causal o mecánico. Entre sus modelos de estimación de riesgo, destacan las técnicas analíticas clásicas como la regresión logística, el análisis discriminante, las redes neuronales y los árboles de decisión (Fuentes-Cabrera, J., Pérez-Vicente, H., 2015). También, se propone el uso de nuevos algoritmos como las máquinas de vectores de soporte y las máquinas de vectores de soporte de mínimos cuadrados. Sea cual sea la técnica, el objetivo es medir el riesgo que presenta el cliente de acuerdo con características de interés. Para dicho análisis, los datos más usados provienen de fuentes tradicionales como los reportes de buró de crédito. Sin embargo, en años recientes, algunas instituciones han incorporado fuentes no tradicionales como las redes sociales, el correo electrónico y el teléfono celular.

En resumen, los modelos de ciencia de datos proporcionan un solo número a cada cliente, el cual se puede interpretar como indicador confiable, de fácil comprensión, relacionado con la probabilidad del evento en estudio y que considera y consolida la información disponible para tomar una decisión efectiva en la cual ambas partes (cliente e institución bancaria) se ven beneficiados.

Referencias

Comisión Nacional Bancaria y de Valores. (2021). El crédito en México: producto, instrumentos y evaluación. https://bit.ly/3E5QLHG 

Saavedra García, M.L y Saavedra García, M. J. (2010). Modelos para medir el riesgo de crédito de la banca. Cuad. Adm. Bogotá (Colombia), 23 (40): 295-319

Xolani Dastile, Turgay Celik, Moshe Potsane,

Statistical and machine learning models in credit scoring: A systematic literature survey, Applied Soft Computing, Volume 91, 2020, 106263, ISSN 1568-4946,

https://doi.org/10.1016/j.asoc.2020.106263

Fuentes-Cabrera, J., Pérez-Vicente, H. (2015). Credit Scoring Model for Payroll Issuers: A Real Case. In: Pichardo Lagunas, O., Herrera Alcántara, O., Arroyo Figueroa, G. (eds) Advances in Artificial Intelligence and Its Applications. MICAI 2015. Lecture Notes in Computer Science(), vol 9414. Springer, Cham. https://doi.org/10.1007/978-3-319-27101-9_42

SAS Institute Inc. (2009). Building Credit Scorecards using Credit Scoring for SAS Enterprise Miner. A SAS Best Practices Paper, pp. 1–23.