EN
Ciencia de datos

Cómo los Gatitos Ayudaron a BBVA a Detectar el Fraude con Tarjetas de Crédito

13/03/2018
Un grupo de científicos de datos de BBVA Data & Analytics ha desarrollado un modelo de aprendizaje profundo que utiliza un novedoso enfoque para la detección de fraudes con tarjetas de crédito.

La metodología ha sido aplicada por los científicos de datos de BBVA, Juan Arévalo y Jordi Nin, junto con los profesores de la Universidad Politécnica de Valencia, Roberto Paredes y Jon Ander Gómez. Se inspira en el trabajo de Andrew Ng (Baidu’s Artificial Intelligence luminary) sobre redes neuronales construidas para hacer más eficiente el reconocimiento de imágenes.

Nin explica que exploraron un enfoque más eficiente para la formación de modelos y la clasificación de pruebas para una gran cantidad de transacciones, de las cuales sólo un puñado (esto es sólo comparativamente porque el fraude con tarjetas de crédito ascendió a 1.300 millones de euros en 2012, a pesar de representar sólo el 0,04% del total) se consideran fraudulentos.

En el conjunto de datos utilizado en este experimento de reconocimiento de patrones, sólo 1 de cada 5000 transacciones son fraudulentas. Los mayores desafíos para este tipo de conjuntos de datos desequilibrados son la dificultad de realizar un entrenamiento eficiente de una red neuronal; y, en segundo lugar, la necesidad de un reconocimiento rápido de una transacción sospechosa.

La solución fue aplicar el filtrado en cascadas para poder aislar qué transacciones son genuinas y obtener una muestra reducida con un máximo de compras fraudulentas con tarjeta de crédito para entrenar nuestra red neuronal profunda. “Encontramos que dos niveles de filtrado eran suficientes para reducir la proporción entre transacciones genuinas y fraudulentas a niveles aceptables”, señala Nin.

Esta red neuronal es una representación simplificada de la utilizada en el experimento de aprendizaje automático. El diagrama muestra dos filtros y el proceso final de capacitación del modelo para ayudar a determinar si una transacción es fraudulenta

Una técnica similar fue utilizada por Andrew Ng y un equipo de Google Brain’s al tratar de categorizar un número masivo de vídeos de Youtube por imágenes en miniatura. Presentado con un amplio tipo de imágenes el algoritmo de aprendizaje profundo enseñó a identificar gatos como una forma de hacer más eficiente el proceso de categorización, esto es agrupando la ocurrencia más común para optimizar el entrenamiento y reconocimiento.

Este principio permite procesar un enorme conjunto de datos y a través de la aplicación del aprendizaje profundo permite que el sistema aprenda de ellos, encontrando los patrones comunes y, por lo tanto, aislando los que no cumplen con un cierto criterio, con lo cual se logra una retropropagación más confiable y se logra un índice de éxito similar al de detección de fraude de tarjetas de crédito de otras soluciones comerciales disponibles para las instituciones financieras.

Para agilizar el entrenamiento de los modelos aplicamos diferentes técnicas: deserción, tasa de aprendizaje adaptativo, normalización por lotes y regularización de Maxnorm. En total, 4 capas ocultas son suficientes para detectar fraudes con tarjetas de crédito a una tasa aceptable.

Así es como los gatitos de Youtube ayudaron a detectar el fraude con tarjetas de crédito, un problema cada vez más complejo y esquivo que ahora tiene que lidiar con nuevas formas de tarjetas, pago inalámbrico y un área común en toda la zona euro.

Para más información sobre este trabajo consulta nuestro artículo científico
Para obtener más información sobre gatitos en YouTube, puedes ver esto