Qué vimos (y qué presentamos) en KDD 2019

Jose Antonio Rodriguez Serrano y Axel Brando

d&a blog

Una de las herramientas que incluye la app de BBVA es la que permite a los clientes conocer una estimación de los gastos e ingresos recurrentes para el próximo mes. Saber qué día vas a recibir el cargo del seguro del coche o una transferencia recurrente -y su importe- es clave porque ayuda a planificar mejor tus cuentas y controlar tu salud financiera.

Un equipo de la Factoría de Inteligencia Artificial del BBVA, de la que forma parte BBVA Data & Analytics, investiga ahora cómo enriquecer esta previsión aportando más información a los clientes, incluyendo la previsión de movimientos inusuales. El uso de redes neuronales profundas (Deep Neural Networks) resulta muy apropiado para hacer predicciones, pero su aplicación más extendida se basa en producir estimaciones puntuales, lo que supone una clara limitación en escenarios donde conocer la incertidumbre de esta predicción resulta crucial. En la publicación técnica presentada este año en el Workshop “Anomaly Detection in Finance”, dentro de la conferencia KDD 2019 celebrada el pasado mes de agosto en Anchorage (USA), nuestros compañeros José Rodríguez y Axel Brando, en colaboración con la Universidad de Barcelona, proponen el uso de redes neuronales profundas que den como resultado distribuciones en lugar de estimaciones puntuales, permitiendo también detectar transacciones inusuales de manera más eficiente.

Se trata de un trabajo en fase exploratoria, basado en el modelo previo sobre estimación de la incertidumbre con redes de regresión profunda (Deep Regression Networks), publicado el año pasado en la conferencia técnica ECML/PKDD 2018. Ahora, esta línea de trabajo dentro de la Factoría de Inteligencia Artificial del BBVA continúa con un artículo recientemente aceptado en NeurIPS.

Más allá de la presentación de este paper, la conferencia “Knowledge Discovery and Data Mining” de este año (KDD 2019) estuvo repleta de novedades y nuevas aplicaciones basadas en la ciencia de datos. A continuación os ofrecemos un resumen de aquello que nos resultó más relevante, prestando especial atención a las aplicaciones en sistemas y productos del mundo real, y aquellas enfocadas a las industrias bancaria y financiera.

Una conferencia en… Ciencia de Datos

Muchos científicos de datos sienten que la mayoría de las conferencias sobre Machine Learning e Inteligencia Artificial mejor puntuadas (A*) no hablan en el idioma de la ciencia de datos. KDD es una excepción. Se describe a sí misma como una conferencia dirigida explícitamente a la comunidad de ciencia de datos. Las diferencias respecto a otras son la apuesta por establecer un espacio en ciencia de datos aplicada, las nuevas charlas de invitados, con ponentes expertos en ciencia de datos, y la realización de tutoriales prácticos. El nivel técnico sigue siendo muy alto, pero los problemas a resolver vienen del mundo real. Para los más interesados, todos los artículos de la conferencia están disponibles en su web.

Este año se presentaron muchos artículos sobre grafos, especialmente Knowledge Graphs y Graph Convolutional Networks. En este sentido, Alibaba presentó su plataforma AliGraph, y, en el sector financiero, vimos cómo trabaja Capital One con técnicas de graph embeddings. Un artículo interesante proponía utilizar grafos para modelar conjuntamente conceptos e instancias en una base de conocimiento (“Universal Representation Learning of Knowledge Bases by Jointly Embedding Instances and Ontological Concepts”), mientras otro titulado “OAG: Toward Linking Large-scale Heterogeneous Entity Graphs” presentaba un algoritmo de aprendizaje profundo (Deep Learning algorithm) para la vinculación de registros en grafos de entidades a gran escala, a través de un repositorio de GitHub.

Una grata sorpresa fue distinguir diferentes aplicaciones con datos bancarios, financieros y transaccionales en una de las principales conferencias, como es KDD. Los artículos más relevantes en esta categoría fueron “E.T.-RNN: Applying Deep Learning to Credit Loan Applications”, de Sberbank,  “AlphaStock: A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks Quantitative trading with Deep Reinforcement Learning” y “Anomaly Detection for an e-commerce pricing system”, de Walmart Labs. Ya fuera del sector financiero, el muy recomendable trabajo “150 successful Machine Learning models: 6 lessons learned at Booking.com” plantea cómo aplicar el aprendizaje automático (machine learning) de una manera muy enfocada a resolver desafíos de negocio reales y tener un gran impacto en los usuarios.

Pero también vimos artículos que abordaban el trabajo en respuestas inteligentes y en generación de texto para productos (Gmail con Google Smart Compose o Uber con su implementación de respuestas inteligentes), así como los métodos para aliviar el “arranque en frío” (cold-start), un problema que a menudo se enfrenta con los conjuntos de datos de texto internos, y que se ignora en la academia. El paper “How to Invest my Time: Lessons from Human-in-the-Loop Entity Extraction” estudia cómo etiquetar entidades en un nuevo corpus, descubrir nuevas entidades y aprender de forma incremental.

La charla de Rich Caruana, titulada “Friends don’t let friends deploy black-box models”, se centró en lo que ya se está convirtiendo en todo un clásico en estas conferencias: un tutorial que profundiza en los “tonos de gris” de la interpretabilidad a través de ejemplos reales.

Workshop en “Anomaly Detection in Finance”

De forma complementaria a la conferencia principal, en el Workshop sobre detección de anomalías en el sector financiero hubo representación de equipos de científicos de datos de otros bancos e instituciones financieras, como es el caso de Rabobank, que presentó un prototipo de visualización para ayudar a los analistas a detectar transacciones fraudulentas utilizando las características de SHAP y las proyecciones de MDS (en colaboración con la Universidad de Eindhoven) o Deutsche Bundesbank, PwC y la Universidad St. Gallen, que propusieron un método para detectar el fraude en las operaciones corporativas mediante la detección de anomalías en las transacciones ERP (utilizando adversarial autoencoders).

Capital One presentó un método para detectar puntos de cambio en series de tiempo, mientras el Centro de Investigación MIT-IBM propuso un algoritmo para detectar el lavado de dinero en grafos financieros (artículo relacionado). Uber, que también estuvo presente, expuso artículos sobre detección de falsos pasajeros y cuentas falsas. Después de todo, Uber también procesa transacciones financieras.