Defensa de Trabajo de Fin de Máster
Autores: Ronny Zapata y Miguel Caballero
Tutor: Manuel Lopez
Fecha: 10/11/2025
El fraude con tarjetas de crédito causa pérdidas millonarias y daña la confianza del cliente. Los métodos tradicionales son insuficientes ante la complejidad y evolución de los nuevos patrones de fraude.
Pérdidas económicas sustanciales para bancos y titulares de tarjetas.
Afecta la seguridad del consumidor en los sistemas de pago electrónico.
La detección robusta es un pilar para la sostenibilidad del sector financiero.
El objetivo principal de este estudio es identificar las técnicas de Machine Learning más eficientes y robustas para detectar transacciones fraudulentas, proporcionando una guía clara para su implementación en el sector bancario.
Desarrollar y entrenar un conjunto diverso de modelos de ML, desde árboles de decisión hasta redes neuronales y XGBoost.
Evaluar rigurosamente la efectividad de cada modelo utilizando métricas clave como F1-Score, Recall y AUC PR.
Proponer los enfoques más adecuados basados en los hallazgos empíricos, considerando distintos objetivos operativos.
Utilizamos un dataset público de Kaggle con transacciones europeas reales. Su principal característica y nuestro mayor desafío es el extremo desbalanceo entre clases.
De 284,807 transacciones, ¡solo el 0.17% son fraudulentas! Esto exige estrategias especializadas.
Evaluamos un espectro de algoritmos para obtener una visión completa, combinando modelos supervisados y no supervisados.
Para que los modelos aprendan a identificar el fraude correctamente, primero debemos "enseñarles" cómo es. Abordamos el desbalanceo de datos con dos técnicas avanzadas.
Crea nuevas muestras de fraude "sintéticas" pero realistas, basadas en las transacciones fraudulentas existentes. Es como crear "avatares" de los fraudes conocidos para tener más ejemplos de los que aprender.
Un enfoque de vanguardia donde dos redes neuronales compiten: una "falsificadora" (Generador) crea nuevos datos de fraude y una "detective" (Discriminador) intenta distinguirlos de los reales. El resultado son datos sintéticos de altísima calidad.
Tras balancear los datos con SMOTE, el modelo XGBoost Optimizado demostró ser el más robusto y equilibrado, superando a los demás en las métricas más importantes.
XGBoost Optimizado logra el mejor balance, detectando el 79% de los fraudes (Recall) con una precisión del 77%.
Al aumentar los datos con GANs, la Red Neuronal (NN) dio un salto cualitativo en su precisión, reduciendo drásticamente el número de falsas alarmas.
| Pred. Legítima | Pred. Fraude | |
|---|---|---|
| Real Legítima | 56625 | 26 |
| Real Fraude | 22 | 73 |
| Pred. Legítima | Pred. Fraude | |
|---|---|---|
| Real Legítima | 56639 | 12 |
| Real Fraude | 24 | 71 |
El modelo con GAN redujo los Falsos Positivos en más de un 50% (de 26 a 12), logrando la precisión más alta de todos los experimentos: 86%.
La elección del "mejor" modelo depende de la prioridad estratégica del banco: ¿maximizar la cantidad de fraudes detectados o minimizar las molestias a clientes inocentes?
Fortaleza: Mejor rendimiento general y mayor capacidad de detección (Recall del 79% y el mejor AUC PR de 0.8145).
Ideal para: Una estrategia que busca maximizar la cantidad de fraudes interceptados, aceptando un número moderado de falsas alarmas.
Fortaleza: Precisión excepcional (86%) y el F1-Score más alto (0.80), minimizando las falsas alarmas.
Ideal para: Una estrategia enfocada en reducir costes operativos y el impacto negativo en el cliente, al generar muy pocas alertas incorrectas.
Nuestro estudio comparativo ofrece una visión clara sobre la eficacia de distintas estrategias de Machine Learning en un escenario realista de detección de fraude.
Estos hallazgos se traducen en acciones concretas que las instituciones financieras pueden implementar para fortalecer sus sistemas de defensa contra el fraude.
Ir más allá de los sistemas basados en reglas y adoptar modelos de ML como XGBoost y Redes Neuronales, que capturan patrones complejos con mayor eficacia.
Evaluar los sistemas con métricas como AUC PR y F1-Score. La "exactitud" general es una métrica engañosa en problemas de fraude.
Integrar técnicas de manejo de desbalanceo (SMOTE/GANs) en el ciclo de vida del desarrollo de modelos para mejorar su rendimiento.
Este estudio sienta las bases para futuras investigaciones que pueden hacer los sistemas de detección aún más potentes, inteligentes y aplicables al mundo real.
Analizar transacciones no como eventos aislados, sino como una red conectada para descubrir redes de fraude complejas.
Investigar la arquitectura de sistemas para que estos modelos puedan dar una respuesta en milisegundos, aprobando o bloqueando transacciones en vivo.
Integrar herramientas que expliquen "por qué" un modelo marca una transacción como fraude, para dar poder a los analistas y mejorar la transparencia.
Gracias por su tiempo y atención.
Agradecemos a nuestro tutor, a la universidad y a todos los que nos han apoyado en este viaje.
Ronny Zapata - ronnysuero@gmail.com
Miguel Caballero - inv.e22.mc@gmail.com