Proyectos

Una selección de proyectos donde aplico análisis de datos, machine learning y despliegue de modelos a problemas reales.

API REST de Predicción de Riesgo en Infracciones de Tráfico

API REST construida con FastAPI que predice si una infracción de tráfico es grave o no, permitiendo a aseguradoras evaluar el riesgo de un conductor en tiempo real.

Python, FastAPI, Scikit-learn, Pydantic, Uvicorn, Render

Predicción de Gravedad en Infracciones de Tráfico

Modelo de clasificación binaria para predecir si una infracción de tráfico es grave o no, permitiendo a aseguradoras ajustar primas de riesgo. Modelo final: LightGBM optimizado con ajuste de umbral, alcanzando un recall del 64% en la clase grave.

Python, Pandas, Scikit-learn, LightGBM, XGBoost, Seaborn, Matplotlib

EDA Evolución Vivienda y Paro en España

Análisis exploratorio de la evolución del precio de la vivienda y la tasa de paro en España entre 2014 y 2024, estudiando su relación por comunidad autónoma y extrayendo conclusiones sobre rentabilidad de compra frente a alquiler.

Python, Pandas, NumPy, Matplotlib, Seaborn, SciPy

EDA Steam Store Games

Análisis exploratorio del catálogo de Steam (27.075 juegos) para identificar tendencias de mercado, géneros dominantes y factores que influyen en el éxito de un videojuego. Incluye dashboard interactivo en Looker Studio.

Python, Pandas, Matplotlib, Seaborn, Looker Studio

Detección de Fraude en Tarjetas de Crédito

Modelo de clasificación para detectar transacciones fraudulentas en un dataset de 284.807 operaciones con un desbalance extremo de clases (0.17% fraudes). Modelo final LightGBM con umbral optimizado: detecta el 84.7% de los fraudes con solo un 0.03% de falsas alarmas.

Python, Pandas, Scikit-learn, LightGBM, XGBoost, SMOTE, Matplotlib, Seaborn