Cargando Portfolio...

Portfolio de Proyectos

Soluciones innovadoras de Machine Learning y Deep Learning aplicadas a problemas reales de negocio

Portfolio Completo

Explora toda mi experiencia en Data Science, desde análisis exploratorio hasta implementaciones productivas.

📊 Data Science Aplicado a Negocios

Suite Empresarial Completa

Colección de 6 proyectos especializados aplicando Machine Learning a diferentes departamentos empresariales, desde Recursos Humanos hasta Mantenimiento Predictivo.

👥 HR Analytics 📈 Marketing ML 💰 Sales Forecasting ⚙️ Operations AI 📢 PR Intelligence 🔧 Predictive Maintenance

💰 Impacto Económico:

  • ROI Total: $2M+ anuales combinados
  • Eficiencia: 40-60% mejora procesos
  • Precisión: 80-95% según aplicación
Scikit-learn Clustering Time Series Computer Vision NLP

🌐 Neural Machine Translation con Transformers

Implementación desde Cero

Traductor neuronal avanzado implementando arquitectura Transformer completa desde cero, entrenado con el corpus Europarl v7 (2M+ pares de oraciones EN-ES).

🎯 Logros Técnicos:

  • Multi-head Attention: Implementación completa
  • Positional Encoding: Optimizado para secuencias largas
  • Beam Search: Decodificación avanzada
  • BLEU Score: Competitivo con modelos comerciales

📊 Resultados:

  • Dataset: 2M+ pares de oraciones
  • Reducción Costos: 70% vs traducción manual
  • Velocidad: 1000+ oraciones/minuto
Transformers Attention TensorFlow NLP BERT
Ver Código

🔍 Análisis de Mercado Gastronómico

Business Intelligence & EDA

Análisis exhaustivo del mercado gastronómico utilizando datasets de Yelp y Google Maps para generar insights accionables y recomendaciones estratégicas de negocio.

📋 Metodología Aplicada:

  • Data Acquisition: APIs de Yelp y Google Maps
  • EDA Avanzado: Patrones geográficos y temporales
  • Feature Engineering: Variables predictivas personalizadas
  • Insights Generation: Recomendaciones basadas en datos

📈 Entregables:

  • Dashboard Interactivo: KPIs del mercado
  • Análisis Competitivo: Benchmarking sectorial
  • Recomendaciones: Estrategias de expansión
Python Pandas API Integration Visualization BI
Ver Análisis

📊 TechCore - Dashboard Interactivo de Ventas (Power BI)

Business Intelligence & Data Engineering

Dashboard profesional de ventas para TechCore, cadena minorista de tecnología. Análisis de 30,000 facturas a lo largo de 11 años (4 ciudades, 6 sucursales, 44 productos), con modelo relacional y seguridad RLS.

🔧 Fases del Proyecto:

  • Fase 1: Limpieza y transformación de datos en Power Query
  • Fase 2: Modelo relacional estrella optimizado
  • Fase 3: Dashboard interactivo con RLS por sucursal

📈 Resultados:

  • Cobertura: 30,000 facturas · 11 años de histórico
  • KPIs: Revenue, sell-through, margen por marca/ciudad
  • Seguridad: RLS diferenciado por rol y sucursal
Power BI DAX Power Query Data Modeling RLS
Ver Proyecto

🏦 FinanceGuard Bank - Predicción de Churn con ML

Machine Learning · Clasificación · Negocio Financiero

Sistema predictivo de churn para 10,000 clientes bancarios con tasa de abandono del 20% anual. Se evaluaron 6 modelos (Logística, RF, XGBoost, LightGBM, CatBoost) con optimización de hiperparámetros y segmentación no supervisada.

🤖 Modelos Desarrollados:

  • Baseline: Regresión Logística interpretable
  • Champion: LightGBM + GridSearch optimizado
  • Clustering: K-Means para segmentación de riesgo
  • Visualización: ROC-AUC, Radar Charts, ROI analysis

💰 Impacto de Negocio:

  • Churn reducible: Mejora 30-40% en retención
  • El adquirir new cliente: 5-7x más caro que retener
  • ROI estimado: Recuperación $10M+ anuales en riesgo
Scikit-learn XGBoost LightGBM CatBoost K-Means
Ver Proyecto

⚙️ MLOps Pipeline - Predicción de Pagos Bancarios

MLOps · FastAPI · Docker · SonarCloud

Pipeline MLOps end-to-end para predicción de pagos a tiempo en carteras bancarias. Expone el modelo vía FastAPI REST, lo visualiza con Streamlit y orquesta ambos servicios con Docker Compose. 27 tests automatizados y análisis de calidad con SonarCloud.

🏗️ Arquitectura:

  • Feature Engineering: 35 variables engineered
  • Modelos comparados: 11 algoritmos evaluados
  • API REST: FastAPI + Uvicorn en producción
  • Contenedores: Docker Compose con red interna

✅ Calidad & Resultados:

  • Tests: 27 tests automatizados con pytest
  • Calidad: SonarCloud Quality Gate passed
  • Modelo: ROC-AUC = 1.0 (Decision Tree champion)
FastAPI Streamlit Docker MLOps SonarCloud pytest
Ver Proyecto
🎓 PROYECTO FINAL - HENRY

🛒 Nexus RecSys - Sistema de Recomendación E-Commerce

Recomendación · Deep Learning · FastAPI · Streamlit

Pipeline end-to-end (NB01–NB15) de sistema de recomendación sobre el dataset RetailRocket (2.75M eventos). Champion: Mega-Ensemble con NDCG@10 = 0.04310 (+50.8% vs baseline). Incluye API REST y dashboard interactivo con motor LLM.

🧠 Modelos Implementados:

  • Collaborative Filtering: SVD, BPR, EASE^R, RP3beta
  • Deep Learning: Mult-VAE^PR (PyTorch), SASRec (Transformer)
  • Graph: LightGCN, IPS debiasing
  • Champion: Mega-Ensemble greedy + Optuna

📈 Resultados:

  • NDCG@10: 0.04310 (+50.8% vs RP3+TD baseline)
  • Dataset: 2.75M eventos · ~20M snapshots de ítems
  • API: 7 endpoints FastAPI · Dashboard 5 páginas
PyTorch Transformers FastAPI Streamlit Optuna RecSys
Ver Proyecto

🚚 FleetLogix - Analytics de Logística con Datos Sintéticos

Data Engineering & Synthetic Data Generation

Proyecto de análisis de datos para FleetLogix, una empresa ficticia de logística. Implementa generación de datos sintéticos realistas para estudios de optimización de flota y análisis operacional.

🔧 Características Técnicas:

  • Generación de Datos: Datasets sintéticos realistas y escalables
  • Data Engineering: Pipeline ETL completo y automatizado
  • Analytics: KPIs operacionales y métricas de rendimiento
  • Visualización: Dashboards interactivos para toma de decisiones

📊 Resultados:

  • Datos Sintéticos: Generación de datasets realistas de logística
  • Análisis Operacional: Optimización de rutas y recursos
  • Insights de Negocio: Métricas clave de rendimiento de flota
Python Data Engineering ETL Synthetic Data Analytics
Ver Proyecto

📦 Repositorio Completo de Proyectos

¿Quieres explorar todos mis proyectos en un solo lugar? Visita el repositorio padre con la colección completa de proyectos de Data Science, Machine Learning y Deep Learning.

Deep Dive: Análisis de Sentimientos

Arquitectura técnica y metodología del proyecto estrella.

🏗️ Arquitectura del Modelo

📥 Preprocessing

  • Tokenización avanzada
  • Limpieza de ruido
  • Normalización de texto
  • Embedding layer personalizado

🧠 CNN Architecture

  • Multiple filter sizes (3,4,5)
  • Max pooling layers
  • Dropout regularization
  • Dense layers optimizadas

📊 Training Strategy

  • Cross-validation 5-fold
  • Early stopping
  • Learning rate scheduling
  • Ensemble methods

📈 Métricas de Performance

85.7% Accuracy
83.2% Precision
84.9% Recall
84.0% F1-Score

¿Interesado en Colaborar?

Estos proyectos representan solo una muestra de mi capacidad para transformar datos en valor empresarial. ¿Tienes un desafío similar?

Hablemos de tu Proyecto Ver Todo en GitHub