Python, Pandas, Matplotlib, Seaborn, Looker Studio

EDA Steam Store Games

Análisis exploratorio del catálogo de Steam (27.075 juegos) para identificar tendencias de mercado, géneros dominantes y factores que influyen en el éxito de un videojuego. Incluye dashboard interactivo en Looker Studio.

Rol Data Analyst
Tecnologías Python, Pandas, Matplotlib, Seaborn, Looker Studio
Duración 2 semanas

El problema

Steam es la plataforma de distribución de videojuegos para PC más grande del mundo. El objetivo era analizar su catálogo aplicando una metodología orientada a preguntas de negocio concretas: cómo evoluciona el mercado, qué géneros dominan, si el precio influye en la calidad percibida y qué tipo de desarrolladores ofrecen mejor ratio calidad-precio.

Proceso

Se trabajó con un dataset de 27.075 juegos obtenido de la SteamSpy API y Steam Store API (Kaggle). El flujo siguió las fases de un EDA profesional: carga, limpieza y preprocesamiento, análisis exploratorio por preguntas de negocio predefinidas, y visualización con Matplotlib y Seaborn. Los resultados se sintetizaron en un dashboard interactivo en Looker Studio.

Resultados

El catálogo de Steam creció de ~400 juegos en 2013 a más de 8.000 en 2018. Action domina en volumen pero RPG lidera en valoración media. La correlación entre precio y valoración es de apenas 0.10, lo que demuestra que el precio no determina la calidad. Los estudios indie superan en ratio calidad-precio a los grandes estudios por un factor de 4-5x. Los juegos gratuitos y de pago obtienen valoraciones prácticamente idénticas (71.9% vs 71.4%).

Ver código en GitHub Ver dashboard → Volver a proyectos