Description
Este curso está diseñado para llevarte paso a paso desde los fundamentos del Big Data hasta el análisis avanzado con SQL moderno usando Apache Spark y Databricks, una de las plataformas más usadas en la industria.Comenzarás configurando tu entorno en Databricks Community Edition, conociendo su interfaz, catálogos y SQL Warehouses para que desde el primer día ejecutes consultas reales sobre grandes volúmenes de datos. Muy pronto entenderás por qué Excel deja de ser suficiente cuando los datos crecen, y aprenderás conceptos clave como escalabilidad horizontal, cómputo distribuido y MapReduce de forma clara y con analogías prácticas.Después entrarás al corazón del análisis moderno con la arquitectura Data Lakehouse y Delta Lake, donde trabajarás con datos consistentes, transacciones seguras y técnicas como Time Travel para auditar información histórica.A lo largo del curso dominarás Spark SQL en acción: creación de tablas y vistas, agregaciones, JOINs a gran escala, subconsultas, CTEs, funciones de fecha y texto, y herramientas avanzadas como funciones de ventana para rankings, acumulados y comparaciones temporales. También aprenderás a cargar datos de forma incremental con INSERT y MERGE, tal como se hace en entornos profesionales.No solo consultarás datos: entenderás cómo optimizar rendimiento con conceptos como predicate pushdown, particiones, shuffle y Z-Order.Finalmente, transformarás tus análisis en visualizaciones y dashboards interactivos dentro de Databricks y cerrarás con un proyecto real de negocio donde aplicarás todo lo aprendido de principio a fin.Este curso es tu puente práctico del SQL tradicional al mundo del Big Data en la nube.





Reviews
There are no reviews yet.