Curso
Big Data con PySpark
La ingeniería de datos se posiciona como una de las disciplinas más críticas (y difíciles de automatizar) en la era de la IA, precisamente porque es el cimiento sobre el que toda organización se construye. Mientras los algoritmos avanzan, alguien debe diseñar, orquestar y garantizar la calidad de los pipelines que mueven volúmenes de datos cada vez más masivos, heterogéneos y en tiempo real.
Ver temario del cursoEmpezar cursoFlex
~5 semanas
Experto
Acceso Exclusivo
Certificación de curso válida para tu CV
Contenido práctico desde el día uno
Clases en vivo personalizadas
App propia con todo tu aprendizaje organizado en un solo lugar
Clases asincrónicas siempre disponibles en nuestra app
Talleres mensuales con certificación para mantenerte actualizado
Comunidad activa de estudiantes y expertos

Temario
En esta clase se introduce el ecosistema Databricks dentro del paradigma Lakehouse, explicando cómo integra ingeniería de datos, analítica y machine learning en una misma plataforma. Se abordan también conceptos como Data Governance, implementación con Unity Catalog, y un recorrido práctico por la interfaz de Databricks Free Edition.
En esta clase se profundiza en el funcionamiento interno de Apache Spark como motor de procesamiento distribuido. Se explica su arquitectura, el rol del driver y los executors, el concepto de DAG y el modelo de lazy evaluation, entendiendo cómo se planifican y ejecutan las transformaciones sobre grandes volúmenes de datos. También se abordan temas como RDDs, DataFrames y Datasets, optimizaciones como Catalyst y estrategias de particionado.
Esta clase aborda las limitaciones del data lake tradicional, como la falta de transacciones ACID, los problemas de consistencia y las dificultades en la evolución de esquemas. Se introduce también el concepto de Open Table Formats y se estudian en detalle Delta Lake y Apache Iceberg.
En esta clase se exploran las diferencias entre procesamiento batch y procesamiento en tiempo real, entendiendo cuándo utilizar cada enfoque. Abordamos Spark Structured Streaming y conceptos clave como ventanas temporales y manejo de datos tardíos, e integración con herramientas como Kafka y sistemas de almacenamiento en la nube.
En esta clase se estudia MLflow como herramienta para la gestión integral del ciclo de vida de modelos de machine learning, tanto dentro de Databricks como en entornos locales. Se muestra cómo puede integrarse con el stack habitual de los data scientists, permitiendo registrar experimentos, versionar modelos y garantizar reproducibilidad.
Modalidad
- Clases asincrónicasPara que avances a tu propio ritmo
- Clases en vivo a demandaPara resolver consultas con horarios flexibles según tu disponibilidad horaria
- Ejercicios, lecturas y autoevaluacionesEn cada clase
- Campus virtualComo plataforma para tu aprendizaje.
- Foro en DiscordAbierto 24/7
- CertificaciónCon examen final
Profesores de calidad
Nuestros docentes son referentes de la industria y expertos en diversas áreas, que están transformando el futuro. Con experiencia real y una visión innovadora, te acercan las últimas tendencias y conocimientos aplicados para que aprendas de quienes están marcando el camino.
Talleres en vivo cada mes
Encuentros virtuales con especialistas en tecnología, IA y cultura digital
Taller
El Ciclo de Vida del Dato
Fecha a confirmar
Taller
¿Qué lugar puede ocupar la IA en la psicoterapia?
15 de Abril · 19:00 hs
🌎Taller
El nuevo stack de automatización web
22 de Abril · 17:30 hs
🌎Taller
Orquestación de datos con Apache Airflow
27 de Abril · 19:00 hs
🌎Taller
Equipos del Futuro: Agentes e IA
Fecha a confirmar

Tu aprendizaje, en orden y sin complicaciones
Organizá tu ruta, seguí tu progreso y enterate de los próximos eventos desde la app, en un solo lugar
LAB
Te invitamos a aprender haciendo en un espacio diseñado para el aprendizaje basado en proyectos, donde crearás iniciativas únicas para enriquecer tu portfolio. Acá, el conocimiento fluye en equipo, impulsando tu crecimiento personal y profesional con impacto en tu comunidad.
Proyectos destacados
¿Qué dicen nuestros estudiantes?
Explorá el Mapa
Inteligencia Artificial para TODO PÚBLICO
Descubrí el poder de la IA sin necesidad de programar. Aprendé a aplicar herramientas innovadoras para potenciar tu profesión y dar tus primeros pasos en el mundo de la inteligencia artificial.
Explorá el Mapa

Preguntas frecuentes
Cargando preguntas frecuentes...





