Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a los ecosistemas de Big Data
- Descripción general de las tecnologías y arquitecturas de big data.
- Procesamiento por lotes frente a procesamiento en tiempo real.
- Estrategias de almacenamiento de datos para la escalabilidad.
Procesamiento avanzado de datos con Apache Spark
- Optimización de trabajos de Spark para mejorar el rendimiento.
- Transformaciones y acciones avanzadas.
- Trabajo con streaming estructurado.
Aprendizaje automático a gran escala
- Técnicas de entrenamiento distribuido de modelos.
- Ajuste de hiperparámetros en grandes conjuntos de datos.
- Despliegue de modelos en entornos de big data.
Aprendizaje profundo para Big Data
- Integración de TensorFlow y PyTorch con Spark.
- Pipelines de entrenamiento distribuido de aprendizaje profundo.
- Casos de uso en análisis de imágenes, texto y series temporales.
Analítica en tiempo real y transmisión de datos
- Apache Kafka para la ingesta de datos en streaming.
- Marcos de procesamiento de flujos (stream processing).
- Monitoreo y alertas en sistemas en tiempo real.
Gobernanza, seguridad y ética de los datos
- Requisitos de privacidad y cumplimiento normativo de los datos.
- Control de acceso y cifrado en sistemas de big data.
- Consideraciones éticas en la analítica a gran escala.
Integración de Big Data con Inteligencia Empresarial
- Visualización de datos y tableros (dashboards) para big data.
- Conexión de pipelines de big data a herramientas de BI.
- Impulso de resultados empresariales mediante analítica avanzada.
Resumen y próximos pasos
Requerimientos
- Sólido entendimiento de conceptos de análisis de datos y modelado estadístico.
- Experiencia con herramientas de procesamiento de datos y lenguajes de programación como Python, R o Scala.
- Familiaridad con marcos de computación distribuida como Hadoop o Spark.
Público objetivo
- Científicos de datos que buscan dominar el procesamiento de datos a gran escala y la analítica predictiva.
- Analistas senior que desean diseñar e implementar flujos de trabajo analíticos avanzados.
- Profesionales de I+D centrados en soluciones innovadoras basadas en datos.
42 Horas
Testimonios (2)
Haciendo Ejercicio
Joe Pang - Lands Department, Hong Kong
Curso - QGIS for Geographic Information System
Traducción Automática
Los ejemplos prácticos nos permitieron tener una idea real de cómo funciona el programa. Buenas explicaciones e integración de conceptos teóricos y su relación con las aplicaciones prácticas.
Ian - Archeoworks Inc.
Curso - ArcGIS Fundamentals
Traducción Automática