Programa del Curso
Arquitectura de Greenplum
- Procesamiento paralelo y multiprocesamiento simétrico
- Roles de segmentos y configuración del clúster
- Escala y movimiento de datos
- Arquitectura de Greenplum Data Warehouse
Estructuras de Tablas en Greenplum
- Tablas distribuidas vs. asignadas aleatoriamente
- Tablas heap vs. tablas solo de apendizaje
- Formatos de almacenamiento por fila vs. por columna
- Tablas particionadas y agrupadas
Distribución de Datos y Hashing
- Lógica de hashing y claves de distribución
- Gestionar sesgo y su impacto en el rendimiento
- Mapas hash y estrategias de ubicación de filas
Índices y Optimización del Rendimiento
- Índices agrupados vs. no agrupados
- Casos de uso de índices B-tree y bitmap
- Escanear índices y comportamiento de almacenamiento
Diseño Físico Database
- Normalización y diseño del modelo lógico
- Estrategias de acceso al usuario y análisis de distribución
- Demografía de datos e indicaciones de indexación
Técnicas de Denormalización
- Datos derivados, tablas resumidas y pre-joins
- Tablas columnar como particionamiento vertical
- Data marts y vistas materializadas
Avanzado SQL y Ejecución de Consultas
- Estrategias de unión y redistribución
- Funciones OLAP y de ventana
- Tablas temporales, subconsultas y tablas derivadas
Planificación EXPLAIN y Afinación de Consultas
- Lectura e interpretación de la salida EXPLAIN
- Análisis de costos y optimización del plan
- Movimiento de uniones y operaciones locales en segmentos
Herramientas y Mejores Prácticas de Greenplum
- ANALYZE y VACUUM
- Carga y movimiento de datos con Nexus
- Seguridad, permisos y consejos de rendimiento
Resumen y Próximos Pasos
Requerimientos
- Comprensión de bases de datos relacionales y SQL
- Experiencia con almacenes de datos o sistemas analíticos
- Familiaridad con operaciones de línea de comandos Linux
Público objetivo
- Arquitectos y ingenieros de datos
- Administradores y líderes técnicos de Database
- Desarrolladores BI y especialistas en análisis que trabajan con Greenplum
Testimonios (4)
El entrenador tenía una buena comprensión de los conceptos
Josheel - Verizon Connect
Curso - Amazon Redshift
Traducción Automática
Lo que más me gustó fue el dominio del tema por parte del trainer, su paciencia y claridad al explicar los conceptos, y especialmente su disposición constante para responder todas las dudas que surgieron. Fue una experiencia de aprendizaje realmente enriquecedora y muy agradable.
Patricio Condado - SOKODB
funciones analíticas
khusboo dassani - Tech Northwest Skillnet
Curso - SQL Advanced
Traducción Automática
cómo el instructor demuestra su conocimiento sobre la materia que enseña
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Curso - Data Vault: Building a Scalable Data Warehouse
Traducción Automática