Programa del Curso
- Fundamentos de big data
- El Big Data y su papel en el mundo corporativo
- Las fases de desarrollo de una estrategia de Big Data dentro de una corporación
- Explicar la lógica que subyace a un enfoque holístico de Big Data
- Componentes necesarios en una plataforma de Big Data
- Solución de almacenamiento de big data
- Límites de las tecnologías tradicionales
- Información general sobre los tipos de bases de datos
- Las cuatro dimensiones del Big Data
- Impacto del big data en el negocio
- Importancia empresarial del Big Data
- Desafíos de la extracción de datos útiles
- Integración de Big Data con datos tradicionales
- Tecnologías de almacenamiento de big data
- Visión general de las tecnologías de big data
- Modelos de almacenamiento de datos
- Hadoop
- Colmena
- Casandra
- MongoDB
- Elegir la tecnología de big data adecuada
- Procesamiento de big data
- Conexión y extracción de datos de la base de datos
- Transformación y preparación de datos para su procesamiento
- Uso de Hadoop MapReduce para procesar datos distribuidos
- Supervisión y ejecución de trabajos de Hadoop MapReduce
- Bloques de creación del sistema de archivos distribuido de Hadoop
- Mapreduce y Yarn
- Control de datos de streaming con Spark
- Herramientas y tecnologías de análisis de big data
- Programación de Hadoop con el lenguaje Pig Latin
- Consulta de macrodatos con Hive
- Minería de datos con Mahout
- Herramientas de visualización y generación de informes
- Big data en los negocios
- Gestión y establecimiento de necesidades de Big Data
- Importancia empresarial del Big Data
- Selección de las herramientas de big data adecuadas para el problema
Conceptos de almacenamiento de datos
- ¿Qué es Data Ware House?
- Diferencia entre OLTP y Data Ware Housing
- Adquisición de datos
- Extracción de datos
- Transformación de datos.
- Carga de datos
- Mercados de datos
- Data Mart dependiente vs independiente
- Diseño de bases de datos
Conceptos de prueba ETL:
- Introducción.
- Ciclo de vida del desarrollo de software.
- Metodologías de ensayo.
- Proceso de flujo de trabajo de pruebas ETL.
- Responsabilidades de las pruebas ETL en la etapa de datos.
Fundamentos de Big Data
- Big Data y su papel en el mundo corporativo
- Las fases de desarrollo de una Big Data estrategia dentro de una corporación
- Explique la lógica que subyace a un enfoque holístico de Big Data
- Componentes necesarios en una Big Data plataforma
- Solución de almacenamiento de big data
- Límites de las tecnologías tradicionales
- Información general sobre los tipos de bases de datos
NoSQL Bases de datos
Hadoop
Reducción de mapas
Apache Spark
Requerimientos
Los delegados deben tener un conocimiento y cierta experiencia de las herramientas de storgage y un conocimiento del manejo de grandes conjuntos de datos
Testimonios (4)
La capacitación se realizó de manera interesante y profesional, lo que permitió sistematizar y ampliar el conocimiento del tema de capacitación. El presentador mostró mucha experiencia y capacidad para transmitir información. La formación fue muy práctica y se adaptó a nuestras necesidades. Recomendar
Dominik Kozłowski - Shell Polska
Curso - Big Data - Data Science
Traducción Automática
El comienzo del día 3 fue el mejor.
- Shell Polska
Curso - Big Data - Data Science
Traducción Automática
¿Quién creará el mejor ejercicio modelo?
Wojtek - Shell Polska
Curso - Big Data - Data Science
Traducción Automática
trainer's knowledge