Temario del curso

  1. Fundamentos del big data
    • El Big Data y su papel en el mundo corporativo
    • Las fases de desarrollo de una estrategia de Big Data dentro de una corporación
    • Explicar la lógica subyacente a un enfoque holístico del Big Data
    • Componentes necesarios en una Plataforma de Big Data
    • Solución de almacenamiento de big data
    • Límites de las tecnologías tradicionales
    • Descripción general de los tipos de bases de datos
    • Las cuatro dimensiones del Big Data
  2. Impacto del big data en el negocio
    • Importancia empresarial del Big Data
    • Desafíos de extraer datos útiles
    • Integración de Big Data con datos tradicionales
  3. Tecnologías de almacenamiento de big data
    • Descripción general de las tecnologías de big data
      • Modelos de almacenamiento de datos
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Elegir la tecnología de big data adecuada
  4. Procesamiento de big data
    • Conexión y extracción de datos desde una base de datos
    • Transformación y preparación de datos para su procesamiento
    • Uso de Hadoop MapReduce para el procesamiento de datos distribuidos
    • Monitoreo y ejecución de trabajos de Hadoop MapReduce
    • Bloques de construcción del sistema de archivos distribuido de Hadoop
    • Mapreduce y Yarn
    • Gestión de datos en tiempo real con Spark
  5. Herramientas y tecnologías de análisis de big data
    • Programación de Hadoop con el lenguaje Pig Latin
    • Consulta de big data con Hive
    • Minería de datos con Mahout
    • Herramientas de visualización y reporting
  6. Big Data en el negocio
    • Gestión y establecimiento de necesidades de Big Data
    • Importancia empresarial del Big Data
    • Selección de las herramientas adecuadas de big data para el problema

Conceptos de Almacenes de Datos

  • ¿Qué es un Almacén de Datos?
  • Diferencia entre OLTP y Almacenamiento de Datos
  • Adquisición de datos
  • Extracción de datos
  • Transformación de datos.
  • Carga de datos
  • Data Marts
  • Data Mart dependientes vs independientes
  • Diseño de bases de datos

Conceptos de Pruebas ETL:

  • Introducción.
  • Ciclo de vida del desarrollo de software.
  • Metodologías de pruebas.
  • Flujo de trabajo de pruebas ETL.
  • Responsabilidades de pruebas ETL en la etapa de datos.

Fundamentos del Big Data

  • El Big Data y su papel en el mundo corporativo
  • Las fases de desarrollo de una estrategia de Big Data dentro de una corporación
  • Explicar la lógica subyacente a un enfoque holístico del Big Data
  • Componentes necesarios en una Plataforma de Big Data
  • Solución de almacenamiento de big data
  • Límites de las tecnologías tradicionales
  • Descripción general de los tipos de bases de datos

Bases de Datos NoSQL

Hadoop

MapReduce

Apache Spark

Requerimientos

Los asistentes deben tener una conciencia y algo de experiencia con las herramientas de almacenamiento y estar familiarizados con el manejo de grandes conjuntos de datos.

 14 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas