Programa del Curso

Descripción general de Big Data:

  • ¿Qué es Big Data
  • Por qué Big Data está ganando popularidad
  • Big Data Estudios de caso
  • Big Data Características
  • Soluciones a trabajar Big Data.

Hadoop y sus componentes:

  • Qué es Hadoop y cuáles son sus componentes.
  • Hadoop Arquitectura y sus características de los datos que puede manejar /Process.
  • Resumen sobre Hadoop Historia, empresas que lo utilizan y por qué han empezado a utilizarlo.
  • Hadoop Marco y sus componentes: explicados en detalle.
  • ¿Qué es HDFS y lee -Escribe en Hadoop Sistema de archivos distribuido.
  • Cómo configurar Hadoop el clúster en diferentes modos: clúster independiente/pseudo/multinodo.

(Esto incluye la configuración de un clúster de Hadoop en VirtualBox/KVM/VMware, las configuraciones de red que deben examinarse cuidadosamente, la ejecución de los demonios de Hadoop y la prueba del clúster).

  • ¿Qué es el marco de trabajo de Map Reduce y cómo funciona?
  • Ejecución de trabajos de Map Reduce en el clúster Hadoop.
  • Descripción de la replicación, la duplicación y el reconocimiento de bastidores en el contexto de Hadoop clústeres.

Hadoop Planificación de clústeres:

  • Cómo planear el clúster de Hadoop.
  • Comprensión del hardware y el software para planificar el clúster de Hadoop.
  • Comprender las cargas de trabajo y planificar el clúster para evitar errores y un rendimiento óptimo.

¿Qué es MapR y por qué MapR?

  • Descripción general de MapR y su arquitectura.
  • Comprensión y funcionamiento del sistema de control MapR, volúmenes MapR, instantáneas y espejos.
  • Planificación de un clúster en el contexto de MapR.
  • Comparación de MapR con otras distribuciones y Apache Hadoop.
  • Instalación de MapR y despliegue de clústeres.

Configuración y administración de clústeres:

  • Gestión de servicios, nodos, instantáneas, volúmenes espejo y clústeres remotos.
  • Comprensión y gestión de nodos.
  • Comprensión de Hadoop componentes, Instalación de Hadoop componentes junto con MapR Services.
  • Acceso a los datos en el clúster, incluso a través de NFS, administración de servicios y nodos.
  • Gestión de datos mediante el uso de volúmenes, gestión de usuarios y grupos, gestión y asignación de roles a los nodos, puesta en marcha, desmantelamiento de nodos, administración de clústeres y supervisión del rendimiento, configuración/análisis y supervisión de métricas para supervisar el rendimiento, configuración y administración de la seguridad de MapR.
  • Comprender y trabajar con M7: almacenamiento nativo para tablas MapR.
  • Configuración y ajuste del clúster para un rendimiento óptimo.

Actualización del clúster e integración con otras configuraciones:

  • Actualización de la versión de software de MapR y tipos de actualización.
  • Configuración del clúster de Mapr para acceder al clúster de HDFS.
  • Configuración del clúster de MapR en Amazon Elastic Mapreduce.

Todos los temas anteriores incluyen demostraciones y sesiones de práctica para que los alumnos tengan experiencia práctica con la tecnología.

Requerimientos

  • Conocimientos básicos de Linux FS
  • Java básico
  • Conocimientos de Apache Hadoop (recomendado)
  28 horas
 

Número de participantes


Comienza

Termina


Dates are subject to availability and take place between 09:30 and 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (1)

Cursos Relacionados

Categorías Relacionadas