Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.        
        
        
            Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.        
    Temario del curso
Introducción
- Comprender la importancia de la preparación de datos en el análisis y el aprendizaje automático
- Pipeline de preparación de datos y su papel en el ciclo de vida de los datos
- Explorar desafíos comunes en datos brutos y su impacto en el análisis
Recolección y adquisición de datos
- Fuentes de datos: bases de datos, APIs, hojas de cálculo, archivos de texto y más
- Técnicas para recolectar datos y asegurar la calidad de los datos durante su recolección
- Recolectar datos de diversas fuentes
Técnicas de limpieza de datos
- Identificar y manejar valores faltantes, valores atípicos e inconsistencias
- Lidiar con duplicados y errores en el conjunto de datos
- Limpieza de conjuntos de datos del mundo real
Transformación y estandarización de datos
- Técnicas de normalización y estandarización de datos
- Manejo de datos categóricos: codificación, agrupamiento e ingeniería de características
- Transformar datos brutos en formatos utilizables
Integración y agregación de datos
- Fusionar y combinar conjuntos de datos de diferentes fuentes
- Resolver conflictos de datos y alinear tipos de datos
- Técnicas para la agregación y consolidación de datos
Aseguramiento de la calidad de los datos
- Métodos para asegurar la calidad e integridad de los datos a lo largo del proceso
- Implementar verificaciones y procedimientos de validación de calidad
- Casos de estudio y aplicaciones prácticas de aseguramiento de la calidad de los datos
Reducción de dimensionalidad y selección de características
- Comprender la necesidad de reducir la dimensionalidad
- Técnicas como PCA, selección de características y estrategias de reducción
- Implementar técnicas de reducción de dimensionalidad
Resumen y siguientes pasos
Requerimientos
- Comprensión básica de conceptos de datos
Público objetivo
- Analistas de datos
- Administradores de bases de datos
- Profesionales de TI
             14 Horas
        
        
Testimonios (2)
Es una sesión práctica.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Curso - Talend Open Studio for ESB
Traducción Automática
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Curso - GDPR Workshop
Traducción Automática
