Contacta con nosotros

Temario del curso

Esquema detallado de la formación

  1. Introducción al PLN
    • Comprensión del PLN
    • Frameworks de PLN
    • Aplicaciones comerciales del PLN
    • Obtención de datos de la web
    • Trabajo con diversas APIs para recuperar datos de texto
    • Trabajo y almacenamiento de corpora de texto, guardando el contenido y los metadatos relevantes
    • Ventajas de utilizar Python y curso intensivo de NLTK
  2. Comprensión práctica de un corpus y un conjunto de datos
    • ¿Por qué necesitamos un corpus?
    • Análisis de corpus
    • Tipos de atributos de datos
    • Diferentes formatos de archivo para corpora
    • Preparación de un conjunto de datos para aplicaciones de PLN
  3. Comprensión de la estructura de una oración
    • Componentes del PLN
    • Comprensión del lenguaje natural
    • Análisis morfológico: raíz, palabra, token, etiquetas gramaticales
    • Análisis sintáctico
    • Análisis semántico
    • Manejo de la ambigüedad
  4. Preprocesamiento de datos de texto
    • Corpus: texto sin procesar
      • Tokenización de oraciones
      • Stemming para texto sin procesar
      • Lematización de texto sin procesar
      • Eliminación de palabras vacías
    • Corpus: oraciones sin procesar
      • Tokenización de palabras
      • Lematización de palabras
    • Trabajo con matrices Término-Documento / Documento-Término
    • Tokenización de texto en n-gramas y oraciones
    • Preprocesamiento práctico y personalizado
  5. Análisis de datos de texto
    • Características básicas del PLN
      • Analizadores y análisis sintáctico
      • Etiquetado gramatical y etiquetadores
      • Reconocimiento de entidades nominales
      • N-gramas
      • Bolsa de palabras
    • Características estadísticas del PLN
      • Conceptos de álgebra lineal para PLN
      • Teoría probabilística para PLN
      • TF-IDF
      • Vectorización
      • Codificadores y decodificadores
      • Normalización
      • Modelos probabilísticos
    • Ingeniería avanzada de características y PLN
      • Fundamentos de word2vec
      • Componentes del modelo word2vec
      • Lógica del modelo word2vec
      • Extensión del concepto de word2vec
      • Aplicación del modelo word2vec
    • Estudio de caso: Aplicación de la bolsa de palabras: resumen automático de texto utilizando los algoritmos simplificados y auténticos de Luhn
  6. Agrupación de documentos, clasificación y modelado de temas
    • Agrupación de documentos y minería de patrones (agrupación jerárquica, k-means, clustering, etc.)
    • Comparación y clasificación de documentos utilizando medidas de distancia TFIDF, Jaccard y coseno
    • Clasificación de documentos utilizando Bayes Naive y Máxima Entropía
  7. Identificación de elementos de texto importantes
    • Reducción de dimensionalidad: Análisis de Componentes Principales, Descomposición en Valores Singulares y Factorización Matricial No Negativa
    • Modelado de temas y recuperación de información mediante Análisis Semántico Latente
  8. Extracción de entidades, análisis de sentimiento y modelado avanzado de temas
    • Positivo frente a negativo: grado de sentimiento
    • Teoría de Respuesta al Ítem
    • Etiquetado gramatical y su aplicación: identificación de personas, lugares y organizaciones mencionados en el texto
    • Modelado avanzado de temas: Asignación Dirichlet Latente
  9. Estudios de caso
    • Minería de reseñas de usuarios no estructuradas
    • Clasificación de sentimiento y visualización de datos de reseñas de productos
    • Minería de registros de búsqueda para patrones de uso
    • Clasificación de texto
    • Modelado de temas

Requerimientos

Conocimiento y comprensión de los principios del PLN y una valoración de la aplicación de la IA en el ámbito empresarial

 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas