Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Introducción al ajuste fino de NLP
- ¿Qué es el ajuste fino?
- Ventajas del ajuste fino de modelos de lenguaje previamente entrenados
- Descripción general de modelos preentrenados populares (GPT, BERT, T5)
Descripción de las tareas de NLP
- Análisis de sentimientos
- Resumen de texto
- Traducción automática
- Reconocimiento de entidades nombradas (NER)
Configuración del entorno
- Instalación y configuración de Python y bibliotecas
- Uso de Hugging Face Transformers para tareas de NLP
- Carga y exploración de modelos previamente entrenados
Técnicas de ajuste fino
- Preparación de conjuntos de datos para tareas de NLP
- Tokenización y formateo de entrada
- Ajuste de las tareas de clasificación, generación y traducción
Optimización del rendimiento del modelo
- Comprender las tasas de aprendizaje y los tamaños de lote
- Uso de técnicas de regularización
- Evaluación del rendimiento del modelo con métricas
Laboratorios prácticos
- Ajuste fino de BERT para el análisis de sentimientos
- Ajuste fino de T5 para el resumen de texto
- Ajuste de GPT para la traducción automática
Implementación de modelos ajustados
- Exportación y almacenamiento de modelos
- Integración de modelos en aplicaciones
- Conceptos básicos de implementación de modelos en plataformas en la nube
Desafíos y mejores prácticas
- Evitar el sobreajuste durante la puesta a punto
- Control de conjuntos de datos desequilibrados
- Garantizar la reproducibilidad de los experimentos
Tendencias futuras en el ajuste fino de la PNL
- Modelos emergentes preentrenados
- Avances en el aprendizaje por transferencia para la PNL
- Explorando las aplicaciones multimodales de NLP
Resumen y próximos pasos
Requerimientos
- Comprensión básica de los conceptos de PNL
- Experiencia con Python programación
- Familiaridad con marcos de aprendizaje profundo como TensorFlow o PyTorch
Audiencia
- Científicos de datos
- Ingenieros de PNL
21 Horas