Programa del Curso

Introducción a Speech Recognition y Síntesis

  • Fundamentos de las tecnologías del habla
  • Conceptos básicos de los sistemas de reconocimiento de voz
  • Visión general de la síntesis de voz

Papel de los LLM en las tecnologías del habla

  • Comprender los LLM en el reconocimiento de voz
  • Maestría en Síntesis de Voz
  • Ventajas de los LLM frente a los modelos tradicionales

Datos para Speech Recognition y Síntesis

  • Recopilación y procesamiento de datos para tecnologías del habla
  • Conjuntos de datos de entrenamiento para LLM
  • Consideraciones éticas en el tratamiento de datos

Formación de LLM para aplicaciones de voz

  • Técnicas de aprendizaje profundo en el reconocimiento de voz
  • Arquitecturas de redes neuronales para la síntesis de voz
  • Ajuste fino de los LLM para tareas de voz específicas

Implementación de LLM en sistemas de voz

  • Integración de LLMs con motores de reconocimiento de voz
  • Desarrollo de sintetizadores de voz con sonido natural
  • Diseño de interfaz de usuario para aplicaciones de voz

Pruebas y evaluación de sistemas de voz

  • Métodos para probar la precisión del reconocimiento de voz
  • Evaluación de la naturalidad del habla sintetizada
  • Estudios de usuarios y recopilación de comentarios

Retos y soluciones en las tecnologías del habla

  • Abordar problemas comunes en el reconocimiento de voz
  • Superando obstáculos en la síntesis de voz
  • Casos de estudio: implementaciones exitosas de LLM

Direcciones futuras en las tecnologías del habla

  • Tendencias emergentes en reconocimiento y síntesis de voz
  • El papel de los LLM en los sistemas de voz multilingües
  • Innovaciones y oportunidades de investigación

Proyecto y Evaluación

  • Diseño e implementación de un sistema de reconocimiento o síntesis de voz mediante LLM
  • Revisiones por pares y discusiones grupales
  • Evaluación final y retroalimentación

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos básicos de programación
  • Se recomienda tener experiencia con Python programación, pero no es obligatorio
  • La familiaridad con los conceptos básicos de aprendizaje automático y redes neuronales es beneficiosa

Audiencia

  • Desarrolladores de software
  • Científicos de datos
  • Jefes de producto
 14 horas

Número de participantes



Precio por participante

Cursos Relacionados

LangChain: Building AI-Powered Applications

14 horas

LangChain Fundamentals

14 horas

Introduction to Google Gemini AI

14 horas

Google Gemini AI for Content Creation

14 horas

Google Gemini AI for Transformative Customer Service

14 horas

Google Gemini AI for Data Analysis

21 horas

Generative AI with Large Language Models (LLMs)

21 horas

LlamaIndex: Enhancing Contextual AI

14 horas

LlamaIndex: Developing LLM Powered Applications

42 horas

Introduction to Large Language Models (LLMs)

14 horas

LLMs for Automated Customer Support

14 horas

LLMs for Business Intelligence

14 horas

LLMs for Content Generation

14 horas

LLMs for Code Generation and Documentation

14 horas

Advanced LLMs for NLP Tasks

21 horas

Categorías Relacionadas

1