Contacta con nosotros

Temario del curso

Introducción a la Síntesis de Voz y Clonación de Voz

  • Descripción general de la síntesis de texto a habla (TTS) y la síntesis de voz neuronal
  • Clonación de voz frente a generación de habla: casos de uso y límites
  • Modelos clave: Tacotron, WaveNet, FastSpeech, VITS

Trabajo con Plataformas Comerciales

  • Uso de ElevenLabs y Resemble AI
  • Creación, clonación y edición de voces
  • Acceso a la API y flujos de trabajo de texto a habla

Desarrollo con Herramientas de Código Abierto

  • Instalación y configuración de Coqui TTS
  • Entrenamiento de voces personalizadas y gestión de conjuntos de datos
  • Generación de habla con control fino (tono, velocidad, emoción)

Preparación de Datos y Gestión de Conjuntos de Datos de Voz

  • Recopilación y limpieza de muestras de voz
  • Segmentación, etiquetado y alineación de transcripciones
  • Fuentes éticas y consentimiento para el uso de la voz

Integración en Aplicaciones

  • Incorporación de TTS en sitios web y aplicaciones
  • Creación de sistemas IVR y bots interactivos
  • Generación de diálogos sintéticos para video y juegos

Evaluación de la Calidad y el Realismo

  • Puntuación Media de Opinión (MOS) y pruebas de inteligibilidad
  • Control de la expresividad y la prosodia
  • Comparación de latencia, fidelidad y realismo

Consideraciones Éticas, Legales y de Gobernanza

  • Riesgos asociados a los deepfakes y uso responsable
  • Consentimiento, atribución e implicaciones de derechos de autor
  • Regulaciones y políticas organizacionales

Resumen y Próximos Pasos

Requerimientos

  • Comprensión de los fundamentos del aprendizaje automático
  • Familiaridad con formatos de archivos de audio y herramientas de edición
  • Conocimientos básicos de programación en Python

Público Objetivo

  • Desarrolladores e ingenieros de IA interesados en la síntesis de voz
  • Creadores de contenido y tecnólogos multimedia que exploran la generación de voz
  • Equipos de I+D que construyen sistemas de audio personalizados o dinámicos
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas