Programa del Curso

Resumen de las Capacidades de Optimización CANN

  • Cómo se maneja el rendimiento de inferencia en CANN
  • Objetivos de optimización para sistemas AI de borde y embebidos
  • Entendiendo la utilización del AI Core y la asignación de memoria

Usando el Motor de Gráficos para Análisis

  • Introducción al Motor de Gráficos y a la línea de ejecución
  • Visualización de gráficas de operadores y métricas en tiempo real
  • Modificación de gráficos computacionales para optimización

Herramientas de Perfilado y Métricas de Rendimiento

  • Uso de la Herramienta de Perfilado CANN (profiler) para el análisis de carga de trabajo
  • Análisis del tiempo de ejecución del kernel y los puntos de cuello de botella
  • Perfilado del acceso a memoria y estrategias de tiling

Desarrollo de Operadores Personalizados con TIK

  • Visión general de TIK y el modelo de programación de operadores
  • Implementación de un operador personalizado usando DSL TIK
  • Pruebas y pruebas de rendimiento del operador

Optimización Avanzada de Operadores con TVM

  • Introducción a la integración de TVM con CANN
  • Estrategias de autotuning para gráficos computacionales
  • Cuándo y cómo alternar entre TVM y TIK

Técnicas de Optimización de Memoria

  • Gestión del diseño de memoria y colocación de búferes
  • Técnicas para reducir el consumo de memoria en chip
  • Prácticas recomendadas para la ejecución asincrónica y reutilización

Implementaciones Reales y Estudios de Caso

  • Estudio de caso: ajuste de rendimiento para la canalización de cámaras inteligentes de ciudad
  • Estudio de caso: optimización de la pila de inferencia de vehículos autónomos
  • Líneas directrices para el perfilado iterativo y la mejora continua

Resumen y Próximos Pasos

Requerimientos

  • Comprensión sólida de las arquitecturas de modelos de aprendizaje profundo y flujos de trabajo de entrenamiento
  • Experiencia en la implementación de modelos utilizando CANN, TensorFlow o PyTorch
  • Familiaridad con el CLI de Linux, scripting de shell y programación de Python

Público Objetivo

  • Ingenieros de rendimiento AI
  • Especialistas en optimización de inferencia
  • Desarrolladores que trabajan con AI en el borde o sistemas en tiempo real
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas