Unidad de procesamiento de visión

Una unidad de procesamiento de visión (VPU) es una clase emergente de microprocesador; es un tipo específico de acelerador de AI, diseñado para acelerar las tareas de visión artificial.

Visión general
Las unidades de procesamiento de visión son distintas de las unidades de procesamiento de video (que están especializadas en codificación y decodificación de video) en su idoneidad para ejecutar algoritmos de visión artificial como CNN (redes neuronales convolucionales), SIFT (transformación de características invariables a escala), …, etc. .

Pueden incluir interfaces directas para tomar datos de las cámaras (sin pasar por ningún búfer de chips), y tienen un mayor énfasis en el flujo de datos en el chip entre muchas unidades de ejecución paralelas con memoria scratchpad, como un DSP de varios puntos. Pero, al igual que las unidades de procesamiento de video, pueden centrarse en la aritmética de punto fijo de baja precisión para el procesamiento de imágenes.

Contraste con GPUs
Son diferentes de las GPU, que contienen hardware especializado para la rasterización y el mapeo de texturas (para gráficos 3D), y cuya arquitectura de memoria está optimizada para manipular imágenes de mapa de bits en la memoria fuera del chip (lectura de texturas y modificación de búferes de cuadros, con patrones de acceso aleatorio) .

Los mercados objetivo son la robótica, el Internet de las cosas, las nuevas clases de cámaras digitales para realidad virtual y realidad aumentada, cámaras inteligentes e integración de la aceleración de la visión artificial en los teléfonos inteligentes y otros dispositivos móviles.

Ejemplos
Movidius Myriad X, que es la unidad de procesamiento de visión de tercera generación en la línea Myriad VPU de Intel Corporation.
Movidius Myriad 2, que encuentra uso en Google Project Tango y DJI Drones
Microsoft HoloLens, que incluye un acelerador denominado Unidad de Procesamiento Holográfico (complementario de su CPU y GPU), destinado a interpretar las entradas de la cámara, para acelerar el seguimiento y la visión del entorno para aplicaciones de realidad aumentada.
Eyeriss, un diseño de MIT destinado a ejecutar redes neuronales convolucionales.
Intuitivo, una compañía israelí que se centró en el diseño de VPU, el nombre del producto es la serie NU.
NeuFlow, un diseño de Yann LeCun (implementado en FPGA) para acelerar las circunvoluciones, utilizando una arquitectura de flujo de datos.
Mobileye EyeQ, de Mobileye
Procesador de 7 vías VLIW Vision, de Nvidia.

Procesadores similares
Algunos procesadores no se describen como VPU, pero son igualmente aplicables a tareas de visión artificial. Estos pueden formar una categoría más amplia de aceleradores de IA (a los que también pueden pertenecer las VPU), sin embargo, a partir de 2016 no hay consenso sobre el nombre:

IBM TrueNorth, un procesador neuromórfico destinado a tareas similares de reconocimiento de patrones de datos de sensores y de inteligencia, incluido video / audio.
La unidad de procesamiento neural Qualcomm Zeroth, otra entrada en la clase emergente de chips orientados a sensores / IA.