Video AnnotationPublicado June 22, 2026 · Actualizado June 22, 2026

Marco de Anotación de Video Programática para ML y Creación de Contenido

Investigadores de ML y creadores de contenido de video necesitaban una herramienta de anotación de video flexible y basada en código que pudiera producir videos anotados a escala, desde la preparación de datos de entrenamiento hasta superposiciones educativas.

Discuta Su Proyecto

Video Annotation

Domain

Technologies

Key Results

Delivered

Status

El Desafío

Las herramientas de anotación de video existentes eran pesadas en GUI sin API programática, o herramientas de línea de comandos con visualización deficiente:

Los equipos de ML necesitaban bounding boxes, polígonos y etiquetas para datos de entrenamiento a escala
Los educadores necesitaban superposiciones animadas (flechas, focos, texto) para videos instructivos
Las herramientas de anotación tradicionales no podían manejar la interpolación de keyframes o las animaciones de easing
Ninguna solución nativa de escritorio combinaba el procesamiento de OpenCV con salida de video profesional

Nuestra Solución

Construimos un marco de anotación de video basado en React/Remotion con un sistema de anotación type-safe, interpolación de keyframes y un editor de escritorio Tauri.

Arquitectura

Motor de Video: Remotion 4.0 para renderizado programático cuadro por cuadro
Frontend: React 18 + TypeScript con Vite
Aplicación de Escritorio: Tauri 2 con OpenCV.js y ONNX Runtime
Exportación: FFmpeg para salida de video de alta calidad

Tipos de Anotación

Bounding Boxes - Regiones rectangulares con etiquetas y puntuaciones de confianza
Círculos - Anotaciones de puntos con radio configurable
Polígonos - Contornos de regiones complejas para formas irregulares
Etiquetas de Texto - Superposiciones de texto con estilo y posicionamiento
Flechas - Indicadores direccionales para flujo o atención
Trazados a Mano Alzada - Anotaciones dibujadas a medida
Focos - Resaltar regiones con fondo atenuado

Sistema de Animación

Interpolación de Keyframes - Transiciones suaves entre estados de anotación
Funciones de Easing - Spring, ease-in-out, bounce, y curvas personalizadas
Composición de Escenas - Intro, capas de anotación, línea de tiempo combinada, outro
Efectos de Fundido - Fade-in/out con duración configurable

Características Clave

API Type-Safe - Tipos TypeScript completos para todas las primitivas de anotación
Sistema de Escenas - Componer videos complejos a partir de bloques de construcción de escenas
Animación de Keyframes - Animar cualquier propiedad de anotación a lo largo del tiempo
Editor de Escritorio - GUI basado en Tauri con vista previa en tiempo real
Exportación por Lotes - Renderizar videos anotados a través de FFmpeg
Integración con OpenCV - Procesamiento de visión por computadora en la aplicación de escritorio

Resultados

Automatización: La API programática permitió la anotación por lotes de miles de videos

Calidad: Remotion renderizó anotaciones pixel-perfect en cualquier resolución

Flexibilidad: La misma herramienta sirvió para la preparación de datos de entrenamiento de ML y contenido educativo

Stack Tecnológico

ReactTypeScriptRemotion 4.0ViteTauri 2OpenCV.jsONNX RuntimeFFmpeg

caseStudyDetail.more Casos de Estudio

Explore más de nuestras implementaciones técnicas

Video Annotation

Pipeline de Generación de Largometrajes Impulsado por AI

Un ambicioso proyecto de creación de contenido con el objetivo de democratizar la producción de largometrajes mediante la construcción de un pipeline de AI de extremo a extremo que transforma una simple indicación de texto en una película de 15-90 minutos.

Leer Caso de Estudio

AI Accounting

Procesamiento de Facturas Potenciado por AI con OCR e Integración con QuickBooks

Una empresa de tamaño mediano que procesa cientos de facturas de proveedores mensualmente necesitaba eliminar la entrada de datos manual extrayendo automáticamente los datos de las facturas usando AI/OCR y sincronizándolos directamente en QuickBooks para la contabilidad y el seguimiento de pagos.

Leer Caso de Estudio

Preguntas Frecuentes

MicrocosmWorks construyó este framework para equipos que necesitan generar anotaciones a escala utilizando reglas impulsadas por código en lugar de la interacción manual. Soporta la escritura de pipelines de anotación como scripts de Python que aplican detectores preentrenados, lógica temporal y reglas espaciales para generar automáticamente datos de entrenamiento, y luego exporta en formatos COCO, Pascal VOC o YOLO.

Sí, MicrocosmWorks implementó un modelo de anotación temporal que soporta rangos de fotogramas, interpolación de fotogramas clave y etiquetas basadas en eventos con marcas de tiempo de inicio/fin. Los anotadores pueden definir reglas temporales como 'etiquetar como corriendo cuando pose estimation detecta ambos pies en el aire durante más de 3 fotogramas consecutivos' para automatizar el etiquetado de acciones.

MicrocosmWorks construyó una canalización de validación que calcula puntuaciones de acuerdo entre anotaciones programáticas y un conjunto dorado revisado por humanos, marcando cualquier anotación que caiga por debajo de un umbral configurable de IoU o superposición temporal. El marco también admite flujos de trabajo de aprendizaje activo que dirigen las anotaciones de baja confianza a revisores humanos.

MicrocosmWorks construyó el marco sobre FFmpeg y OpenCV, soportando todos los formatos de contenedor principales, incluyendo MP4, MKV, AVI y MOV, con códecs desde H.264 hasta ProRes. El marco procesa los videos en su resolución nativa pero soporta la reducción de escala configurable para el paso de anotación para acelerar el rendimiento en grandes conjuntos de datos.

MicrocosmWorks entrega proyectos de infraestructura de ML a tarifas de $25-$45/hora, con un marco programático de anotación de video que incluye el motor de reglas, exportadores de formato y el pipeline de validación de calidad, típicamente requiriendo 300-500 horas de desarrollo. El marco se amortiza rápidamente al reducir los costos de anotación manual que pueden oscilar entre $5 y $15 por minuto de video.

¿Listo para Transformar su Negocio?

Hablemos sobre cómo podemos aplicar soluciones similares a sus desafíos.

Contáctenos caseStudyDetail.viewAllCaseStudies