MicrocosmWorksInnovando y Arquitectando el Cosmos Digital
Acerca deContacto
MicrocosmWorksInnovando y Arquitectando el Cosmos Digital

Ofreciendo soluciones de TI que importan. Nos apasiona la tecnología, la seguridad y ayudar a las empresas a crecer a través de una infraestructura de TI confiable e innovadora.

[email protected]
+91 7011868196
New Delhi, India

Centro de Crecimiento de IA

Centro de IAInnovación para StartupsAcelerador Empresarial

Soluciones

Todas las SolucionesAplicaciones de Bienestar y FitnessPlataforma de Video con IADesarrollo de Agentes de IA

Recursos

PerspectivasGuías de la IndustriaPlanos de Casos de UsoPatrones de ArquitecturaEstudios de Caso

Compañía

Sobre NosotrosContactoNuestro Trabajo

Servicios

Consultoría DigitalInfraestructura en la NubeDesarrollo SaaSDesarrollo de IATecnología de Video
Desarrollo ERPPersonalización de ZohoDesarrollo de OdooIntegración de SalesforceDesarrollo de CRM Personalizado
Integración de QuickBooksSoluciones IoTDesarrollo de Blockchain
Consultoría de CiberseguridadSoporte IT - L3

© 2026 MicrocosmWorks. Todos los derechos reservados.

Política de PrivacidadTérminos de Servicio
Volver a Casos de Estudio
Document IntelligencePublicado June 22, 2026 · Actualizado June 22, 2026

Análisis de Hojas de Cálculo y Documentos Impulsado por AI con Orquestación Multi-Agente y Referencia Cruzada entre Documentos

Un equipo de datos empresarial necesitaba analizar, consultar y editar grandes colecciones de hojas de cálculo y documentos (Excel, CSV, Google Sheets, PDFs, Word docs) usando lenguaje natural, con la capacidad de hacer referencia cruzada de datos entre múltiples archivos y ejecutar flujos de trabajo analíticos de varios pasos sin manipulación manual de datos.

Discuta Su Proyecto
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

El Desafío

Trabajar con documentos de negocios a escala estaba plagado de fricciones:

  • Datos Aislados — La información crítica estaba dispersa en docenas de hojas de cálculo, PDFs y documentos Word sin forma de consultarlos de manera conjunta.
  • Referencia Cruzada Manual — Comparar una lista de precios de proveedores (Excel) con los términos del contrato (PDF) y el historial de facturas (CSV) requería horas de búsqueda manual.
  • Limitaciones de Fórmulas — Las preguntas analíticas complejas no podían ser respondidas solo con fórmulas de hojas de cálculo.
  • Límites de Ventana de Contexto — Grandes hojas de cálculo (más de 50,000 filas) excedían las ventanas de contexto de los LLM, haciendo que los enfoques ingenuos fallaran.
  • Sin Capacidades de Edición — Las herramientas de AI existentes podían analizar documentos pero no podían escribir los cambios de vuelta a los archivos de origen.
  • Razonamiento Multi-Paso — Las preguntas que requerían un análisis secuencial entre documentos necesitaban flujos de trabajo multi-paso orquestados.

Nuestra Solución

Construimos una plataforma de inteligencia documental AI multi-agente con recuperación respaldada por una base de datos vectorial para documentos grandes, agentes especializados para diferentes tipos de documentos, un orquestador para el razonamiento entre documentos y capacidades de escritura de vuelta para la edición de hojas de cálculo.

Arquitectura

  • Orquestador: Agente orquestador de AI que coordina flujos de trabajo multi-paso entre agentes especializados.
  • Agente de Hojas de Cálculo: Maneja el análisis de Excel/CSV/Google Sheets, la generación de fórmulas y la edición de celdas.
  • Agente de Documentos: Maneja la lectura, extracción y resumen de documentos PDF/Word.
  • Agente de Referencia Cruzada: Realiza uniones, comparaciones y reconciliación entre tipos de documentos.
  • Base de Datos Vectorial: Milvus para la indexación semántica de fragmentos de documentos y filas de hojas de cálculo.
  • Capa LLM: Enfoque multi-modelo con llamada a funciones.
  • Backend: Python/FastAPI para el procesamiento de documentos y la orquestación de agentes.
  • Frontend: Panel de control en React con carga de archivos, interfaz de chat y vista previa de hojas de cálculo en vivo.
  • Almacenamiento: S3 para archivos originales, PostgreSQL para metadatos y seguimiento de tareas.

Arquitectura Multi-Agente

Roles de los Agentes

1. Agente Orquestador

El coordinador central que recibe las consultas del usuario, las descompone en subtareas y las delega a agentes especializados. Analiza la intención del usuario, crea planes de ejecución, gestiona el flujo de datos entre agentes, agrega los resultados y maneja la recuperación de errores.

2. Agente de Hojas de Cálculo

Especializado en operaciones con datos tabulares, incluyendo la comprensión de esquemas, la traducción de lenguaje natural a consultas, agregaciones y filtrado, generación de fórmulas, edición de celdas y relleno de columnas, sugerencias de gráficos y validación de datos/detección de anomalías.

3. Agente de Documentos

Especializado en documentos no estructurados y semi-estructurados, incluyendo OCR y extracción de texto consciente del diseño, identificación de secciones, extracción de pares clave-valor de contratos, resumen, búsqueda semántica de cláusulas y extracción de tablas de PDFs/Word docs.

4. Agente de Referencia Cruzada

Especializado en el razonamiento multi-documento, incluyendo la coincidencia de entidades entre documentos, la reconciliación de datos y la identificación de discrepancias, el análisis de líneas de tiempo, la resolución de dependencias para datos conflictivos y operaciones de unión similares a SQL entre tipos de documentos.

Capa de Base de Datos Vectorial

Por qué una Base de Datos Vectorial para Documentos

Documentos y hojas de cálculo grandes no caben en una única ventana de contexto de un LLM. La base de datos vectorial permite la búsqueda semántica en millones de filas y fragmentos de documentos, la recuperación solo de las porciones relevantes por consulta, la vinculación de entidades entre documentos mediante la similitud de embeddings, y una indexación persistente que no necesita ser reprocesada en cada consulta.

Estrategia de Indexación

Indexación de Hojas de Cálculo:

Cada fila se convierte en una representación en lenguaje natural concatenando los valores de las columnas clave, luego se embebe y se almacena con referencias al archivo original, hoja e índice de fila para operaciones de escritura de vuelta.

Indexación de Documentos:

Los documentos se extraen con conciencia del diseño, se dividen en segmentos semánticos con solapamiento, se embeben y se almacenan con referencias al archivo fuente, sección y número de página.

Índice de Entidades entre Documentos:

Un índice separado vincula entidades (proveedores, productos, personas, números de factura) entre documentos, permitiendo que las consultas de referencia cruzada encuentren rápidamente todas las menciones de una entidad, independientemente del archivo de origen.

Pipeline de Recuperación

Cuando un usuario realiza una pregunta que abarca varios documentos, el orquestador identifica qué documentos y agentes son necesarios, realiza búsquedas vectoriales para encontrar datos relevantes en todas las fuentes, delega a agentes especializados para el procesamiento y agrega los resultados en una respuesta coherente.

Motor de Orquestación

Descomposición de Consultas

El orquestador descompone consultas complejas en planes de ejecución de varios pasos. Por ejemplo, una pregunta como "Encontrar proveedores con entregas tardías, verificar las cláusulas de penalización del contrato y calcular las penalizaciones reclamables" se descompondría en pasos secuenciales: consultar datos de entrega a través del Agente de Hojas de Cálculo, buscar contratos a través del Agente de Documentos y unir los resultados a través del Agente de Referencia Cruzada.

Comunicación entre Agentes

  • Los agentes se comunican a través de mensajes estructurados con cargas útiles tipadas.
  • El orquestador mantiene el contexto de ejecución con resultados intermedios.
  • Los pasos fallidos activan estrategias de reintento o de respaldo.
  • Se devuelven resultados parciales si algunos pasos se completan pero otros fallan.

Edición y Escritura de Vuelta en Hojas de Cálculo

Capacidades de Edición

La plataforma soporta actualizaciones de celdas, rellenos de columnas, inserción de filas, formato condicional, creación de nuevas hojas e inyección de fórmulas — todo propuesto por agentes de AI y aplicado con la aprobación del usuario.

Pipeline de Escritura de Vuelta

  1. El agente determina la operación de edición (qué celdas, qué valores).
  2. Se muestra una vista previa de la edición al usuario con resaltado de diferencias (valores antiguos vs. nuevos).
  3. El usuario aprueba o modifica los cambios propuestos.
  4. El backend aplica los cambios al archivo utilizando las bibliotecas apropiadas según el formato.
  5. El archivo modificado se guarda como una nueva versión con un registro de auditoría de edición.
  6. El índice vectorial se actualiza para las filas modificadas.

Control de Versiones

  • Cada edición crea una nueva versión del archivo (la original se conserva).
  • El registro de diferencias muestra exactamente qué cambió, cuándo y por qué.
  • Reversión a cualquier versión anterior con un solo clic.
  • Atribución de edición: qué agente o usuario realizó cada cambio.

Pipeline de Procesamiento para Nuevos Documentos

Flujo de Carga de Archivos

  1. El usuario carga archivos (arrastrar y soltar o API).
  2. El tipo de archivo se detecta y se dirige al procesador adecuado.
  3. Hojas de Cálculo: Analizadas, esquema inferido, filas incrustadas e indexadas.
  4. PDFs: OCR (si está escaneado) → extracción de diseño → fragmentación → incrustación → indexación.
  5. Documentos Word: Extracción de texto → análisis de secciones → fragmentación → incrustación → indexación.
  6. Extracción de Entidades: NER identifica personas, organizaciones, fechas, cantidades en todos los documentos.
  7. Vinculación entre Documentos: El índice de entidades se actualiza con nuevas menciones.
  8. Los metadatos del archivo se almacenan en PostgreSQL, los embeddings en la base de datos vectorial, los originales en S3.

Formatos Soportados

La plataforma soporta Excel, CSV y Google Sheets (con escritura de vuelta completa), PDFs nativos y escaneados (solo lectura), y documentos Word y Google Docs (escritura de vuelta limitada).

Características Clave

  1. Arquitectura Multi-Agente — Agentes especializados para hojas de cálculo, documentos y referencia cruzada.
  2. Orquestador de AI — Descompone consultas complejas en planes de ejecución de múltiples pasos.
  3. Referencia Cruzada entre Documentos — Vinculación de entidades y reconciliación de datos entre tipos de archivos.
  4. Recuperación Impulsada por Vectores — La búsqueda semántica maneja conjuntos de datos más allá de los límites de contexto de los LLM.
  5. Escritura de Vuelta en Hojas de Cálculo — La AI edita celdas, rellena columnas e inyecta fórmulas con la aprobación del usuario.
  6. Soporte para Grandes Conjuntos de Datos — Hojas de cálculo de más de 50,000 filas indexadas y consultables mediante búsqueda vectorial.
  7. Control de Versiones — Cada edición versionada con registro de diferencias y capacidad de reversión.
  8. Consultas en Lenguaje Natural — Haga preguntas analíticas complejas en inglés sencillo.
  9. Soporte Multi-Formato — Excel, CSV, Google Sheets, PDF, Word, Google Docs.
  10. Vista Previa de Edición — Vista previa resaltada con diferencias antes de aplicar cualquier cambio.

Resultados

Velocidad de Consulta: Preguntas entre documentos respondidas en 10-30 segundos frente a horas de búsqueda manual.
Escala de Datos: Manejó más de 500 documentos y hojas de cálculo con más de 2M de filas totales indexadas.
Precisión de Edición: Las ediciones de hojas de cálculo propuestas por AI fueron aceptadas sin modificaciones el 85% de las veces.
Referencia Cruzada: La coincidencia de entidades vinculó datos entre documentos con un 92% de precisión.
Precisión de Recuperación: La búsqueda vectorial devolvió fragmentos relevantes en los 5 primeros resultados el 94% de las veces.
Ahorro de Tiempo: Redujo los flujos de trabajo de análisis multi-documento de horas a minutos.

Stack Tecnológico

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCRDocument Processing Libraries

caseStudyDetail.more Casos de Estudio

Explore más de nuestras implementaciones técnicas

Document Intelligence

Sistema RAG de Documentos Primero Local con Búsqueda Híbrida y Soporte Multiformato

Un equipo que desarrolla herramientas para desarrolladores necesitaba un sistema de inteligencia documental totalmente local y que preservara la privacidad, capaz de ingerir múltiples formatos de archivo, construir bases de conocimiento con capacidad de búsqueda y responder a consultas en lenguaje natural utilizando Generación Aumentada por Recuperación — sin enviar ningún dato a API externas.

Leer Caso de Estudio
AI Accounting

Procesamiento de Facturas Potenciado por AI con OCR e Integración con QuickBooks

Una empresa de tamaño mediano que procesa cientos de facturas de proveedores mensualmente necesitaba eliminar la entrada de datos manual extrayendo automáticamente los datos de las facturas usando AI/OCR y sincronizándolos directamente en QuickBooks para la contabilidad y el seguimiento de pagos.

Leer Caso de Estudio
Video Encoding

Inserción de Anuncios en el Lado del Cliente (CSAI) con Análisis de Marcadores SCTE-35 e Integración de Reproductor Multiplataforma

Una plataforma de streaming de video necesitaba implementar la Inserción de Anuncios en el Lado del Cliente (CSAI) en sus aplicaciones web, móviles y de TV conectada, lo que permitiría experiencias publicitarias personalizadas a nivel de dispositivo con soporte completo para la interacción con anuncios (superposiciones clicables, banners complementarios, botones para omitir) que la inserción del lado del servidor no puede proporcionar.

Leer Caso de Estudio

Preguntas Frecuentes

MicrocosmWorks diseñó una arquitectura multiagente donde agentes especializados manejan diferentes aspectos del análisis de documentos, como un agente de extracción de tablas para hojas de cálculo, un agente de resumen de texto para documentos narrativos, y un agente de referencia cruzada que identifica relaciones entre puntos de datos a través de múltiples archivos. Esta división del trabajo produce resultados más precisos que una sola llamada monolítica al LLM porque cada agente opera dentro de una ventana de contexto enfocada y aplica estrategias de prompting específicas del dominio.

Sí, MicrocosmWorks desarrolló un motor de análisis de hojas de cálculo que resuelve las dependencias de fórmulas, expande los resúmenes de tablas dinámicas y rastrea las referencias entre hojas antes de pasar los datos estructurados a los agentes de análisis. El sistema convierte construcciones complejas de Excel en representaciones de datos aplanadas sobre las que los LLMs pueden razonar eficazmente, y preserva el contexto relacional entre hojas para que la AI pueda responder preguntas como 'qué departamento excedió su presupuesto del tercer trimestre' que requieren unir datos de varias pestañas.

MicrocosmWorks implementó una pipeline de enlace de entidades que extrae entidades nombradas, identificadores numéricos y referencias de fecha de todos los documentos cargados, luego construye un grafo de conocimiento conectando menciones relacionadas entre archivos. Cuando un usuario hace una pregunta, el agente de referencia cruzada recorre este grafo para extraer datos relevantes de múltiples documentos fuente, proporcionando respuestas que sintetizan información de maneras que a un analista humano le llevarían horas de verificación cruzada manual.

MicrocosmWorks diseñó el sistema para manejar lotes de documentos de hasta 500 archivos por sesión de análisis, con tamaños de archivo individuales de hasta 100MB para hojas de cálculo y 50MB para PDFs. Los documentos grandes se dividen automáticamente en fragmentos y se procesan en paralelo a través de múltiples instancias de agente, y el orquestador mantiene una vista coherente de todo el conjunto de documentos al agregar las salidas de los agentes en una representación de conocimiento unificada.

MicrocosmWorks desarrolla plataformas de análisis de documentos multiagente a tarifas de $30-$50/hora, y un sistema listo para producción suele requerir 3-5 meses de desarrollo, incluyendo el análisis de documentos, orquestación de agentes, detección de referencias cruzadas y una interfaz de consulta para el usuario. El costo por consulta en producción depende del volumen de documentos y el uso de tokens del LLM, pero las arquitecturas multiagente en realidad reducen los costos del LLM al enrutar solo el contexto relevante a cada agente en lugar de introducir conjuntos completos de documentos en un solo prompt.

¿Listo para Transformar su Negocio?

Hablemos sobre cómo podemos aplicar soluciones similares a sus desafíos.

ContáctenoscaseStudyDetail.viewAllCaseStudies