MicrocosmWorksInnover et Architecturer le Cosmos Numérique
Ă€ proposContact
MicrocosmWorksInnover et architecturer des cosmos numériques

Fournir des solutions informatiques qui comptent. Nous sommes passionnés par la technologie, la sécurité et aidons les entreprises à croître grâce à une infrastructure informatique fiable et innovante.

[email protected]
+91 7011868196
New Delhi, India

Hub de Croissance IA

Hub IAInnovation pour les startupsAccélérateur d'entreprise

Solutions

Toutes les solutionsApplications de bien-être et de fitnessPlateforme vidéo IADéveloppement d'agents IA

Ressources

PerspectivesGuides de l'industriePlans d'utilisationModèles d'architectureÉtudes de cas

Entreprise

Ă€ propos de nousContactNotre travail

Services

Consultation numériqueInfrastructure cloudDéveloppement SaaSDéveloppement IATechnologie vidéo
Développement ERPPersonnalisation ZohoDéveloppement OdooIntégration SalesforceDéveloppement CRM personnalisé
Intégration QuickBooksSolutions IoTDéveloppement Blockchain
Consultation en cybersécuritéSupport IT - L3

© 2026 MicrocosmWorks. Tous droits réservés.

Politique de confidentialitéConditions d'utilisation
Retour aux Études de Cas
Document IntelligencePublié June 22, 2026 · Mis à jour June 22, 2026

Analyse de feuilles de calcul et de documents assistée par l'AI avec orchestration multi-agents et référencement inter-documents

Une équipe de données d'entreprise avait besoin d'analyser, d'interroger et de modifier de vastes collections de feuilles de calcul et de documents (Excel, CSV, Google Sheets, PDFs, Word docs) en utilisant le langage naturel — avec la capacité de référencer des données entre plusieurs fichiers et d'exécuter des flux de travail analytiques multi-étapes sans manipulation manuelle des données.

Discutez de Votre Projet
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

Le Défi

Travailler avec des documents commerciaux à grande échelle était semé d'embûches :

  • DonnĂ©es silotĂ©es — Les informations critiques Ă©taient dispersĂ©es dans des dizaines de feuilles de calcul, de PDFs et de documents Word sans moyen de les interroger de manière transversale
  • RĂ©fĂ©rencement croisĂ© manuel — Comparer une liste de prix de fournisseur (Excel) avec les termes d'un contrat (PDF) et l'historique des factures (CSV) nĂ©cessitait des heures de recherche manuelle
  • Limitations des formules — Les questions analytiques complexes ne pouvaient pas ĂŞtre rĂ©solues uniquement avec les formules de feuilles de calcul
  • Limites des fenĂŞtres de contexte — Les grandes feuilles de calcul (plus de 50 000 lignes) dĂ©passaient les fenĂŞtres de contexte des LLM, ce qui entraĂ®nait l'Ă©chec des approches naĂŻves
  • Pas de capacitĂ©s d'Ă©dition — Les outils d'AI existants pouvaient analyser des documents mais ne pouvaient pas enregistrer les modifications dans les fichiers source
  • Raisonnement multi-Ă©tapes — Les questions nĂ©cessitant une analyse sĂ©quentielle Ă  travers les documents exigeaient des flux de travail multi-Ă©tapes orchestrĂ©s

Notre Solution

Nous avons construit une plateforme d'intelligence documentaire AI multi-agents avec récupération basée sur une base de données vectorielle pour les documents volumineux, des agents spécialisés pour différents types de documents, un orchestrateur pour le raisonnement inter-documents, et des capacités d'écriture en retour pour l'édition de feuilles de calcul.

Architecture

  • Orchestrateur : Agent orchestrateur AI coordonnant les flux de travail multi-Ă©tapes entre des agents spĂ©cialisĂ©s
  • Agent de feuille de calcul : Gère l'analyse de Excel/CSV/Google Sheets, la gĂ©nĂ©ration de formules et l'Ă©dition de cellules
  • Agent de document : Gère la lecture, l'extraction et la synthèse de documents PDF/Word
  • Agent de rĂ©fĂ©rencement croisĂ© : Effectue des jointures, des comparaisons et des rĂ©conciliations entre diffĂ©rents types de documents
  • Base de donnĂ©es vectorielle : Milvus pour l'indexation sĂ©mantique des segments de documents et des lignes de feuilles de calcul
  • Couche LLM : Approche multi-modèle avec appel de fonctions
  • Backend : Python/FastAPI pour le traitement des documents et l'orchestration des agents
  • Frontend : Tableau de bord React avec tĂ©lĂ©versement de fichiers, interface de chat et aperçu en direct des feuilles de calcul
  • Stockage : S3 pour les fichiers originaux, PostgreSQL pour les mĂ©tadonnĂ©es et le suivi des tâches

Architecture multi-agents

RĂ´les des agents

1. Agent orchestrateur

Le coordinateur central qui reçoit les requêtes utilisateur, les décompose en sous-tâches et les délègue à des agents spécialisés. Il analyse l'intention de l'utilisateur, crée des plans d'exécution, gère le flux de données entre les agents, agrège les résultats et gère la récupération après erreur.

2. Agent de feuille de calcul

Spécialisé dans les opérations sur les données tabulaires, y compris la compréhension du schéma, la traduction du langage naturel en requête, les agrégations et le filtrage, la génération de formules, l'édition de cellules et le remplissage de colonnes, les suggestions de graphiques et la validation des données/détection d'anomalies.

3. Agent de document

Spécialisé dans les documents non structurés et semi-structurés, y compris l'OCR et l'extraction de texte sensible à la mise en page, l'identification de sections, l'extraction de paires clé-valeur des contrats, la synthèse, la recherche de clauses sémantiques et l'extraction de tableaux à partir de PDFs/Word docs.

4. Agent de référencement croisé

Spécialisé dans le raisonnement multi-documents, y compris la correspondance d'entités entre les documents, la réconciliation des données et l'identification des écarts, l'analyse chronologique, la résolution des dépendances pour les données conflictuelles et les opérations de jointure de type SQL entre les types de documents.

Couche de base de données vectorielle

Pourquoi une base de données vectorielle pour les documents

Les documents et feuilles de calcul volumineux ne peuvent pas tenir dans une seule fenêtre de contexte LLM. La base de données vectorielle permet la recherche sémantique à travers des millions de lignes et de segments de documents, la récupération uniquement des portions pertinentes par requête, la liaison d'entités inter-documents via la similarité d'embedding, et l'indexation persistante qui ne nécessite pas de re-traitement à chaque requête.

Stratégie d'indexation

Indexation des feuilles de calcul :

Chaque ligne est convertie en une représentation en langage naturel en concaténant les valeurs des colonnes clés, puis intégrée (embedded) et stockée avec des références vers le fichier original, la feuille et l'index de ligne pour les opérations d'écriture en retour.

Indexation des documents :

Les documents sont extraits en tenant compte de la mise en page, découpés en segments sémantiques avec chevauchement, intégrés (embedded) et stockés avec des références au fichier source, à la section et au numéro de page.

Index d'entités inter-documents :

Un index séparé relie les entités (fournisseurs, produits, personnes, numéros de facture) entre les documents, permettant aux requêtes de référencement croisé de trouver rapidement toutes les mentions d'une entité, quel que soit le fichier source.

Pipeline de récupération

Lorsqu'un utilisateur pose une question inter-documents, l'orchestrateur identifie les documents et les agents nécessaires, effectue des recherches vectorielles pour trouver des données pertinentes dans toutes les sources, délègue aux agents spécialisés pour le traitement et agrège les résultats en une réponse cohérente.

Moteur d'orchestration

Décomposition des requêtes

L'orchestrateur décompose les requêtes complexes en plans d'exécution multi-étapes. Par exemple, une question telle que « Trouver les fournisseurs ayant des livraisons tardives, vérifier les clauses de pénalité contractuelles et calculer les pénalités réclamables » serait décomposée en étapes séquentielles : interroger les données de livraison via l'Agent de feuille de calcul, rechercher les contrats via l'Agent de document et joindre les résultats via l'Agent de référencement croisé.

Communication des agents

  • Les agents communiquent via des messages structurĂ©s avec des charges utiles typĂ©es
  • L'orchestrateur maintient le contexte d'exĂ©cution avec les rĂ©sultats intermĂ©diaires
  • Les Ă©tapes Ă©chouĂ©es dĂ©clenchent des stratĂ©gies de rĂ©essai ou de repli
  • Des rĂ©sultats partiels sont renvoyĂ©s si certaines Ă©tapes se terminent mais d'autres Ă©chouent

Édition de feuilles de calcul et écriture en retour (Write-Back)

Capacités d'édition

La plateforme prend en charge les mises à jour de cellules, le remplissage de colonnes, l'insertion de lignes, le formatage conditionnel, la création de nouvelles feuilles et l'injection de formules — le tout proposé par les agents AI et appliqué avec l'approbation de l'utilisateur.

Pipeline d'écriture en retour (Write-Back)

  1. L'agent détermine l'opération d'édition (quelles cellules, quelles valeurs)
  2. Un aperçu des modifications est affiché à l'utilisateur avec surbrillance des différences (anciennes vs. nouvelles valeurs)
  3. L'utilisateur approuve ou modifie les changements proposés
  4. Le Backend applique les modifications au fichier en utilisant les bibliothèques appropriées par format
  5. Le fichier modifié est enregistré comme une nouvelle version avec un journal d'audit des modifications
  6. L'index vectoriel est mis à jour pour les lignes modifiées

ContrĂ´le de version

  • Chaque modification crĂ©e une nouvelle version du fichier (l'original est prĂ©servĂ©)
  • Le diff log montre exactement ce qui a changĂ©, quand et pourquoi
  • Restauration Ă  toute version prĂ©cĂ©dente en un clic
  • Attribution des modifications : quel agent ou utilisateur a effectuĂ© chaque changement

Pipeline de traitement pour les nouveaux documents

Flux de téléversement de fichiers

  1. L'utilisateur télécharge des fichiers (glisser-déposer ou API)
  2. Le type de fichier est détecté et acheminé vers le processeur approprié
  3. Feuilles de calcul : Analysées, schéma inféré, lignes intégrées (embedded) et indexées
  4. PDFs : OCR (si scanné) → extraction de la mise en page → découpage (chunking) → intégration (embedding) → indexation
  5. Documents Word : Extraction de texte → analyse de section → découpage (chunking) → intégration (embedding) → indexation
  6. Extraction d'entités : NER identifie les personnes, organisations, dates, montants dans tous les documents
  7. Liaison inter-documents : L'index d'entités est mis à jour avec les nouvelles mentions
  8. Les métadonnées des fichiers sont stockées dans PostgreSQL, les embeddings dans la base de données vectorielle, les originaux dans S3

Formats pris en charge

La plateforme prend en charge Excel, CSV et Google Sheets (avec écriture en retour complète), les PDFs natifs et numérisés (lecture seule), ainsi que les documents Word et Google Docs (écriture en retour limitée).

Fonctionnalités clés

  1. Architecture multi-agents — Agents spécialisés pour les feuilles de calcul, les documents et le référencement croisé
  2. Orchestrateur AI — Décompose les requêtes complexes en plans d'exécution multi-étapes
  3. Référencement inter-documents — Liaison d'entités et réconciliation de données entre les types de fichiers
  4. Récupération basée sur les vecteurs — La recherche sémantique gère des ensembles de données au-delà des limites de contexte des LLM
  5. Écriture en retour (Write-Back) de feuilles de calcul — L'AI modifie les cellules, remplit les colonnes et injecte des formules avec l'approbation de l'utilisateur
  6. Prise en charge des grands ensembles de données — Feuilles de calcul de plus de 50 000 lignes indexées et interrogeables via la recherche vectorielle
  7. Contrôle de version — Chaque modification est versionnée avec un journal des différences (diff log) et une capacité de restauration
  8. Requêtes en langage naturel — Posez des questions analytiques complexes en anglais simple
  9. Prise en charge multi-formats — Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. Aperçu des modifications — Aperçu avec surbrillance des différences (diff-highlighted) avant l'application des modifications

Résultats

Vitesse de requête : Questions inter-documents répondues en 10-30 secondes contre des heures de recherche manuelle
Échelle des données : Prise en charge de plus de 500 documents et feuilles de calcul avec plus de 2 millions de lignes indexées au total
Précision d'édition : Modifications de feuilles de calcul proposées par l'AI acceptées sans modification 85 % du temps
Référencement croisé : Correspondance d'entités reliant les données entre les documents avec une précision de 92 %
Précision de récupération : La recherche vectorielle a renvoyé les segments pertinents dans les 5 meilleurs résultats 94 % du temps
Gain de temps : Réduction des flux de travail d'analyse multi-documents de plusieurs heures à quelques minutes

Stack Technologique

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCRDocument Processing Libraries

caseStudyDetail.more Études de Cas

Découvrez plus de nos implémentations techniques

Document Intelligence

Système RAG de documents local d'abord avec recherche hybride et prise en charge multi-formats

Une équipe développant des outils pour développeurs avait besoin d'un système d'intelligence documentaire entièrement local et respectueux de la vie privée, capable d'ingérer plusieurs formats de fichiers, de construire des bases de connaissances interrogeables et de répondre à des requêtes en langage naturel en utilisant le RAG — sans envoyer aucune donnée à des API externes.

Lire l'Étude de Cas
AI Accounting

Traitement de factures assisté par l'IA avec OCR et intégration QuickBooks

Une entreprise de taille moyenne, traitant des centaines de factures fournisseurs chaque mois, devait éliminer la saisie manuelle des données en extrayant automatiquement les données des factures à l'aide de l'IA/OCR et en les synchronisant directement dans QuickBooks pour la tenue de livres et le suivi des paiements.

Lire l'Étude de Cas
Video Encoding

Insertion d'annonces côté client (CSAI) avec analyse des marqueurs SCTE-35 et intégration de lecteurs multiplateformes

Une plateforme de streaming vidéo devait implémenter l'insertion d'annonces côté client (CSAI) sur les applications web, mobiles et de télévision connectée — permettant des expériences publicitaires personnalisées au niveau de l'appareil avec un support complet d'interaction publicitaire (superpositions cliquables, bannières complémentaires, boutons de saut) que l'insertion côté serveur ne peut pas offrir.

Lire l'Étude de Cas

Questions fréquemment posées

MicrocosmWorks a conçu une architecture multi-agents où des agents spécialisés gèrent différents aspects de l'analyse de documents, tels qu'un agent d'extraction de tableaux pour les feuilles de calcul, un agent de résumé de texte pour les documents narratifs, et un agent de référence croisée qui identifie les relations entre les points de données à travers plusieurs fichiers. Cette division du travail produit des résultats plus précis qu'un seul appel monolithique à un LLM, car chaque agent opère dans une fenêtre de contexte ciblée et applique des stratégies d'invite spécifiques au domaine.

Oui, MicrocosmWorks a développé un moteur d'analyse de feuilles de calcul qui résout les dépendances de formules, développe les résumés de tableaux croisés dynamiques et trace les références inter-feuilles avant de transmettre les données structurées aux agents d'analyse. Le système convertit les constructions Excel complexes en représentations de données aplaties que les LLMs peuvent analyser efficacement, et préserve le contexte relationnel entre les feuilles afin que l'AI puisse répondre à des questions telles que 'quel département a dépassé son budget du T3' qui nécessitent de joindre des données provenant de plusieurs onglets.

MicrocosmWorks a implémenté un pipeline de liaison d'entités qui extrait les entités nommées, les identifiants numériques et les références de dates de tous les documents téléchargés, puis construit un graphe de connaissances connectant les mentions connexes entre les fichiers. Lorsqu'un utilisateur pose une question, l'agent de référence croisée parcourt ce graphe pour extraire les données pertinentes de plusieurs documents sources, fournissant des réponses qui synthétisent les informations d'une manière qui prendrait des heures de vérification croisée manuelle à un analyste humain.

MicrocosmWorks a conçu le système pour gérer des lots de documents allant jusqu'à 500 fichiers par session d'analyse, avec des tailles de fichier individuelles allant jusqu'à 100MB pour les feuilles de calcul et 50MB pour les PDFs. Les documents volumineux sont automatiquement fragmentés et traités en parallèle sur plusieurs instances d'agents, et l'orchestrateur maintient une vue cohérente de l'ensemble des documents en agrégeant les sorties des agents dans une représentation unifiée des connaissances.

MicrocosmWorks développe des plateformes d'analyse de documents multi-agents à des tarifs de 30 à 50 $/heure, un système prêt pour la production nécessitant généralement 3 à 5 mois de développement, y compris l'analyse syntaxique de documents, l'orchestration d'agents, la détection de références croisées et une interface de requête utilisateur. Le coût par requête en production dépend du volume de documents et de l'utilisation des jetons LLM, mais les architectures multi-agents réduisent en fait les coûts des LLM en acheminant uniquement le contexte pertinent à chaque agent plutôt que d'intégrer des ensembles de documents entiers dans une seule invite.

PrĂŞt Ă  Transformer Votre Entreprise ?

Discutons de la façon dont nous pouvons appliquer des solutions similaires à vos défis.

Contactez-NouscaseStudyDetail.viewAllCaseStudies