MicrocosmWorksInnovere og Arkitektere Digitale Kosmos
OmKontakt
MicrocosmWorksInnoverer og arkitekterer digitale kosmos

Leverer IT-løsninger, der betyder noget. Vi brænder for teknologi, sikkerhed og at hjælpe virksomheder med at vokse gennem pålidelig, innovativ IT-infrastruktur.

[email protected]
+91 7011868196
New Delhi, India

AI Væksthub

AI HubStartup-innovationVirksomhedsaccelerator

Løsninger

Alle løsningerSundhed & Fitness AppsAI VideoplatformAI Agentudvikling

Ressourcer

IndsigterIndustri GuiderBrugssag BlueprintsArkitektur MønstreCase Studier

Virksomhed

Om OsKontaktVores Arbejde

Tjenester

Digital RådgivningCloud InfrastrukturSaaS UdviklingAI UdviklingVideo Teknologi
ERP UdviklingZoho TilpasningOdoo UdviklingSalesforce IntegrationTilpasset CRM Udvikling
QuickBooks IntegrationIoT LøsningerBlockchain Udvikling
Cybersikkerhed RådgivningIT-support - L3

© 2026 MicrocosmWorks. Alle rettigheder forbeholdes.

PrivatlivspolitikServicevilkår
Tilbage til Casestudier
Document IntelligenceOffentliggjort June 22, 2026 · Opdateret June 22, 2026

AI-drevet Regneark & Dokumentanalyse med Multi-Agent Orkestrering og Krydsdokument Reference

Et virksomhedsdatasæt havde brug for at analysere, forespørge og redigere store samlinger af regneark og dokumenter (Excel, CSV, Google Sheets, PDF'er, Word-dokumenter) ved hjælp af naturligt sprog — med evnen til at krydsreferere data på tværs af flere filer og udføre flertrins analytiske arbejdsgange uden manuel datahåndtering.

Diskuter Dit Projekt
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

Udfordringen

Arbejdet med forretningsdokumenter i stor skala var fyldt med friktion:

  • Siloed Data — Kritisk information var spredt over dusinvis af regneark, PDF'er og Word-dokumenter uden mulighed for at forespørge på tværs af dem
  • Manuel Krydsreferering — Sammenligning af en leverandørprisliste (Excel) mod kontraktbetingelser (PDF) mod fakturahistorik (CSV) krævede timers manuel opslag
  • Formelbegrænsninger — Komplekse analytiske spørgsmål kunne ikke besvares med regnearksformler alene
  • Begrænsninger i Kontekstvindue — Store regneark (50.000+ rækker) overskred LLM kontekstvinduer, hvilket gjorde naive tilgange mislykkede
  • Ingen Redigeringsmuligheder — Eksisterende AI-værktøjer kunne analysere dokumenter, men kunne ikke skrive ændringer tilbage til kildefilerne
  • Flertrins Ræsonnering — Spørgsmål, der kræver sekventiel analyse på tværs af dokumenter, havde brug for orkestrerede flertrins arbejdsgange

Vores Løsning

Vi byggede en multi-agent AI dokumentintelligensplatform med vektordatabase-understøttet hentning for store dokumenter, specialiserede agenter for forskellige dokumenttyper, en orkestrator til krydsdokument ræsonnering og skrive-tilbage kapaciteter til regnearksredigering.

Arkitektur

  • Orchestrator: AI orkestrator agent, der koordinerer flertrins arbejdsgange på tværs af specialiserede agenter
  • Spreadsheet Agent: Håndterer Excel/CSV/Google Sheets analyse, formelgenerering og celleændringer
  • Document Agent: Håndterer PDF/Word dokumentlæsning, udtræk og opsummering
  • Cross-Reference Agent: Udfører joins, sammenligninger og afstemning på tværs af dokumenttyper
  • Vector Database: Milvus til semantisk indeksering af dokumentstykker og regnearksrækker
  • LLM Layer: Multi-model tilgang med funktionskald
  • Backend: Python/FastAPI til dokumentbehandling og agentorkestrering
  • Frontend: React dashboard med filupload, chatgrænseflade og live regnearksvisning
  • Storage: S3 til originale filer, PostgreSQL til metadata og jobsporing

Multi-Agent Arkitektur

Agentroller

1. Orchestrator Agent

Den centrale koordinator, der modtager brugerforespørgsler, nedbryder dem i delopgaver og delegerer til specialiserede agenter. Den analyserer brugerens hensigt, skaber udførelsesplaner, styrer dataflow mellem agenter, aggregerer resultater og håndterer fejlretning.

2. Spreadsheet Agent

Specialiseret til tabulære dataoperationer inklusive skemaforståelse, oversættelse af naturligt sprog til forespørgsel, aggregeringer og filtrering, formelgenerering, celleændringer og kolonneudfyldninger, diagramforslag og datavalidering/anomalidetektion.

3. Document Agent

Specialiseret til ustrukturerede og semi-strukturerede dokumenter inklusive OCR og layout-bevidst tekstudtræk, sektionidentifikation, nøgle-værdi udtræk fra kontrakter, opsummering, semantisk klausulsøgning og tabeludtræk fra PDF'er/Word dokumenter.

4. Cross-Reference Agent

Specialiseret til multi-dokument ræsonnering inklusive enhedsmatchning på tværs af dokumenter, dataafstemning og uoverensstemmelsesidentifikation, tidslinjeanalyse, afhængighedsopløsning for modstridende data og SQL-lignende join-operationer på tværs af dokumenttyper.

Vektordatabase Lag

Hvorfor Vector DB til Dokumenter

Store dokumenter og regneark kan ikke passe i et enkelt LLM kontekstvindue. Vektordatabasen muliggør semantisk søgning på tværs af millioner af rækker og dokumentstykker, hentning af kun relevante dele pr. forespørgsel, krydsdokument enhedslinking via indlejringslighed og vedvarende indeksering, der ikke behøver genbehandling ved hver forespørgsel.

Indekseringsstrategi

Spreadsheet Indeksering:

Hver række konverteres til en naturligt sprog repræsentation ved at sammenkæde nøglekolonneværdier, derefter indlejret og gemt med referencer tilbage til den originale fil, ark og rækkeindeks for skrive-tilbage operationer.

Document Indeksering:

Dokumenter udtrækkes med layout-bevidsthed, opdelt i semantiske segmenter med overlap, indlejret og gemt med referencer til kildefilen, sektionen og sidenummeret.

Cross-Document Entity Index:

Et separat indeks linker enheder (leverandører, produkter, personer, fakturanumre) på tværs af dokumenter, hvilket muliggør krydsreference forespørgsler til hurtigt at finde alle nævnelser af en enhed uanset kildefil.

Hentningspipeline

Når en bruger stiller et krydsdokument spørgsmål, identificerer orkestratoren hvilke dokumenter og agenter der er nødvendige, udfører vektorsøgninger for at finde relevante data på tværs af alle kilder, delegerer til specialiserede agenter til behandling og aggregerer resultaterne til et sammenhængende svar.

Orkestreringsmotor

Forespørgselsnedbrydning

Orkestratoren bryder komplekse forespørgsler ned i flertrins udførelsesplaner. For eksempel ville et spørgsmål som "Find leverandører med sene leverancer, tjek kontraktstraffeklausuler og beregn kravbare straffe" blive nedbrudt i sekventielle trin: forespørgsel om leveringsdata via Spreadsheet Agent, søgning i kontrakter via Document Agent og sammenføjning af resultater via Cross-Reference Agent.

Agentkommunikation

  • Agenter kommunikerer via strukturerede meddelelser med typede nyttelaster
  • Orkestratoren opretholder udførelseskontekst med mellemliggende resultater
  • Fejlede trin udløser retry eller fallback strategier
  • Delvise resultater returneres, hvis nogle trin fuldføres, men andre fejler

Regnearksredigering & Skrive-tilbage

Redigeringsmuligheder

Platformen understøtter celleopdateringer, kolonneudfyldninger, rækkeindsættelse, betinget formatering, oprettelse af nye ark og formelinjektion — alt foreslået af AI-agenter og anvendt med brugerens godkendelse.

Skrive-tilbage Pipeline

  1. Agenten bestemmer redigeringsoperationen (hvilke celler, hvilke værdier)
  2. Redigeringsforhåndsvisning vises til brugeren med diff-fremhævning (gamle vs. nye værdier)
  3. Brugeren godkender eller ændrer de foreslåede ændringer
  4. Backend anvender ændringer til filen ved hjælp af passende biblioteker pr. format
  5. Ændret fil gemmes som en ny version med redigeringsspor
  6. Vektorindeks opdateres for ændrede rækker

Versionskontrol

  • Hver redigering skaber en ny filversion (original bevaret)
  • Diff-log viser præcis, hvad der blev ændret, hvornår og hvorfor
  • Tilbagefør til enhver tidligere version med et klik
  • Redigeringsattribution: hvilken agent eller bruger der foretog hver ændring

Behandlingspipeline for Nye Dokumenter

Filupload Flow

  1. Bruger uploader filer (træk-og-slip eller API)
  2. Filtype detekteres og dirigeres til passende processor
  3. Spreadsheets: Parsede, skema udledt, rækker indlejret og indekseret
  4. PDFs: OCR (hvis scannet) → layoutudtræk → chunking → indlejring → indeksering
  5. Word Docs: Tekstudtræk → sektion parsing → chunking → indlejring → indeksering
  6. Entity Extraction: NER identificerer personer, organisationer, datoer, beløb på tværs af alle dokumenter
  7. Cross-Document Linking: Enhedsindeks opdateres med nye nævnelser
  8. Filmetadata gemt i PostgreSQL, indlejringer i vektor DB, originaler i S3

Understøttede Formater

Platformen understøtter Excel, CSV og Google Sheets (med fuld skrive-tilbage), native og scannede PDF'er (kun læsning) og Word-dokumenter og Google Docs (begrænset skrive-tilbage).

Nøglefunktioner

  1. Multi-Agent Arkitektur — Specialiserede agenter til regneark, dokumenter og krydsreferering
  2. AI Orchestrator — Nedbryder komplekse forespørgsler i flertrins udførelsesplaner
  3. Krydsdokument Reference — Enhedslinking og dataafstemning på tværs af filtyper
  4. Vektor-drevet Hentning — Semantisk søgning håndterer datasæt ud over LLM kontekstgrænser
  5. Regnearks Skrive-tilbage — AI redigerer celler, udfylder kolonner og indsprøjter formler med brugerens godkendelse
  6. Støtte til Store Datasæt — 50.000+ række regneark indekseret og forespørgbar via vektorsøgning
  7. Versionskontrol — Hver redigering versioneret med diff-log og tilbageføringsmulighed
  8. Naturligt Sprog Forespørgsler — Stil komplekse analytiske spørgsmål på almindeligt engelsk
  9. Multi-Format Support — Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. Redigeringsforhåndsvisning — Diff-fremhævet forhåndsvisning før ændringer anvendes

Resultater

Forespørgselshastighed: Krydsdokument spørgsmål besvaret på 10-30 sekunder mod timers manuel opslag
Data Skala: Håndterede 500+ dokumenter og regneark med 2M+ totale rækker indekseret
Redigeringsnøjagtighed: AI-foreslåede regnearksredigeringer accepteret uden ændring 85% af tiden

Teknologistak

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCR

caseStudyDetail.more Casestudier

Udforsk flere af vores tekniske implementeringer

Document Intelligence

Lokal-First Dokument RAG System med Hybrid Søgning & Multi-Format Support

Et team, der bygger udviklerværktøjer, havde brug for et fuldt lokalt, privatlivsbevarende dokumentintelligenssystem, der kunne indlæse flere filformater, opbygge søgbare vidensbaser og besvare naturlige sprogforespørgsler ved hjælp af Retrieval-Augmented Generation — uden at sende nogen data til eksterne API'er.

Læs Casestudie
AI Accounting

AI-drevet fakturabehandling med OCR og QuickBooks-integration

En mellemstor virksomhed, der månedligt behandler hundredvis af leverandørfakturaer, havde brug for at eliminere manuel dataindtastning ved automatisk at udtrække fakturadata ved hjælp af AI/OCR og synkronisere dem direkte til QuickBooks for bogføring og sporing af betalinger.

Læs Casestudie

Klar til at Transformere Din Virksomhed?

Lad os drøfte, hvordan vi kan anvende lignende løsninger til dine udfordringer.

Kontakt OscaseStudyDetail.viewAllCaseStudies
Krydsreference: Enhedsmatchning linkede data på tværs af dokumenter med 92% nøjagtighed
Hentningspræcision: Vektorsøgning returnerede relevante stykker i top-5 resultater 94% af tiden
Tidsbesparelser: Reducerede multi-dokument analyse arbejdsgange fra timer til minutter
Document Processing Libraries
Video Encoding

Klient-side annonceindsættelse (CSAI) med SCTE-35-markørparsing og integration af afspillere på flere platforme

En videostreamingplatform skulle implementere klient-side annonceindsættelse (CSAI) på tværs af web-, mobil- og connected TV-apps – hvilket muliggjorde personaliserede annonceringer på enhedsniveau med fuld support for annonceinteraktion (klikbare overlays, følgebannere, skip-knapper), som server-side indsættelse ikke kan tilbyde.

Læs Casestudie

Ofte stillede spørgsmål

MicrocosmWorks har designet en multi-agent arkitektur, hvor specialiserede agenter håndterer forskellige aspekter af dokumentanalyse, såsom en tabeludtræksagent til regneark, en tekstopsummeringsagent til narrative dokumenter og en krydsrefererende agent, der identificerer relationer mellem datapunkter på tværs af flere filer. Denne arbejdsdeling producerer mere præcise resultater end et enkelt monolitisk LLM-kald, fordi hver agent opererer inden for et fokuseret kontekstvindue og anvender domænespecifikke prompting-strategier.

Ja, MicrocosmWorks har bygget en regnearks-parsing-motor, der løser formelafhængigheder, udvider pivottabelloversigter og sporer henvisninger på tværs af ark, før det videregiver strukturerede data til analyseagenterne. Systemet konverterer komplekse Excel-konstruktioner til fladtrykte datarepræsentationer, som LLM'er effektivt kan ræsonnere med, og bevarer den relationelle kontekst mellem ark, så AI'en kan besvare spørgsmål som 'hvilken afdeling overskred sit Q3-budget', der kræver sammenføjning af data på tværs af flere faner.

MicrocosmWorks implementerede en entitetskoblingspipeline, der udtrækker navngivne entiteter, numeriske identifikatorer og datoreferencer fra alle uploadede dokumenter og derefter bygger en vidensgraf, der forbinder relaterede omtaler på tværs af filer. Når en bruger stiller et spørgsmål, gennemløber krydshenvisningsagenten denne graf for at trække relevante data fra flere kildedokumenter og giver svar, der syntetiserer information på måder, som ville tage en menneskelig analytiker timer at krydstjekke manuelt.

MicrocosmWorks designede systemet til at håndtere dokumentbatcher på op til 500 filer pr. analysesession, med individuelle filstørrelser på op til 100MB for regneark og 50MB for PDF'er. Store dokumenter chunkes automatisk og behandles parallelt på tværs af flere agent instances, og orchestrator'en opretholder et sammenhængende overblik over hele dokumentsættet ved at aggregere agent outputs til en samlet knowledge representation.

MicrocosmWorks udvikler multi-agent dokumentanalyseplatforme til priser på $30-$50/time, hvor et produktionsklart system typisk kræver 3-5 måneders udvikling herunder dokumentparsing, agentorkestrering, krydsreferencedetektion og en brugervendt forespørgselsgrænseflade. Omkostningen per forespørgsel i produktion afhænger af dokumentvolumen og LLM token-forbrug, men multi-agent arkitekturer reducerer faktisk LLM-omkostningerne ved kun at rute relevant kontekst til hver agent i stedet for at proppe hele dokumentsæt ind i en enkelt prompt.