MicrocosmWorksInnovoimassa ja Arkkitehtuuria Digitaalisessa Kosmoksessa
TietoaYhteystiedot
MicrocosmWorksInnovoimassa ja suunnittelemassa digitaalista kosmosta

Toimitamme IT-ratkaisuja, joilla on merkitystä. Olemme intohimoisia teknologiasta, turvallisuudesta ja autamme yrityksiä kasvamaan luotettavan, innovatiivisen IT-infrastruktuurin kautta.

[email protected]
+91 7011868196
New Delhi, India

AI Kasvuhubi

AI HubStartup-innovaatiotYrityskiihdyttämö

Ratkaisut

Kaikki ratkaisutHyvinvointi- ja kuntoilusovelluksetAI-videoplatformiAI-agenttikehitys

Resurssit

OivalluksetToimialan oppaatKäyttötapausmallitArkkitehtuurimallitTapaustutkimukset

Yritys

Tietoa meistäYhteystiedotTyömme

Palvelut

Digitaalinen konsultointiPilvi-infrastruktuuriSaaS-kehitysAI-kehitysVideoteknologia
ERP-kehitysZoho-mukautusOdoo-kehitysSalesforce-integraatioMukautettu CRM-kehitys
QuickBooks-integraatioIoT-ratkaisutLohkoketjukehitys
KyberturvallisuuskonsultointiIT-tuki - L3

© 2026 MicrocosmWorks. Kaikki oikeudet pidätetään.

TietosuojakäytäntöKäyttöehdot
Takaisin Tapaustutkimuksiin
Document IntelligenceJulkaistu June 22, 2026 · Päivitetty June 22, 2026

AI-pohjainen taulukko- ja dokumenttianalyysi moniagenttiorkestroinnilla ja dokumenttienvälisellä viittauksella

Yrityksen datatiimi tarvitsi analysoida, kysellä ja muokata suuria taulukko- ja dokumenttikokoelmia (Excel, CSV, Google Sheets, PDF:t, Word-dokumentit) luonnollisella kielellä – kyvyllä ristiviitata tietoja useista tiedostoista ja suorittaa monivaiheisia analyyttisiä työnkulkuja ilman manuaalista tiedonkäsittelyä.

Keskustele Projektistasi
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

Haaste

Yritysdokumenttien käsittely suuressa mittakaavassa oli täynnä kitkaa:

  • Siiloutunut data — Kriittinen tieto oli hajallaan kymmenissä taulukoissa, PDF:issä ja Word-dokumenteissa ilman keinoa kysellä niistä yhdessä
  • Manuaalinen ristiviittaus — Myyjän hinnaston (Excel) vertailu sopimusehtoihin (PDF) laskutushistorian (CSV) kanssa vaati tunteja manuaalista etsintää
  • Kaavarajoitukset — Monimutkaisiin analyyttisiin kysymyksiin ei voitu vastata pelkillä taulukon kaavoilla
  • Konteksti-ikkunan rajoitukset — Suuret taulukot (yli 50 000 riviä) ylittivät LLM-konteksti-ikkunat, tehden naiiveista lähestymistavoista epäonnistuvia
  • Ei muokkausominaisuuksia — Olemassa olevat AI-työkalut pystyivät analysoimaan dokumentteja, mutta eivät voineet kirjoittaa muutoksia takaisin lähdetiedostoihin
  • Monivaiheinen päättely — Kysymykset, jotka vaativat peräkkäistä analyysiä dokumenttien välillä, tarvitsivat orkestroituja monivaiheisia työnkulkuja

Meidän Ratkaisumme

Rakensimme moniagenttisen AI-dokumenttitiedustelualustan, jossa on vektoritietokannan tukema haku suurille dokumenteille, erikoistuneita agentteja eri dokumenttityypeille, orkestraattori dokumenttienväliseen päättelyyn ja takaisinkirjoitusominaisuudet taulukoiden muokkaamiseen.

Arkkitehtuuri

  • Orkestraattori: AI-orkestraattoriagentti, joka koordinoi monivaiheisia työnkulkuja erikoistuneiden agenttien välillä
  • Taulukkoagentti: Käsittelee Excel/CSV/Google Sheets -analyysiä, kaavojen luomista ja solumuokkauksia
  • Dokumenttiagentti: Käsittelee PDF/Word-dokumenttien lukemista, poimintaa ja yhteenvetoa
  • Ristiviittausagentti: Suorittaa liitoksia, vertailuja ja täsmäytyksiä dokumenttityyppien välillä
  • Vektoritietokanta: Milvus dokumenttien palojen ja taulukon rivien semanttiseen indeksointiin
  • LLM-kerros: Monimallinen lähestymistapa funktionkutsuilla
  • Backend: Python/FastAPI dokumenttien käsittelyyn ja agenttien orkestrointiin
  • Frontend: React-hallintapaneeli tiedostojen latauksella, chat-käyttöliittymällä ja reaaliaikaisella taulukon esikatselulla
  • Tallennustila: S3 alkuperäisille tiedostoille, PostgreSQL metadatalle ja työjonon seurannalle

Moniagenttiarkkitehtuuri

Agenttien roolit

1. Orkestraattoriagentti

Keskitetty koordinaattori, joka vastaanottaa käyttäjien kyselyjä, hajottaa ne alitehtäviin ja delegoi erikoistuneille agenteille. Se analysoi käyttäjän tarkoituksen, luo suoritussuunnitelmia, hallinnoi tiedonkulkua agenttien välillä, kokoaa tuloksia ja hoitaa virheenpalautuksen.

2. Taulukkoagentti

Erikoistunut taulukkodataoperaatioihin, mukaan lukien skeeman ymmärtäminen, luonnollisen kielen muuntaminen kyselyiksi, aggregoinnit ja suodatukset, kaavojen luominen, solujen muokkaus ja sarakkeiden täyttö, kaavioehdotukset sekä datan validointi/poikkeamien havaitseminen.

3. Dokumenttiagentti

Erikoistunut jäsentämättömiin ja puolijäsenneltyihin dokumentteihin, mukaan lukien OCR ja asettelun huomioiva tekstin poiminta, osioiden tunnistaminen, avain-arvo-poiminta sopimuksista, yhteenveto, semanttinen lausekehaku sekä taulukoiden poiminta PDF:istä/Word-dokumenteista.

4. Ristiviittausagentti

Erikoistunut monidokumenttipäättelyyn, mukaan lukien entiteettien täsmäytys dokumenttien välillä, datan täsmäytys ja eroavaisuuksien tunnistus, aikajanaanalyysi, ristiriitaisen datan riippuvuuksien ratkaisu sekä SQL-tyyppiset liitosoperaatiot dokumenttityyppien välillä.

Vektoritietokantakerros

Miksi vektoritietokanta dokumenteille

Suuret dokumentit ja taulukot eivät mahdu yhteen LLM-konteksti-ikkunaan. Vektoritietokanta mahdollistaa semanttisen haun miljoonista riveistä ja dokumenttipaloista, vain relevanttien osien haun kyselyä kohden, dokumenttienvälisen entiteettilinkityksen upotuksen samankaltaisuuden avulla sekä pysyvän indeksoinnin, joka ei vaadi uudelleenkäsittelyä jokaisella kyselyllä.

Indeksointistrategia

Taulukoiden indeksointi:

Jokainen rivi muunnetaan luonnollisen kielen esitykseksi yhdistämällä avainsarakkeiden arvot, minkä jälkeen se upotetaan ja tallennetaan viittauksilla takaisin alkuperäiseen tiedostoon, taulukkoon ja rivi-indeksiin takaisinkirjoitusoperaatioita varten.

Dokumenttien indeksointi:

Dokumentit poimitaan asettelun huomioiden, jaetaan semanttisiin palasiin päällekkäisyyksin, upotetaan ja tallennetaan viittauksilla lähdetiedostoon, osioon ja sivunumeroon.

Dokumenttienvälinen entiteetti-indeksi:

Erillinen indeksi linkittää entiteettejä (myyjiä, tuotteita, henkilöitä, laskunumeroita) dokumenttien välillä, mahdollistaen ristiviittauskyselyt löytämään nopeasti kaikki entiteetin maininnat lähdetiedostosta riippumatta.

Noutoputki

Kun käyttäjä esittää dokumenttienvälisen kysymyksen, orkestraattori tunnistaa tarvittavat dokumentit ja agentit, suorittaa vektorihakuja löytääkseen relevanttia dataa kaikista lähteistä, delegoi erikoistuneille agenteille käsittelyä varten ja kokoaa tulokset yhtenäiseksi vastaukseksi.

Orkestrointimoottori

Kyselyn hajottaminen

Orkestraattori hajottaa monimutkaiset kyselyt monivaiheisiksi suoritussuunnitelmiksi. Esimerkiksi kysymys kuten "Etsi myyjät, joilla on myöhästyneitä toimituksia, tarkista sopimussanktiolausekkeet ja laske vaadittavat sakot" hajoitettaisiin peräkkäisiin vaiheisiin: kysymällä toimitustietoja Spreadsheet Agentin kautta, etsimällä sopimuksia Document Agentin kautta ja yhdistämällä tulokset Cross-Reference Agentin kautta.

Agenttien välinen viestintä

  • Agentit kommunikoivat strukturoitujen viestien kautta tyypitetyillä tietosisällöillä
  • Orkestraattori ylläpitää suorituskontekstia välitulosten kanssa
  • Epäonnistuneet vaiheet laukaisevat uudelleenyritys- tai varastrategioita
  • Osittaisia tuloksia palautetaan, jos jotkin vaiheet valmistuvat mutta toiset epäonnistuvat

Taulukon muokkaus ja takaisinkirjoitus

Muokkausominaisuudet

Alusta tukee solujen päivityksiä, sarakkeiden täyttöjä, rivien lisäystä, ehdollista muotoilua, uusien taulukoiden luomista ja kaavojen syöttämistä – kaikki AI-agenttien ehdottamia ja käyttäjän hyväksynnällä sovellettavia.

Takaisinkirjoitusputki

  1. Agentti määrittää muokkaustoiminnon (mitkä solut, mitkä arvot)
  2. Muokkausesikatselu näytetään käyttäjälle eroavaisuudet korostaen (vanhat vs. uudet arvot)
  3. Käyttäjä hyväksyy tai muokkaa ehdotettuja muutoksia
  4. Backend soveltaa muutokset tiedostoon käyttäen kullekin formaatille sopivia kirjastoja
  5. Muokattu tiedosto tallennetaan uutena versiona muokkausjäljen kanssa
  6. Vektori-indeksi päivitetään muutetuille riveille

Versiohallinta

  • Jokainen muokkaus luo uuden tiedostoversion (alkuperäinen säilytetään)
  • Erovertailuloki näyttää tarkalleen, mitä muuttui, milloin ja miksi
  • Palaa mihin tahansa edelliseen versioon yhdellä napsautuksella
  • Muokkausten attribuutio: mikä agentti tai käyttäjä teki kunkin muutoksen

Uusien dokumenttien käsittelyputki

Tiedoston latausvirta

  1. Käyttäjä lataa tiedostoja (drag-and-drop tai API)
  2. Tiedostotyyppi tunnistetaan ja reititetään sopivalle käsittelijälle
  3. Taulukot: Jäsennetty, skeema päätelty, rivit upotettu ja indeksoitu
  4. PDF:t: OCR (jos skannattu) → asettelun poiminta → pilkkominen → upotus → indeksointi
  5. Word-dokumentit: Tekstin poiminta → osioiden jäsennyksellä → pilkkominen → upotus → indeksointi
  6. Entiteettien poiminta: NER tunnistaa henkilöt, organisaatiot, päivämäärät, summat kaikista dokumenteista
  7. Dokumenttienvälinen linkitys: Entiteetti-indeksi päivitetään uusilla maininnoilla
  8. Tiedoston metadata tallennetaan PostgreSQL:ään, upotukset vektoritietokantaan, alkuperäiset S3:een

Tuetut formaatit

Alusta tukee Exceliä, CSV:tä ja Google Sheetsiä (täydellä takaisinkirjoituksella), natiiveja ja skannattuja PDF:iä (vain luku) sekä Word-dokumentteja ja Google Docsia (rajallisella takaisinkirjoituksella).

Tärkeimmät ominaisuudet

  1. Moniagenttiarkkitehtuuri — Erikoistuneita agentteja taulukoille, dokumenteille ja ristiviittaukselle
  2. AI-orkestraattori — Hajottaa monimutkaiset kyselyt monivaiheisiksi suoritussuunnitelmiksi
  3. Dokumenttienvälinen viittaus — Entiteettien linkitys ja datan täsmäytys tiedostotyyppien välillä
  4. Vektoripohjainen haku — Semanttinen haku käsittelee tietokokonaisuuksia LLM-kontekstirajojen ulkopuolella
  5. Taulukon takaisinkirjoitus — AI muokkaa soluja, täyttää sarakkeita ja syöttää kaavoja käyttäjän hyväksynnällä
  6. Suurten tietokokonaisuuksien tuki — Yli 50 000 rivin taulukot indeksoitu ja kyseltävissä vektorihakun kautta
  7. Versiohallinta — Jokainen muokkaus versioitu erovertailulokilla ja palautusominaisuudella
  8. Luonnollisen kielen kyselyt — Esitä monimutkaisia analyyttisiä kysymyksiä selkeällä englannilla
  9. Monimuototuki — Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. Muokkausesikatselu — Eroja korostava esikatselu ennen muutosten soveltamista

Tulokset

Kyselynopeus: Dokumenttienvälisiin kysymyksiin vastattiin 10-30 sekunnissa verrattuna tuntien manuaaliseen etsintään
Datan mittakaava: Käsitteli yli 500 dokumenttia ja taulukkoa, joissa oli yli 2 miljoonaa indeksoitua riviä yhteensä
Muokkaustarkkuus: AI:n ehdottamat taulukkomuokkaukset hyväksyttiin sellaisenaan 85 % ajasta

Teknologiapino

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCR

caseStudyDetail.more Tapaustutkimukset

Tutustu lisää teknisiin toteutuksiimme

Document Intelligence

Paikallinen RAG-dokumenttijärjestelmä hybridihauilla ja monimuototuella

Kehittäjätyökaluja rakentava tiimi tarvitsi täysin paikallisen, yksityisyyden säilyttävän dokumenttitiedustelujärjestelmän, joka kykenisi vastaanottamaan useita tiedostomuotoja, rakentamaan haettavissa olevia tietopohjia ja vastaamaan luonnollisen kielen kyselyihin hyödyntäen Retrieval-Augmented Generation (RAG) -menetelmää — lähettämättä mitään tietoja ulkoisille API:ille.

Lue Tapaustutkimus
AI Accounting

AI-pohjainen laskujen käsittely OCR:n ja QuickBooks-integraation avulla

Keskisuuri yritys, joka käsitteli satoja toimittajalaskuja kuukausittain, halusi poistaa manuaalisen tiedonsyötön poimimalla laskutiedot automaattisesti AI/OCR:n avulla ja synkronoimalla ne suoraan QuickBooks-järjestelmään kirjanpitoa ja maksujen seurantaa varten.

Valmis Muuttamaan Liiketoimintaasi?

Keskustellaan siitä, miten voimme soveltaa vastaavia ratkaisuja haasteisiisi.

Ota YhteyttäcaseStudyDetail.viewAllCaseStudies
Ristiviittaus: Entiteettien täsmäytys linkitti dataa dokumenttien välillä 92 % tarkkuudella
Haun tarkkuus: Vektorihaku palautti relevantit palat viiden parhaan tuloksen joukkoon 94 % ajasta
Aikasäästöt: Vähensi monidokumenttianalyysin työnkulkuja tunneista minuutteihin
Document Processing Libraries
Lue Tapaustutkimus
Video Encoding

Asiakaspuolen mainosten upotus (CSAI) SCTE-35-merkkien jäsennyksellä ja monialustaisen soittimen integroinnilla

Videoiden suoratoistoalustan piti toteuttaa Client-Side Ad Insertion (CSAI) verkko-, mobiili- ja Connected TV -sovellusten yli — mahdollistaen personoidut, laitekohtaiset mainoskokemukset täydellä mainosinteraktion tuella (klikkaavat peittokuvat, kumppanibannerit, ohituspainikkeet), joita server-side insertion ei voi tarjota.

Lue Tapaustutkimus

Usein kysytyt kysymykset

MicrocosmWorks suunnitteli moniaagenttisen arkkitehtuurin, jossa erikoistuneet agentit käsittelevät asiakirja-analyysin eri osa-alueita, kuten taulukonpoistoagentti taulukkolaskentaohjelmille, tekstin tiivistämisagentti narratiivisille asiakirjoille ja ristiviittausagentti, joka tunnistaa suhteita datakohtien välillä useiden tiedostojen poikki. Tämä työnjako tuottaa tarkempia tuloksia kuin yhden monoliittisen LLM-kutsun, koska jokainen agentti toimii rajatussa konteksti-ikkunassa ja soveltaa toimialakohtaisia kehotusstrategioita.

Kyllä, MicrocosmWorks rakensi taulukkolaskennan jäsennysmoottorin, joka selvittää kaavariippuvuuksia, laajentaa pivot-taulukoiden yhteenvetoja ja jäljittää arkkien välisiä viittauksia ennen kuin välittää jäsenneltyä dataa analyysiagenteille. Järjestelmä muuntaa monimutkaiset Excel-rakenteet tasoitetuiksi dataesityksiksi, joita LLM:t voivat tehokkaasti käsitellä, ja säilyttää relaation kontekstin arkkien välillä, jotta AI voi vastata kysymyksiin kuten 'mikä osasto ylitti Q3-budjettinsa', jotka edellyttävät datan yhdistämistä useilta välilehdiltä.

MicrocosmWorks toteutti entiteettien yhdistämisputken, joka poimii nimettyjä entiteettejä, numeerisia tunnisteita ja päivämääräviittauksia kaikista ladatuista asiakirjoista ja rakentaa sitten tietograafin, joka yhdistää toisiinsa liittyvät maininnat tiedostojen välillä. Kun käyttäjä esittää kysymyksen, ristiinviittausagentti kulkee tätä graafia pitkin poimiakseen relevanttia tietoa useista lähdeasiakirjoista, tarjoten vastauksia, jotka syntetisoivat tietoa tavoilla, jotka veisivät ihmisanalyytikolta tunteja manuaalista ristiintarkistusta.

MicrocosmWorks suunnitteli järjestelmän käsittelemään dokumenttieriä, joissa on enintään 500 tiedostoa analyysikertaa kohden, yksittäisten tiedostojen koon ollessa enintään 100MB laskentataulukoille ja 50MB PDF-tiedostoille. Suuret dokumentit pilkotaan automaattisesti osiin ja käsitellään rinnakkain useissa agentti-instansseissa, ja orkestraattori ylläpitää yhtenäistä näkymää koko dokumenttijoukosta yhdistämällä agenttien tuotokset yhtenäiseksi tiedon esitysmuodoksi.

MicrocosmWorks kehittää moniagenttisia dokumenttianalyysialustoja hintaan $30-$50/tunti, ja tuotantovalmis järjestelmä vaatii tyypillisesti 3-5 kuukautta kehitystyötä sisältäen dokumenttien jäsentelyn, agenttien orkestroinnin, ristiviittausten tunnistuksen ja käyttäjälle suunnatun kyselykäyttöliittymän. Kyselykohtainen kustannus tuotannossa riippuu dokumenttien määrästä ja LLM-tokenien käytöstä, mutta moniagenttiset arkkitehtuurit todellisuudessa vähentävät LLM-kustannuksia reitittämällä vain relevantin kontekstin kullekin agentille sen sijaan, että tungetaan kokonaisia dokumenttikokoelmia yhteen kehotteeseen.