MicrocosmWorksNag-iinobasyon at Nagdidisenyo ng Digital Cosmos
Tungkol Sa AminMakipag-ugnayan
MicrocosmWorksNagpapabago at Nagdidisenyo ng Digital Cosmos

Nagbibigay ng mga solusyong IT na mahalaga. Kami ay masigasig sa teknolohiya, seguridad, at pagtulong sa mga negosyo na lumago sa pamamagitan ng maaasahan, makabagong IT infrastructure.

[email protected]
+91 7011868196
New Delhi, India

Sentro ng Paglago ng AI

AI HubInobasyon ng StartupPampabilis ng Negosyo

Mga Solusyon

Lahat ng SolusyonMga Wellness at Fitness AppsAI Video PlatformPag-unlad ng AI Agent

Mga Mapagkukunan

Mga PananawMga Gabay sa IndustriyaMga Plano ng PaggamitMga Pattern ng ArkitekturaMga Pag-aaral ng Kaso

Kumpanya

Tungkol sa AminMakipag-ugnayanAng Aming Gawain

Mga Serbisyo

Digital na PagkonsultaImprastraktura ng CloudPag-unlad ng SaaSPag-unlad ng AITeknolohiya ng Video
Pag-unlad ng ERPPagpapasadya ng ZohoPag-unlad ng OdooPagsasama ng SalesforcePag-unlad ng Custom na CRM
Pagsasama ng QuickBooksMga Solusyon sa IoTPag-unlad ng Blockchain
Pagkonsulta sa CybersecuritySuporta sa IT - L3

ยฉ 2026 MicrocosmWorks. Lahat ng karapatan ay nakalaan.

Patakaran sa PagkapribadoMga Tuntunin ng Serbisyo
Bumalik sa mga Case Study
Document IntelligenceNa-publish June 22, 2026 ยท Na-update June 22, 2026

Pagsusuri ng Spreadsheet at Dokumento na Pinapagana ng AI na may Multi-Agent Orchestration at Cross-Document Reference

Kinailangan ng isang data team ng enterprise na magsuri, mag-query, at mag-edit ng malalaking koleksyon ng spreadsheets at mga dokumento (Excel, CSV, Google Sheets, PDFs, Word docs) gamit ang natural na wika โ€” na may kakayahang mag-cross-reference ng data sa maraming file at magsagawa ng multi-step analytical workflows nang walang manual na data wrangling.

Pag-usapan ang Iyong Proyekto
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

Ang Hamon

Ang pagtatrabaho sa mga dokumento ng negosyo sa malaking sukat ay puno ng hamon:

  • Nakahiwalay na Data โ€” Ang kritikal na impormasyon ay nakakalat sa dose-dosenang spreadsheets, PDFs, at Word documents nang walang paraan upang mag-query sa mga ito
  • Manual na Pag-cross-reference โ€” Ang paghahambing ng listahan ng presyo ng vendor (Excel) sa mga tuntunin ng kontrata (PDF) sa kasaysayan ng invoice (CSV) ay nangailangan ng oras ng manual na paghahanap
  • Limitasyon sa Formula โ€” Hindi masagot ang mga kumplikadong katanungang analitikal gamit lamang ang mga formula sa spreadsheet
  • Mga Limitasyon sa Context Window โ€” Ang malalaking spreadsheets (50,000+ rows) ay lumampas sa LLM context windows, na nagiging sanhi ng pagkabigo ng mga simpleng diskarte
  • Walang Kakayahang Mag-edit โ€” Ang mga kasalukuyang tool ng AI ay kayang suriin ang mga dokumento ngunit hindi kayang ibalik ang mga pagbabago sa mga source file
  • Multi-Step na Pagdadahilan โ€” Ang mga katanungan na nangangailangan ng sequential analysis sa mga dokumento ay nangailangan ng orchestrated multi-step workflows

Ang Aming Solusyon

Bumuo kami ng isang multi-agent AI document intelligence platform na may retrieval na suportado ng vector database para sa malalaking dokumento, mga espesyal na agent para sa iba't ibang uri ng dokumento, isang orchestrator para sa cross-document reasoning, at mga kakayahang mag-write-back para sa pag-edit ng spreadsheet.

Arkitektura

  • Orchestrator: AI orchestrator agent na nagko-coordinate ng multi-step workflows sa mga espesyal na agent
  • Spreadsheet Agent: Nangangasiwa sa pagsusuri ng Excel/CSV/Google Sheets, pagbuo ng formula, at pag-edit ng cell
  • Document Agent: Nangangasiwa sa pagbabasa, pagkuha, at pagbubuod ng PDF/Word document
  • Cross-Reference Agent: Nagsasagawa ng joins, paghahambing, at pagrereconcile sa iba't ibang uri ng dokumento
  • Vector Database: Milvus para sa semantic indexing ng document chunks at spreadsheet rows
  • LLM Layer: Multi-model approach na may function calling
  • Backend: Python/FastAPI para sa pagproseso ng dokumento at agent orchestration
  • Frontend: React dashboard na may pag-upload ng file, chat interface, at live spreadsheet preview
  • Storage: S3 para sa orihinal na file, PostgreSQL para sa metadata at job tracking

Arkitekturang Multi-Agent

Mga Tungkulin ng Agent

1. Orchestrator Agent

Ang sentral na coordinator na tumatanggap ng mga query ng user, nagde-decompose sa mga ito sa sub-tasks, at nagdedelega sa mga espesyal na agent. Sinusuri nito ang layunin ng user, lumilikha ng mga execution plan, namamahala sa data flow sa pagitan ng mga agent, nag-a-aggregate ng mga resulta, at nangangasiwa sa pagbawi ng error.

2. Spreadsheet Agent

Espesyal para sa mga operasyon ng tabular data kabilang ang pag-unawa sa schema, natural language to query translation, aggregations at filtering, pagbuo ng formula, pag-edit ng cell at pagpuno ng column, mga mungkahi sa chart, at data validation/anomaly detection.

3. Document Agent

Espesyal para sa unstructured at semi-structured na mga dokumento kabilang ang OCR at layout-aware text extraction, pagtukoy ng seksyon, key-value extraction mula sa mga kontrata, summarization, semantic clause search, at table extraction mula sa PDFs/Word docs.

4. Cross-Reference Agent

Espesyal para sa multi-document reasoning kabilang ang entity matching sa mga dokumento, data reconciliation at discrepancy identification, timeline analysis, dependency resolution para sa conflicting data, at SQL-like join operations sa iba't ibang uri ng dokumento.

Layer ng Vector Database

Bakit Vector DB para sa mga Dokumento

Ang malalaking dokumento at spreadsheets ay hindi kasya sa isang LLM context window. Nagbibigay-daan ang vector database sa semantic search sa milyun-milyong rows at document chunks, retrieval ng mga relevant na bahagi lamang sa bawat query, cross-document entity linking sa pamamagitan ng embedding similarity, at persistent indexing na hindi nangangailangan ng muling pagproseso sa bawat query.

Estratehiya sa Pag-index

Pag-index ng Spreadsheet:

Ang bawat row ay kino-convert sa natural language representation sa pamamagitan ng pagdudugtong ng mga key column values, pagkatapos ay ine-embed at iniimbak na may mga reference pabalik sa orihinal na file, sheet, at row index para sa mga write-back operation.

Pag-index ng Dokumento:

Ang mga dokumento ay kino-extract na may layout awareness, hinahati sa semantic segments na may overlap, ine-embed, at iniimbak na may mga reference sa source file, seksyon, at numero ng pahina.

Cross-Document Entity Index:

Isang hiwalay na index ang nagli-link ng mga entity (vendors, products, people, invoice numbers) sa mga dokumento, na nagbibigay-daan sa mga cross-reference query upang mabilis na mahanap ang lahat ng pagbanggit ng isang entity anuman ang source file.

Retrieval Pipeline

Kapag ang isang user ay nagtanong ng cross-document question, tinutukoy ng orchestrator kung aling mga dokumento at agent ang kailangan, nagsasagawa ng vector searches upang mahanap ang relevant na data sa lahat ng pinagmulan, nagdedelega sa mga espesyal na agent para sa pagproseso, at nag-a-aggregate ng mga resulta sa isang coherent na tugon.

Orchestration Engine

Query Decomposition

Hinahati ng orchestrator ang mga kumplikadong query sa multi-step execution plans. Halimbawa, ang isang tanong tulad ng "Maghanap ng mga vendor na may late na delivery, tingnan ang mga penalty clause sa kontrata, at kalkulahin ang mga claimable penalty" ay ide-decompose sa magkakasunod na hakbang: pag-query ng delivery data sa pamamagitan ng Spreadsheet Agent, paghahanap ng mga kontrata sa pamamagitan ng Document Agent, at pagsasama ng mga resulta sa pamamagitan ng Cross-Reference Agent.

Komunikasyon ng Agent

  • Ang mga agent ay nakikipag-ugnayan sa pamamagitan ng structured messages na may typed payloads
  • Pinapanatili ng orchestrator ang execution context na may intermediate results
  • Ang mga nabigong hakbang ay nagti-trigger ng retry o fallback strategies
  • Ang mga partial na resulta ay ibinabalik kung ang ilang hakbang ay nakumpleto ngunit ang iba ay nabigo

Pag-edit at Write-Back ng Spreadsheet

Mga Kakayahan sa Pag-edit

Sinuportahan ng platform ang mga update ng cell, pagpuno ng column, pagpasok ng row, conditional formatting, paglikha ng bagong sheet, at formula injection โ€” lahat ay iminungkahi ng mga AI agent at inilapat sa pag-apruba ng user.

Write-Back Pipeline

  1. Tinutukoy ng agent ang operasyon ng pag-edit (aling mga cell, anong mga value)
  2. Ipinapakita ang preview ng pag-edit sa user na may diff highlighting (lumang vs. bagong value)
  3. Inaprubahan o binago ng user ang mga iminungkahing pagbabago
  4. Inilapat ng Backend ang mga pagbabago sa file gamit ang mga angkop na library bawat format
  5. Ang binagong file ay nai-save bilang isang bagong bersyon na may edit audit trail
  6. Na-update ang vector index para sa mga nabagong row

Pagkontrol ng Bersyon

  • Ang bawat pag-edit ay lumilikha ng bagong bersyon ng file (naipreserba ang orihinal)
  • Ipinapakita ng Diff log kung ano mismo ang nabago, kailan, at bakit
  • Ibalik sa anumang nakaraang bersyon sa isang click
  • Pagpapatungkol ng pag-edit: aling agent o user ang gumawa ng bawat pagbabago

Processing Pipeline para sa mga Bagong Dokumento

Daloy ng Pag-upload ng File

  1. Nag-a-upload ang user ng mga file (drag-and-drop o API)
  2. Natutukoy ang uri ng file at iruruta sa naaangkop na processor
  3. Spreadsheets: Pinoproseso, schema inferred, rows embedded at indexed
  4. PDFs: OCR (kung scanned) โ†’ layout extraction โ†’ chunking โ†’ embedding โ†’ indexing
  5. Word Docs: Text extraction โ†’ section parsing โ†’ chunking โ†’ embedding โ†’ indexing
  6. Entity Extraction: Kinikilala ng NER ang mga tao, organisasyon, petsa, halaga sa lahat ng doc
  7. Cross-Document Linking: Na-update ang Entity index na may mga bagong pagbanggit
  8. Ang metadata ng file ay iniimbak sa PostgreSQL, mga embedding sa vector DB, mga orihinal sa S3

Mga Suportadong Format

Sinuportahan ng platform ang Excel, CSV, at Google Sheets (na may full write-back), native at scanned PDFs (read-only), at Word docs at Google Docs (limited write-back).

Mga Pangunahing Tampok

  1. Arkitekturang Multi-Agent โ€” Mga espesyal na agent para sa spreadsheets, dokumento, at cross-referencing
  2. AI Orchestrator โ€” Nagde-decompose ng mga kumplikadong query sa multi-step execution plans
  3. Cross-Document Reference โ€” Pagli-link ng entity at data reconciliation sa iba't ibang uri ng file
  4. Vector-Powered Retrieval โ€” Nangangasiwa ang semantic search sa mga dataset na lampas sa LLM context limits
  5. Spreadsheet Write-Back โ€” Ini-edit ng AI ang mga cell, pinupuno ang mga column, at nag-i-inject ng mga formula sa pag-apruba ng user
  6. Suporta para sa Malalaking Dataset โ€” 50,000+ row spreadsheets na nai-index at queryable sa pamamagitan ng vector search
  7. Pagkontrol ng Bersyon โ€” Ang bawat pag-edit ay may bersyon na may diff log at kakayahang mag-rollback
  8. Natural Language Queries โ€” Magtanong ng mga kumplikadong analitikal na tanong sa simpleng Ingles
  9. Suporta sa Multi-Format โ€” Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. Preview ng Pag-edit โ€” Diff-highlighted na preview bago ilapat ang anumang pagbabago

Mga Resulta

Bilis ng Query: Ang mga tanong na cross-document ay nasagot sa loob ng 10-30 segundo kumpara sa oras ng manual na paghahanap
Saklaw ng Data: Nangasiwa ng 500+ dokumento at spreadsheets na may 2M+ kabuuang rows na nai-index
Katumpakan ng Pag-edit: Ang mga pag-edit ng spreadsheet na iminungkahi ng AI ay tinanggap nang walang pagbabago 85% ng oras
Cross-Reference: Ang entity matching ay nagli-link ng data sa mga dokumento na may 92% katumpakan
Katumpakan ng Retrieval: Ang vector search ay nagbalik ng mga relevant na chunk sa top-5 resulta 94% ng oras
Pagtitipid sa Oras: Binawasan ang multi-document analysis workflows mula oras patungo sa minuto

Technology Stack

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCRDocument Processing Libraries

caseStudyDetail.more Mga Case Study

Tuklasin ang higit pa sa aming mga teknikal na implementasyon

Document Intelligence

Lokal-Una na Sistema ng RAG ng Dokumento na may Hybrid Search at Suporta sa Maraming Format

Isang pangkat na bumubuo ng mga tool para sa developer ang nangailangan ng isang ganap na lokal, pang-seguridad sa privacy na sistema ng document intelligence na kayang kumain ng maraming format ng file, bumuo ng mga mahahanap na knowledge base, at sumagot sa mga natural na wika na query gamit ang Retrieval-Augmented Generation (RAG) โ€” nang hindi nagpapadala ng anumang data sa mga external na API.

Basahin ang Case Study
AI Accounting

Pagpoproseso ng Invoice na Pinapagana ng AI gamit ang OCR at Integrasyon ng QuickBooks

Isang katamtamang laking negosyo na nagpoproseso ng daan-daang invoice ng vendor buwan-buwan ang kinailangan alisin ang manu-manong pagpasok ng data sa pamamagitan ng awtomatikong pagkuha ng data ng invoice gamit ang AI/OCR at direktang i-sync ito sa QuickBooks para sa bookkeeping at pagsubaybay sa pagbabayad.

Basahin ang Case Study
Video Encoding

Client-Side Ad Insertion (CSAI) na may pag-parse ng SCTE-35 Marker at Integrasyon ng Multi-Platform Player

Isang platform para sa video streaming ay nangangailangan na magpatupad ng Client-Side Ad Insertion (CSAI) sa mga web, mobile, at connected TV apps โ€” na nagbibigay-daan sa mga personalized, device-level na karanasan sa ad na may buong suporta sa interaksyon ng ad (mga clickable overlay, companion banner, skip button) na hindi kayang ibigay ng server-side insertion.

Basahin ang Case Study

Mga Madalas Itanong

Idinisenyo ng MicrocosmWorks ang isang multi-agent architecture kung saan hinahawakan ng mga specialized agent ang iba't ibang aspeto ng pagsusuri ng dokumento, tulad ng isang table extraction agent para sa mga spreadsheet, isang text summarization agent para sa mga narrative na dokumento, at isang cross-reference agent na tumutukoy sa mga ugnayan sa pagitan ng mga data point sa maraming file. Ang paghahati ng gawain na ito ay nagbibigay ng mas tumpak na resulta kaysa sa isang solong monolithic LLM call dahil ang bawat agent ay gumagana sa loob ng isang nakatutok na context window at naglalapat ng domain-specific prompting strategies.

Oo, binuo ng MicrocosmWorks ang isang spreadsheet parsing engine na nilulutas ang mga dependency ng formula, pinapalawak ang mga buod ng pivot table, at sinusubaybayan ang mga cross-sheet reference bago ipasa ang nakaayos na data sa mga ahente ng pagsusuri. Ikinokonberte ng sistema ang kumplikadong istraktura ng Excel sa mga flattened na representasyon ng data na epektibong mapag-iisipan ng mga LLM, at pinapanatili ang relational na konteksto sa pagitan ng mga sheet upang masagot ng AI ang mga tanong tulad ng 'alin na departamento ang lumampas sa badyet nito sa Q3' na nangangailangan ng pagsasama-sama ng data sa maraming tab.

Ipinatupad ng MicrocosmWorks ang isang pipeline ng entity linking na kumukuha ng mga named entity, numeric identifier, at date reference mula sa lahat ng na-upload na dokumento, pagkatapos ay bumubuo ng isang knowledge graph na nag-uugnay ng mga kaugnay na pagbanggit sa iba't ibang file. Kapag may nagtanong ang isang user, ang cross-reference agent ay dumadaan sa graph na ito upang kumuha ng may-katuturang data mula sa maraming source document, nagbibigay ng mga sagot na nagsasama-sama ng impormasyon sa mga paraan na aabutin ng oras ng isang human analyst sa manual na cross-checking.

Dinisenyo ng MicrocosmWorks ang sistema upang hawakan ang mga batch ng dokumento na hanggang 500 files bawat sesyon ng pagsusuri, na may indibidwal na laki ng file na hanggang 100MB para sa mga spreadsheets at 50MB para sa mga PDFs. Ang malalaking dokumento ay awtomatikong hinahati (chunked) at pinoproseso nang sabay-sabay (in parallel) sa maraming agent instances, at ang orchestrator ay nagpapanatili ng isang magkakaugnay na pananaw ng buong set ng dokumento sa pamamagitan ng pagsasama-sama ng mga agent outputs sa isang pinag-isang knowledge representation.

Ang MicrocosmWorks ay bumubuo ng multi-agent document analysis platforms sa halagang $30-$50 bawat oras, kung saan ang isang production-ready system ay karaniwang nangangailangan ng 3-5 buwan ng pagbuo kasama ang document parsing, agent orchestration, cross-reference detection, at isang user-facing query interface. Ang per-query cost sa production ay nakasalalay sa document volume at LLM token usage, ngunit ang multi-agent architectures ay talagang nakakabawas sa LLM costs sa pamamagitan ng pagruruta lamang ng relevant context sa bawat agent sa halip na isiksik ang buong document sets sa isang prompt.

Handa nang Baguhin ang Iyong Negosyo?

Pag-usapan natin kung paano namin mailalapat ang katulad na mga solusyon sa iyong mga hamon.

Makipag-ugnayancaseStudyDetail.viewAllCaseStudies