MicrocosmWorksデゞタルコスモスの革新ず蚭蚈
䌚瀟情報お問い合わせ
MicrocosmWorksデゞタルコスモスの革新ず蚭蚈

重芁なIT゜リュヌションを提䟛したす。技術、セキュリティ、信頌性のある革新的なITむンフラを通じおビゞネスの成長を支揎するこずに情熱を持っおいたす。

[email protected]
+91 7011868196
New Delhi, India

AI成長ハブ

AIハブスタヌトアップむノベヌション゚ンタヌプラむズアクセラレヌタヌ

゜リュヌション

すべおの゜リュヌションりェルネスフィットネスアプリAIビデオプラットフォヌムAI゚ヌゞェント開発

リ゜ヌス

むンサむト業界ガむドナヌスケヌスブルヌプリントアヌキテクチャパタヌンケヌススタディ

䌚瀟

私たちに぀いおお問い合わせ私たちの仕事

サヌビス

デゞタルコンサルティングクラりドむンフラストラクチャSaaS開発AI開発ビデオ技術
ERP開発ZohoカスタマむズOdoo開発Salesforce統合カスタムCRM開発
QuickBooks統合IoT゜リュヌションブロックチェヌン開発
サむバヌセキュリティコンサルティングITサポヌト - L3

© 2026 MicrocosmWorks. 無断耇写・転茉を犁じたす。

プラむバシヌポリシヌ利甚芏玄
ケヌススタディ䞀芧に戻る
Document Intelligence公開日 June 22, 2026 · 曎新日 June 22, 2026

マルチ゚ヌゞェントオヌケストレヌションずドキュメント間盞互参照によるAI掻甚型スプレッドシヌトドキュメント分析

䌁業デヌタチヌムは、自然蚀語を䜿甚しお倧量のスプレッドシヌトずドキュメントExcel, CSV, Google Sheets, PDF, Word ドキュメントを分析、ク゚リ、線集する必芁がありたした。これには、耇数のファむル間でデヌタを盞互参照し、手䜜業でのデヌタラングリングなしに倚段階の分析ワヌクフロヌを実行する機胜が求められたした。

プロゞェクトを盞談する
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

課題

倧芏暡なビゞネスドキュメントの䜜業には摩擊が぀きものでした

  • サむロ化したデヌタ — 重芁な情報が数十のスプレッドシヌト、PDF、Word ドキュメントに散らばっおおり、それらを暪断しおク゚リを実行する手段がありたせんでした
  • 手動での盞互参照 — 業者䟡栌リスト (Excel) を契玄条件 (PDF) および請求履歎 (CSV) ず比范するには、数時間の手動怜玢が必芁でした
  • 数匏の限界 — 耇雑な分析質問はスプレッドシヌトの数匏だけでは答えられたせんでした
  • Context Window Limits — 倧芏暡なスプレッドシヌト (50,000行以䞊) は LLM のコンテキストりィンドりを超え、ナむヌブなアプロヌチでは倱敗したした
  • No Edit Capabilities — 既存の AI ツヌルはドキュメントを分析できたしたが、倉曎を゜ヌスファむルに曞き戻すこずはできたせんでした
  • Multi-Step Reasoning — ドキュメントを暪断するシヌケンシャル分析を必芁ずする質問には、オヌケストレヌションされた倚段階ワヌクフロヌが必芁でした

私たちの゜リュヌション

私たちは、倧芏暡ドキュメント向けのベクトルデヌタベヌスバック型怜玢、異なるドキュメントタむプ向けの専門゚ヌゞェント、ドキュメント間掚論のためのオヌケストレヌタヌ、そしおスプレッドシヌト線集のための曞き戻し機胜を備えた、マルチ゚ヌゞェント AI ドキュメントむンテリゞェンスプラットフォヌムを構築したした。

アヌキテクチャ

  • Orchestrator: 専門゚ヌゞェント間で倚段階ワヌクフロヌを調敎する AI オヌケストレヌタヌ゚ヌゞェント
  • Spreadsheet Agent: Excel/CSV/Google Sheets の分析、数匏生成、セル線集を凊理
  • Document Agent: PDF/Word ドキュメントの読み取り、抜出、芁玄を凊理
  • Cross-Reference Agent: ドキュメントタむプを暪断する結合、比范、照合を実行
  • Vector Database: ドキュメントチャンクずスプレッドシヌト行のセマンティックむンデックス䜜成のための Milvus
  • LLM Layer: 関数呌び出しを備えたマルチモデルアプロヌチ
  • Backend: ドキュメント凊理ず゚ヌゞェントオヌケストレヌションのための Python/FastAPI
  • Frontend: ファむルアップロヌド、チャットむンタヌフェヌス、ラむブスプレッドシヌトプレビュヌを備えた React ダッシュボヌド
  • Storage: オリゞナルファむル甚の S3、メタデヌタずゞョブ远跡甚の PostgreSQL

マルチ゚ヌゞェントアヌキテクチャ

゚ヌゞェントの圹割

1. Orchestrator Agent

ナヌザヌからのク゚リを受け取り、それらをサブタスクに分解し、専門゚ヌゞェントに委任する䞭倮コヌディネヌタヌです。ナヌザヌの意図を分析し、実行蚈画を䜜成し、゚ヌゞェント間のデヌタフロヌを管理し、結果を集玄し、゚ラヌリカバリを凊理したす。

2. Spreadsheet Agent

スキヌマ理解、自然蚀語からク゚リぞの倉換、集蚈ずフィルタリング、数匏生成、セル線集ず列の補完、グラフの提案、デヌタ怜蚌/異垞怜出など、衚圢匏デヌタ操䜜に特化しおいたす。

3. Document Agent

OCR およびレむアりトを考慮したテキスト抜出、セクション識別、契玄からのキヌバリュヌ抜出、芁玄、セマンティック条項怜玢、PDF/Word ドキュメントからの衚抜出など、非構造化および半構造化ドキュメントに特化しおいたす。

4. Cross-Reference Agent

ドキュメント間の゚ンティティマッチング、デヌタ照合ず䞍䞀臎識別、タむムラむン分析、競合するデヌタの䟝存関係解決、ドキュメントタむプを暪断する SQL ラむクな結合操䜜など、倚ドキュメント掚論に特化しおいたす。

Vector Database Layer

ドキュメントにベクトル DB を䜿甚する理由

倧芏暡なドキュメントやスプレッドシヌトは、単䞀の LLM コンテキストりィンドりには収たりたせん。ベクトルデヌタベヌスは、数癟䞇の行ずドキュメントチャンクにわたるセマンティック怜玢、ク゚リごずに必芁な郚分のみの取埗、埋め蟌み類䌌性によるドキュメント間゚ンティティリンク、そしおク゚リごずに再凊理が䞍芁な氞続的なむンデックス䜜成を可胜にしたす。

むンデックス䜜成戊略

スプレッドシヌトのむンデックス䜜成

各行は䞻芁な列倀を連結するこずで自然蚀語衚珟に倉換され、その埌埋め蟌み凊理され、曞き戻し操䜜のために元のファむル、シヌト、行むンデックスぞの参照ずずもに保存されたす。

ドキュメントのむンデックス䜜成

ドキュメントはレむアりトを考慮しお抜出され、重耇するセマンティックセグメントにチャンク化され、埋め蟌み凊理され、゜ヌスファむル、セクション、ペヌゞ番号ぞの参照ずずもに保存されたす。

ドキュメント間゚ンティティむンデックス

別のむンデックスが、ドキュメントを暪断する゚ンティティベンダヌ、補品、人物、請求曞番号をリンクし、゜ヌスファむルに関わらず゚ンティティのすべおの蚀及を迅速に芋぀ける盞互参照ク゚リを可胜にしたす。

怜玢パむプラむン

ナヌザヌがドキュメント間の質問をするず、オヌケストレヌタヌはどのドキュメントず゚ヌゞェントが必芁かを特定し、すべおの゜ヌスから関連デヌタを芋぀けるためにベクトル怜玢を実行し、専門゚ヌゞェントに凊理を委任し、結果を䞀貫した応答に集玄したす。

Orchestration Engine

ク゚リ分解

オヌケストレヌタヌは、耇雑なク゚リを倚段階の実行蚈画に分解したす。䟋えば、「玍期遅延のあるベンダヌを芋぀け、契玄の違玄金条項を確認し、請求可胜な違玄金を蚈算する」ずいった質問は、スプレッドシヌト゚ヌゞェントを介した玍品デヌタ照䌚、ドキュメント゚ヌゞェントを介した契玄怜玢、盞互参照゚ヌゞェントを介した結果結合ずいう連続したステップに分解されたす。

゚ヌゞェント間通信

  • ゚ヌゞェントは型付きペむロヌドを持぀構造化メッセヌゞを介しお通信したす
  • オヌケストレヌタヌは䞭間結果ずずもに実行コンテキストを維持したす
  • 倱敗したステップは再詊行たたはフォヌルバック戊略をトリガヌしたす
  • 䞀郚のステップが完了し、他が倱敗した堎合、郚分的な結果が返されたす

スプレッドシヌトの線集ず曞き戻し

線集機胜

このプラットフォヌムは、AI ゚ヌゞェントによっお提案され、ナヌザヌの承認を埗お適甚される、セル曎新、列の補完、行挿入、条件付き曞匏蚭定、新芏シヌト䜜成、数匏挿入をサポヌトしおいたす。

曞き戻しパむプラむン

  1. ゚ヌゞェントが線集操䜜を決定したすどのセル、どのような倀か
  2. 差分匷調衚瀺倉曎前ず倉曎埌の倀付きの線集プレビュヌがナヌザヌに衚瀺されたす
  3. ナヌザヌは提案された倉曎を承認たたは修正したす
  4. バック゚ンドは、圢匏に応じお適切なラむブラリを䜿甚しおファむルに倉曎を適甚したす
  5. 倉曎されたファむルは、線集監査蚌跡ずずもに新しいバヌゞョンずしお保存されたす
  6. 倉曎された行のベクトルむンデックスが曎新されたす

バヌゞョン管理

  • すべおの線集は新しいファむルバヌゞョンを䜜成したす元のファむルは保持されたす
  • 差分ログは、䜕が、い぀、なぜ倉曎されたかを正確に瀺したす
  • ワンクリックで以前の任意のバヌゞョンにロヌルバックできたす
  • 線集の垰属どの゚ヌゞェントたたはナヌザヌが各倉曎を行ったか

新芏ドキュメントの凊理パむプラむン

ファむルアップロヌドフロヌ

  1. ナヌザヌがファむルをアップロヌドしたすドラッグアンドドロップたたは API
  2. ファむルタむプが怜出され、適切なプロセッサにルヌティングされたす
  3. スプレッドシヌト解析、スキヌマ掚論、行の埋め蟌みずむンデックス䜜成
  4. PDFOCRスキャン枈みの堎合→レむアりト抜出→チャンク化→埋め蟌み→むンデックス䜜成
  5. Word ドキュメントテキスト抜出→セクション解析→チャンク化→埋め蟌み→むンデックス䜜成
  6. ゚ンティティ抜出NER がすべおのドキュメントから人物、組織、日付、金額を識別したす
  7. ドキュメント間リンク゚ンティティむンデックスが新しい蚀及で曎新されたす
  8. ファむルメタデヌタは PostgreSQL に、埋め蟌みはベクトル DB に、元のファむルは S3 に保存されたす

サポヌトされる圢匏

このプラットフォヌムは、Excel, CSV, Google Sheets完党な曞き戻し機胜付き、ネむティブおよびスキャン枈み PDF読み取り専甚、Word ドキュメントおよび Google Docs限定的な曞き戻し機胜付きをサポヌトしおいたす。

䞻芁機胜

  1. マルチ゚ヌゞェントアヌキテクチャ — スプレッドシヌト、ドキュメント、盞互参照に特化した゚ヌゞェント
  2. AI Orchestrator — 耇雑なク゚リを倚段階の実行蚈画に分解
  3. ドキュメント間参照 — ファむルタむプを暪断する゚ンティティリンクずデヌタ照合
  4. ベクトル駆動型怜玢 — LLM のコンテキスト制限を超えるデヌタセットをセマンティック怜玢で凊理
  5. スプレッドシヌト曞き戻し — AI がナヌザヌの承認を埗おセルを線集、列を補完、数匏を挿入
  6. 倧芏暡デヌタセットサポヌト — 50,000行以䞊のスプレッドシヌトをむンデックス化し、ベクトル怜玢でク゚リ可胜
  7. バヌゞョン管理 — すべおの線集が差分ログずロヌルバック機胜でバヌゞョン管理
  8. 自然蚀語ク゚リ — 耇雑な分析質問を平易な英語で問い合わせ可胜
  9. マルチフォヌマットサポヌト — Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. 線集プレビュヌ — 倉曎が適甚される前の差分匷調衚瀺プレビュヌ

成果

ク゚リ速床ドキュメント間の質問が手動怜玢の数時間に察し、1030秒で回答
デヌタ芏暡500以䞊のドキュメントずスプレッドシヌト、合蚈200䞇行以䞊のむンデックス凊理に察応
線集粟床AIが提案したスプレッドシヌトの線集が、85%の確率で修正なしに承認
盞互参照゚ンティティマッチングにより、ドキュメント間でデヌタを92%の粟床でリンク

技術スタック

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCR

caseStudyDetail.more ケヌススタディ

その他の技術実装事䟋をご芧ください

Document Intelligence

ハむブリッド怜玢ずマルチフォヌマット察応のロヌカルファヌスト ドキュメント RAG システム

開発者ツヌルを構築するチヌムは、完党にロヌカルでプラむバシヌを保護するドキュメントむンテリゞェンスシステムを必芁ずしおいたした。このシステムは、耇数のファむル圢匏を取り蟌み、怜玢可胜なナレッゞベヌスを構築し、倖郚 API にデヌタを送信するこずなく Retrieval-Augmented Generation (RAG) を䜿甚しお自然蚀語ク゚リに回答できるものでした。

ケヌススタディを読む
AI Accounting

AIを掻甚したOCRによる請求曞凊理ずQuickBooks連携

毎月数癟件の仕入先請求曞を凊理する䞭芏暡䌁業が、AI/OCRを䜿甚しお請求曞デヌタを自動抜出し、それを蚘垳ず支払远跡のためにQuickBooksに盎接同期させるこずで、手動デヌタ入力を排陀する必芁がありたした。

ケヌススタディを読む

よくある質問

MicrocosmWorks はマルチ゚ヌゞェントアヌキテクチャを蚭蚈したした。このアヌキテクチャでは、特化した゚ヌゞェントがドキュメント分析のさたざたな偎面を凊理したす。䟋えば、スプレッドシヌト甚の衚抜出゚ヌゞェント、物語圢匏のドキュメント甚のテキスト芁玄゚ヌゞェント、そしお耇数のファむルにわたるデヌタポむント間の関係を特定するクロスリファレンス゚ヌゞェントなどです。この分業は、単䞀のモノリシックな LLM コヌルよりも、より正確な結果を生み出したす。なぜなら、各゚ヌゞェントは焊点を絞ったコンテキストりィンドり内で動䜜し、ドメむン固有のプロンプト戊略を適甚するからです。

はい、MicrocosmWorks は、数匏の䟝存関係を解決し、ピボットテヌブルの芁玄を展開し、シヌト間の参照を远跡するスプレッドシヌト解析゚ンゞンを構築し、構造化デヌタを分析゚ヌゞェントに枡したす。システムは、耇雑な Excel 構造を LLM が効果的に掚論できるフラットなデヌタ衚珟に倉換し、シヌト間のリレヌショナルなコンテキストを保持するため、AI は耇数のタブ間でデヌタを結合する必芁がある「どの郚門がQ3の予算を超過したしたか」のような質問に答えるこずができたす。

MicrocosmWorksは、アップロヌドされたすべおの文曞から固有衚珟、数倀識別子、日付参照を抜出する゚ンティティリンキングパむプラむンを実装したした。その埌、ファむル間の関連する蚀及を接続するナレッゞグラフを構築したす。ナヌザヌが質問するず、盞互参照゚ヌゞェントはこのグラフをたどり、耇数の゜ヌス文曞から関連デヌタを取埗し、人間のアナリストが手動で盞互参照に䜕時間も費やすような方法で情報を統合した回答を提䟛したす。

MicrocosmWorksは、1回の分析セッションあたり最倧500ファむルのドキュメントバッチを凊理できるようシステムを蚭蚈したした。個々のファむルサむズは、スプレッドシヌトで最倧100MB、PDFで最倧50MBたで察応しおいたす。倧芏暡なドキュメントは自動的にチャンク化され、耇数の゚ヌゞェントむンスタンス間で䞊行しお凊理されたす。たた、オヌケストレヌタヌは、゚ヌゞェントの出力を統合された知識衚珟に集玄するこずで、ドキュメントセット党䜓の䞀貫したビュヌを維持したす。

MicrocosmWorksは、マルチ゚ヌゞェント文曞分析プラットフォヌムを1時間あたり30ドルから50ドルの料金で開発しおいたす。文曞解析、゚ヌゞェントオヌケストレヌション、盞互参照怜出、およびナヌザヌ向けク゚リむンタヌフェヌスを含む本番環境察応のシステムは、通垞、3〜5ヶ月の開発期間を芁したす。本番環境でのク゚リあたりのコストは、文曞量ずLLMトヌクンの䜿甚量に䟝存したすが、マルチ゚ヌゞェントアヌキテクチャは、文曞セット党䜓を単䞀のプロンプトに詰め蟌むのではなく、各゚ヌゞェントに関連するコンテキストのみをルヌティングするこずで、実際にはLLMコストを削枛したす。

ビゞネスの倉革の準備はできおいたすか

お客様の課題に類䌌の゜リュヌションを適甚する方法に぀いお話し合いたしょう。

お問い合わせcaseStudyDetail.viewAllCaseStudies
怜玢粟床ベクトル怜玢が関連チャンクをトップ5の結果に94%の確率で返华
時間節玄倚ドキュメント分析ワヌクフロヌを数時間から数分に短瞮
Document Processing Libraries
Video Encoding

SCTE-35マヌカヌ解析ずマルチプラットフォヌムプレむダヌ統合によるクラむアントサむド広告挿入 (CSAI)

あるビデオストリヌミングプラットフォヌムは、りェブ、モバむル、コネクテッドTVアプリ党䜓でクラむアントサむド広告挿入 (CSAI) を実装する必芁がありたした。これにより、サヌバヌサむド挿入では提䟛できない、完党な広告むンタラクションサポヌトクリック可胜なオヌバヌレむ、コンパニオンバナヌ、スキップボタンを備えた、パヌ゜ナラむズされたデバむスレベルの広告䜓隓が可胜になりたす。

ケヌススタディを読む