Bagaimana orkestrasi multi-agen meningkatkan analisis dokumen dibandingkan dengan mengirimkan semuanya ke satu LLM?

MicrocosmWorks merancang arsitektur multi-agen di mana agen-agen khusus menangani berbagai aspek analisis dokumen, seperti agen ekstraksi tabel untuk lembar kerja, agen peringkasan teks untuk dokumen naratif, dan agen referensi silang yang mengidentifikasi hubungan antar titik data di berbagai file. Pembagian kerja ini menghasilkan hasil yang lebih akurat dibandingkan dengan satu panggilan LLM monolitik karena setiap agen beroperasi dalam jendela konteks yang terfokus dan menerapkan strategi *prompting* spesifik domain.

Bisakah sistem menganalisis spreadsheet dengan formula kompleks, pivot tables, dan beberapa sheet yang terhubung?

Ya, MicrocosmWorks membangun sebuah spreadsheet parsing engine yang menyelesaikan formula dependencies, mengembangkan pivot table summaries, dan melacak cross-sheet references sebelum meneruskan structured data ke analysis agents. Sistem ini mengubah Excel constructs yang kompleks menjadi flattened data representations yang dapat dipertimbangkan secara efektif oleh LLM, dan mempertahankan relational context antar sheet sehingga AI dapat menjawab pertanyaan seperti 'departemen mana yang melebihi anggaran Q3-nya' yang memerlukan joining data di beberapa tab.

Bagaimana cara kerja deteksi referensi lintas dokumen saat menganalisis campuran dokumen PDF, spreadsheet, dan Word?

MicrocosmWorks mengimplementasikan pipeline entity linking yang mengekstrak entitas bernama, pengidentifikasi numerik, dan referensi tanggal dari semua dokumen yang diunggah, kemudian membangun sebuah knowledge graph yang menghubungkan penyebutan terkait di seluruh file. Ketika pengguna mengajukan pertanyaan, agen referensi silang melintasi graph ini untuk menarik data yang relevan dari beberapa dokumen sumber, memberikan jawaban yang mensintesis informasi dengan cara yang akan memakan waktu berjam-jam bagi seorang analis manusia untuk melakukan pemeriksaan silang secara manual.

Batasan ukuran file dan volume dokumen apa yang didukung oleh sistem analisis multi-agen?

MicrocosmWorks merancang sistem ini untuk menangani batch dokumen hingga 500 file per sesi analisis, dengan ukuran file individual hingga 100MB untuk spreadsheet dan 50MB untuk PDF. Dokumen berukuran besar secara otomatis dipecah (chunked) dan diproses secara paralel di seluruh beberapa instans agen, dan orchestrator mempertahankan pandangan yang koheren dari seluruh kumpulan dokumen dengan mengagregasi output agen menjadi representasi pengetahuan yang terpadu.

Berapa biayanya untuk membangun platform analisis dokumen multi-agen kustom?

MicrocosmWorks mengembangkan platform analisis dokumen multi-agen dengan tarif $30-$50/jam, dengan sistem siap produksi biasanya membutuhkan 3-5 bulan pengembangan termasuk parsing dokumen, orkestrasi agen, deteksi referensi silang, dan antarmuka kueri yang menghadap pengguna. Biaya per kueri dalam produksi bergantung pada volume dokumen dan penggunaan token LLM, tetapi arsitektur multi-agen sebenarnya mengurangi biaya LLM dengan mengarahkan hanya konteks yang relevan ke setiap agen daripada memasukkan seluruh set dokumen ke dalam satu prompt.

AI-Powered Spreadsheet & Document Analysis with Multi-Age...

Analisis Spreadsheet & Dokumen Didukung AI dengan Orkes Multi-Agen dan Referensi Lintas Dokumen

Sebuah tim data perusahaan perlu menganalisis, mengkueri, dan mengedit koleksi besar spreadsheet dan dokumen (Excel, CSV, Google Sheets, PDF, Word docs) menggunakan bahasa alami — dengan kemampuan untuk mereferensikan data di seluruh beberapa file dan menjalankan alur kerja analitis multi-langkah tanpa penanganan data manual.

Diskusikan Proyek Anda

Bekerja dengan dokumen bisnis dalam skala besar penuh dengan hambatan:

Data Terisolasi — Informasi penting tersebar di puluhan spreadsheet, PDF, dan dokumen Word tanpa cara untuk mengkueri di antaranya
Referensi Silang Manual — Membandingkan daftar harga vendor (Excel) dengan ketentuan kontrak (PDF) dengan riwayat faktur (CSV) memerlukan berjam-jam pencarian manual
Keterbatasan Formula — Pertanyaan analitis kompleks tidak dapat dijawab hanya dengan formula spreadsheet
Batas Jendela Konteks — Spreadsheet besar (50.000+ baris) melebihi jendela konteks LLM, membuat pendekatan naif gagal
Tanpa Kemampuan Edit — Alat AI yang ada dapat menganalisis dokumen tetapi tidak dapat menulis perubahan kembali ke file sumber
Penalaran Multi-Langkah — Pertanyaan yang memerlukan analisis berurutan di seluruh dokumen memerlukan alur kerja multi-langkah yang terorkestrasi

Kami membangun platform intelijen dokumen AI multi-agen dengan pengambilan yang didukung basis data vektor untuk dokumen besar, agen khusus untuk berbagai jenis dokumen, orkestrator untuk penalaran lintas dokumen, dan kemampuan write-back untuk pengeditan spreadsheet.

Arsitektur

Orkestrator: Agen orkestrator AI yang mengoordinasikan alur kerja multi-langkah di seluruh agen khusus
Agen Spreadsheet: Menangani analisis Excel/CSV/Google Sheets, pembuatan formula, dan pengeditan sel
Agen Dokumen: Menangani pembacaan, ekstraksi, dan peringkasan dokumen PDF/Word
Agen Referensi Silang: Melakukan gabungan (joins), perbandingan, dan rekonsiliasi di seluruh jenis dokumen
Basis Data Vektor: Milvus untuk pengindeksan semantik potongan dokumen dan baris spreadsheet
Lapisan LLM: Pendekatan multi-model dengan pemanggilan fungsi
Backend: Python/FastAPI untuk pemrosesan dokumen dan orkestrasi agen
Frontend: Dasbor React dengan unggah file, antarmuka chat, dan pratinjau spreadsheet langsung
Penyimpanan: S3 untuk file asli, PostgreSQL untuk metadata dan pelacakan pekerjaan

Arsitektur Multi-Agen

Peran Agen

1. Agen Orkestrator

Koordinator pusat yang menerima kueri pengguna, menguraikannya menjadi sub-tugas, dan mendelegasikannya ke agen khusus. Ini menganalisis niat pengguna, membuat rencana eksekusi, mengelola aliran data antar agen, mengagregasi hasil, dan menangani pemulihan kesalahan.

2. Agen Spreadsheet

Khusus untuk operasi data tabular termasuk pemahaman skema, terjemahan bahasa alami ke kueri, agregasi dan pemfilteran, pembuatan formula, pengeditan sel dan pengisian kolom, saran bagan, dan validasi data/deteksi anomali.

3. Agen Dokumen

Khusus untuk dokumen tidak terstruktur dan semi-terstruktur termasuk OCR dan ekstraksi teks berbasis tata letak, identifikasi bagian, ekstraksi nilai kunci dari kontrak, peringkasan, pencarian klausa semantik, dan ekstraksi tabel dari PDF/Word docs.

4. Agen Referensi Silang

Khusus untuk penalaran multi-dokumen termasuk pencocokan entitas di seluruh dokumen, rekonsiliasi data dan identifikasi perbedaan, analisis garis waktu, resolusi ketergantungan untuk data yang bertentangan, dan operasi join seperti SQL di seluruh jenis dokumen.

Lapisan Basis Data Vektor

Mengapa Basis Data Vektor untuk Dokumen

Dokumen dan spreadsheet besar tidak dapat muat dalam satu jendela konteks LLM. Basis data vektor memungkinkan pencarian semantik di seluruh jutaan baris dan potongan dokumen, pengambilan hanya bagian yang relevan per kueri, penghubungan entitas lintas dokumen melalui kemiripan embedding, dan pengindeksan persisten yang tidak memerlukan pemrosesan ulang pada setiap kueri.

Strategi Pengindeksan

Pengindeksan Spreadsheet:

Setiap baris diubah menjadi representasi bahasa alami dengan menggabungkan nilai kolom kunci, kemudian di-embed dan disimpan dengan referensi kembali ke file asli, sheet, dan indeks baris untuk operasi write-back.

Pengindeksan Dokumen:

Dokumen diekstraksi dengan kesadaran tata letak, dipecah menjadi segmen semantik dengan tumpang tindih, di-embed, dan disimpan dengan referensi ke file sumber, bagian, dan nomor halaman.

Indeks Entitas Lintas Dokumen:

Sebuah indeks terpisah menghubungkan entitas (vendor, produk, orang, nomor faktur) di seluruh dokumen, memungkinkan kueri referensi silang untuk dengan cepat menemukan semua penyebutan entitas terlepas dari file sumber.

Pipeline Pengambilan

Ketika pengguna mengajukan pertanyaan lintas dokumen, orkestrator mengidentifikasi dokumen dan agen mana yang dibutuhkan, melakukan pencarian vektor untuk menemukan data yang relevan di semua sumber, mendelegasikannya ke agen khusus untuk pemrosesan, dan mengagregasi hasil menjadi respons yang koheren.

Mesin Orkes

Dekomposisi Kueri

Orkestrator memecah kueri kompleks menjadi rencana eksekusi multi-langkah. Contohnya, pertanyaan seperti "Temukan vendor dengan keterlambatan pengiriman, periksa klausa penalti kontrak, dan hitung penalti yang dapat diklaim" akan diuraikan menjadi langkah-langkah berurutan: mengkueri data pengiriman melalui Agen Spreadsheet, mencari kontrak melalui Agen Dokumen, dan menggabungkan hasil melalui Agen Referensi Silang.

Komunikasi Agen

Agen berkomunikasi melalui pesan terstruktur dengan payload bertipe
Orkestrator mempertahankan konteks eksekusi dengan hasil perantara
Langkah yang gagal memicu strategi coba lagi atau fallback
Hasil parsial dikembalikan jika beberapa langkah selesai tetapi yang lain gagal

Pengeditan & Write-Back Spreadsheet

Kemampuan Edit

Platform ini mendukung pembaruan sel, pengisian kolom, penyisipan baris, pemformatan bersyarat, pembuatan sheet baru, dan injeksi formula — semuanya diusulkan oleh agen AI dan diterapkan dengan persetujuan pengguna.

Pipeline Write-Back

Agen menentukan operasi edit (sel mana, nilai apa)
Pratinjau edit ditampilkan kepada pengguna dengan penyorotan perbedaan (nilai lama vs. baru)
Pengguna menyetujui atau mengubah perubahan yang diusulkan
Backend menerapkan perubahan ke file menggunakan pustaka yang sesuai per format
File yang dimodifikasi disimpan sebagai versi baru dengan jejak audit edit
Indeks vektor diperbarui untuk baris yang berubah

Kontrol Versi

Setiap edit membuat versi file baru (asli tetap dipertahankan)
Log perbedaan menunjukkan dengan tepat apa yang berubah, kapan, dan mengapa
Rollback ke versi sebelumnya dengan sekali klik
Atribusi edit: agen atau pengguna mana yang membuat setiap perubahan

Pipeline Pemrosesan untuk Dokumen Baru

Alur Unggah File

Pengguna mengunggah file (tarik-dan-lepas atau API)
Jenis file terdeteksi dan diarahkan ke prosesor yang sesuai
Spreadsheet: Diurai, skema disimpulkan, baris di-embed dan diindeks
PDF: OCR (jika dipindai) → ekstraksi tata letak → pemotongan (chunking) → embedding → pengindeksan
Dokumen Word: Ekstraksi teks → penguraian bagian → pemotongan (chunking) → embedding → pengindeksan
Ekstraksi Entitas: NER mengidentifikasi orang, organisasi, tanggal, jumlah di seluruh dokumen
Penghubungan Lintas Dokumen: Indeks entitas diperbarui dengan penyebutan baru
Metadata file disimpan di PostgreSQL, embedding di basis data vektor, file asli di S3

Format yang Didukung

Platform ini mendukung Excel, CSV, dan Google Sheets (dengan write-back penuh), PDF asli dan hasil pindai (hanya baca), serta dokumen Word dan Google Docs (write-back terbatas).

Fitur Utama

Arsitektur Multi-Agen — Agen khusus untuk spreadsheet, dokumen, dan referensi silang
Orkestrator AI — Menguraikan kueri kompleks menjadi rencana eksekusi multi-langkah
Referensi Lintas Dokumen — Penghubungan entitas dan rekonsiliasi data di seluruh jenis file
Pengambilan Didukung Vektor — Pencarian semantik menangani dataset di luar batas konteks LLM
Write-Back Spreadsheet — AI mengedit sel, mengisi kolom, dan menyuntikkan formula dengan persetujuan pengguna
Dukungan Dataset Besar — Spreadsheet 50.000+ baris diindeks dan dapat dikueri melalui pencarian vektor
Kontrol Versi — Setiap edit div-versi-kan dengan log perbedaan dan kemampuan rollback
Kueri Bahasa Alami — Ajukan pertanyaan analitis kompleks dalam Bahasa Inggris sederhana
Dukungan Multi-Format — Excel, CSV, Google Sheets, PDF, Word, Google Docs
Pratinjau Edit — Pratinjau yang menyoroti perbedaan sebelum perubahan apa pun diterapkan

Analisis Spreadsheet & Dokumen Didukung AI dengan Orkes Multi-Agen dan Referensi Lintas Dokumen

Tantangan

Solusi Kami

Arsitektur

Arsitektur Multi-Agen

Peran Agen

Lapisan Basis Data Vektor

Mengapa Basis Data Vektor untuk Dokumen

Strategi Pengindeksan

Pipeline Pengambilan

Mesin Orkes

Dekomposisi Kueri

Komunikasi Agen

Pengeditan & Write-Back Spreadsheet

Kemampuan Edit

Pipeline Write-Back

Kontrol Versi

Pipeline Pemrosesan untuk Dokumen Baru

Alur Unggah File

Format yang Didukung

Fitur Utama

Hasil

Tumpukan Teknologi

caseStudyDetail.more Studi Kasus

Sistem RAG Dokumen Lokal-Pertama dengan Pencarian Hibrida & Dukungan Multi-Format

Pemrosesan Faktur Bertenaga AI dengan OCR dan Integrasi QuickBooks

Siap Mentransformasi Bisnis Anda?

Penyisipan Iklan Sisi Klien (CSAI) dengan Penguraian Penanda SCTE-35 & Integrasi Pemutar Multi-Platform

Pertanyaan yang Sering Diajukan