Her şeyi tek bir LLM'e göndermeye kıyasla, çoklu aracı orkestrasyonu belge analizini nasıl geliştirir?

MicrocosmWorks, belge analizinin farklı yönlerini ele alan uzman aracılarla (örneğin, e-tablolar için bir tablo çıkarma aracısı, anlatı belgeleri için bir metin özetleme aracısı ve birden çok dosyadaki veri noktaları arasındaki ilişkileri tanımlayan bir çapraz referans aracısı gibi) bir çoklu aracı mimarisi tasarladı. Bu iş bölümü, her aracının odaklanmış bir bağlam penceresi içinde çalışması ve alana özgü yönlendirme stratejileri uygulaması nedeniyle, tek bir monolitik LLM çağrısından daha doğru sonuçlar üretir.

Sistem, karmaşık formüllere, özet tablolara ve birden çok bağlantılı sayfaya sahip e-tabloları analiz edebilir mi?

Evet, MicrocosmWorks, yapılandırılmış veriyi analiz ajanlarına iletmeden önce formül bağımlılıklarını çözen, özet tablo özetlerini genişleten ve sayfalar arası referansları izleyen bir e-tablo ayrıştırma motoru geliştirdi. Sistem, karmaşık Excel yapılarını LLM'lerin etkili bir şekilde akıl yürütebileceği düzleştirilmiş veri temsillerine dönüştürür ve sayfalar arasındaki ilişkisel bağlamı korur, böylece AI, birden çok sekmedeki verilerin birleştirilmesini gerektiren 'hangi departman Q3 bütçesini aştı' gibi soruları yanıtlayabilir.

PDF'ler, elektronik tablolar ve Word belgelerinden oluşan bir karışım analiz edilirken çapraz belge referans tespiti nasıl çalışır?

MicrocosmWorks, yüklenen tüm belgelerden adlandırılmış varlıkları, sayısal tanımlayıcıları ve tarih referanslarını çıkaran, ardından dosyalar arasında ilgili referansları birbirine bağlayan bir varlık ilişkilendirme hattı uyguladı. Bir kullanıcı bir soru sorduğunda, çapraz referans aracısı bu grafiği dolaşarak birden fazla kaynak belgesinden ilgili verileri çeker ve bir insan analistin saatler sürecek manuel çapraz kontrolünü gerektirecek şekillerde bilgiyi sentezleyen yanıtlar sunar.

Çoklu ajan analiz sistemi hangi dosya boyutu ve belge hacmi sınırlarını destekler?

MicrocosmWorks sistemi, analiz oturumu başına 500 dosyaya kadar belge gruplarını (e-tablolar için tekil dosya boyutları 100MB'a ve PDF'ler için 50MB'a kadar) işlemek üzere tasarlandı. Büyük belgeler otomatik olarak chunked edilir ve birden fazla agent instance arasında paralel olarak işlenir. Orchestrator, agent çıktılarını bir unified knowledge representation'a dönüştürerek tüm belge setinin tutarlı bir görünümünü korur.

Özelleştirilmiş bir çoklu ajan belge analiz platformu inşa etmek ne kadara mal olur?

MicrocosmWorks, çoklu ajan belge analiz platformlarını saatlik 30-50 dolar oranında geliştirir. Üretime hazır bir sistem genellikle belge ayrıştırma, ajan orkestrasyonu, çapraz referans tespiti ve kullanıcıya yönelik bir sorgu arayüzü dahil olmak üzere 3-5 aylık bir geliştirme süresi gerektirir. Üretimde sorgu başına maliyet, belge hacmine ve LLM token kullanımına bağlıdır, ancak çoklu ajan mimarileri, tüm belge kümelerini tek bir prompt'a doldurmak yerine, her ajana yalnızca ilgili bağlamı yönlendirerek LLM maliyetlerini aslında azaltır.

AI-Powered Spreadsheet & Document Analysis with Multi-Age...

Kurumsal belgelerle büyük ölçekte çalışmak sürtüşmelerle doluydu:

Silolu Veri — Kritik bilgiler düzinelerce elektronik tablo, PDF ve Word belgesine dağılmıştı ve bunlar arasında sorgulama yapmanın bir yolu yoktu
Manuel Çapraz Referanslama — Bir satıcı fiyat listesini (Excel) sözleşme koşullarıyla (PDF) ve fatura geçmişiyle (CSV) karşılaştırmak saatlerce manuel arama gerektiriyordu
Formül Sınırlamaları — Karmaşık analitik sorular yalnızca elektronik tablo formülleriyle yanıtlanamıyordu
Bağlam Penceresi Sınırlamaları — Büyük elektronik tablolar (50.000'den fazla satır) LLM bağlam pencerelerini aşıyordu ve bu da basit yaklaşımların başarısız olmasına neden oluyordu
Düzenleme Yeteneklerinin Olmaması — Mevcut AI araçları belgeleri analiz edebiliyor ancak değişiklikleri kaynak dosyalara geri yazamıyordu
Çok Adımlı Akıl Yürütme — Belgeler arasında sıralı analiz gerektiren sorular, orkestrasyonlu çok adımlı iş akışları gerektiriyordu

Büyük belgeler için vektör veritabanı destekli erişim, farklı belge türleri için uzmanlaşmış ajanlar, belgeler arası akıl yürütme için bir orkestratör ve elektronik tablo düzenleme için geri yazma yeteneklerine sahip çok ajanlı bir AI belge zekası platformu inşa ettik.

Mimari

Orkestratör: Uzmanlaşmış ajanlar arasında çok adımlı iş akışlarını koordine eden AI orkestratör ajanı
Elektronik Tablo Ajanı: Excel/CSV/Google Sheets analizini, formül oluşturmayı ve hücre düzenlemelerini yönetir
Belge Ajanı: PDF/Word belge okumayı, çıkarmayı ve özetlemeyi yönetir
Çapraz Referans Ajanı: Belge türleri arasında birleştirmeler, karşılaştırmalar ve mutabakat yapar
Vektör Veritabanı: Belge parçacıklarının ve elektronik tablo satırlarının anlamsal indekslenmesi için Milvus
LLM Katmanı: Fonksiyon çağırma özellikli çoklu model yaklaşımı
Arka Uç: Belge işleme ve ajan orkestrasyonu için Python/FastAPI
Ön Uç: Dosya yükleme, sohbet arayüzü ve canlı elektronik tablo önizlemesi ile React kontrol paneli
Depolama: Orijinal dosyalar için S3, meta veri ve iş takibi için PostgreSQL

Çok Ajanlı Mimari

Ajan Rolleri

1. Orkestratör Ajanı

Kullanıcı sorgularını alan, bunları alt görevlere ayıran ve uzmanlaşmış ajanlara devreden merkezi koordinatördür. Kullanıcı niyetini analiz eder, yürütme planları oluşturur, ajanlar arasındaki veri akışını yönetir, sonuçları birleştirir ve hata kurtarmayı ele alır.

2. Elektronik Tablo Ajanı

Şema anlama, doğal dilden sorguya çeviri, toplama ve filtreleme, formül oluşturma, hücre düzenleme ve sütun doldurma, grafik önerileri ve veri doğrulama/anomali tespiti dahil olmak üzere tablo veri işlemleri için uzmanlaşmıştır.

3. Belge Ajanı

OCR ve düzenlemeye duyarlı metin çıkarma, bölüm tanımlama, sözleşmelerden anahtar-değer çıkarma, özetleme, anlamsal madde arama ve PDF'lerden/Word belgelerinden tablo çıkarma dahil olmak üzere yapılandırılmamış ve yarı yapılandırılmış belgeler için uzmanlaşmıştır.

4. Çapraz Referans Ajanı

Belgeler arası varlık eşleştirme, veri mutabakatı ve tutarsızlık tespiti, zaman çizelgesi analizi, çakışan veriler için bağımlılık çözümü ve belge türleri arasında SQL benzeri birleştirme işlemleri dahil olmak üzere çok belgeli akıl yürütme için uzmanlaşmıştır.

Vektör Veritabanı Katmanı

Belgeler için Neden Vektör DB?

Büyük belgeler ve elektronik tablolar tek bir LLM bağlam penceresine sığmaz. Vektör veritabanı, milyonlarca satır ve belge parçacığı üzerinde anlamsal aramayı, sorgu başına yalnızca ilgili bölümlerin alınmasını, gömme benzerliği yoluyla belgeler arası varlık bağlantısını ve her sorguda yeniden işlem gerektirmeyen kalıcı indekslemeyi mümkün kılar.

İndeksleme Stratejisi

Elektronik Tablo İndeksleme:

Her satır, ana sütun değerleri birleştirilerek doğal dil temsiline dönüştürülür, ardından gömülür ve geri yazma işlemleri için orijinal dosya, sayfa ve satır indeksine referanslarla birlikte depolanır.

Belge İndeksleme:

Belgeler düzenlemeye duyarlı bir şekilde çıkarılır, örtüşmeli anlamsal parçalara ayrılır, gömülür ve kaynak dosya, bölüm ve sayfa numarasına referanslarla birlikte depolanır.

Belgeler Arası Varlık İndeksi:

Ayrı bir indeks, belgeler arasında varlıkları (satıcılar, ürünler, kişiler, fatura numaraları) birbirine bağlar ve kaynak dosyadan bağımsız olarak bir varlığın tüm bahsedildiği yerleri hızlıca bulmak için çapraz referans sorgularını etkinleştirir.

Erişim Hattı

Bir kullanıcı belgeler arası bir soru sorduğunda, orkestratör hangi belgelerin ve ajanların gerektiğini belirler, tüm kaynaklarda ilgili verileri bulmak için vektör aramaları yapar, işlem için uzmanlaşmış ajanlara devreder ve sonuçları tutarlı bir yanıtta birleştirir.

Orkestrasyon Motoru

Sorgu Ayrıştırma

Orkestratör karmaşık sorguları çok adımlı yürütme planlarına ayırır. Örneğin, "Geç teslimat yapan satıcıları bulun, sözleşme ceza maddelerini kontrol edin ve talep edilebilir cezaları hesaplayın" gibi bir soru sıralı adımlara ayrılır: Elektronik Tablo Ajanı aracılığıyla teslimat verilerini sorgulama, Belge Ajanı aracılığıyla sözleşmeleri arama ve Çapraz Referans Ajanı aracılığıyla sonuçları birleştirme.

Ajan İletişimi

Ajanlar, tipik yüklerle yapılandırılmış mesajlar aracılığıyla iletişim kurar
Orkestratör, ara sonuçlarla yürütme bağlamını sürdürür
Başarısız adımlar yeniden deneme veya yedek stratejilerini tetikler
Bazı adımlar tamamlanır ancak diğerleri başarısız olursa kısmi sonuçlar döndürülür

Elektronik Tablo Düzenleme ve Geri Yazma

Düzenleme Yetenekleri

Platform; hücre güncellemelerini, sütun doldurmaları, satır eklemeyi, koşullu biçimlendirmeyi, yeni sayfa oluşturmayı ve formül enjeksiyonunu destekler; bunların hepsi AI ajanları tarafından önerilir ve kullanıcı onayı ile uygulanır.

Geri Yazma Hattı

Ajan, düzenleme işlemini (hangi hücreler, hangi değerler) belirler
Fark vurgusu (eski ve yeni değerler) ile kullanıcıya düzenleme önizlemesi gösterilir
Kullanıcı önerilen değişiklikleri onaylar veya değiştirir
Arka uç, formata uygun kütüphaneleri kullanarak dosyaya değişiklikleri uygular
Değiştirilen dosya, düzenleme denetim izi ile yeni bir sürüm olarak kaydedilir
Değişen satırlar için vektör indeksi güncellenir

Sürüm Kontrolü

Her düzenleme yeni bir dosya sürümü oluşturur (orijinal korunur)
Fark günlüğü, tam olarak neyin, ne zaman ve neden değiştiğini gösterir
Tek tıklamayla herhangi bir önceki sürüme geri dönme
Düzenleme atıfı: Hangi ajanın veya kullanıcının her bir değişikliği yaptığı

Yeni Belgeler İçin İşleme Hattı

Dosya Yükleme Akışı

Kullanıcı dosyaları yükler (sürükle-bırak veya API)
Dosya türü algılanır ve uygun işlemciye yönlendirilir
Elektronik Tablolar: Ayrıştırılır, şema çıkarılır, satırlar gömülür ve indekslenir
PDF'ler: OCR (taranmışsa) → düzen çıkarma → parçalara ayırma → gömme → indeksleme
Word Belgeleri: Metin çıkarma → bölüm ayrıştırma → parçalara ayırma → gömme → indeksleme
Varlık Çıkarımı: NER, tüm belgeler arasında kişileri, kuruluşları, tarihleri, miktarları tanımlar
Belgeler Arası Bağlantı: Varlık indeksi yeni bahsedilenlerle güncellenir
Dosya meta verileri PostgreSQL'de, gömmeler vektör DB'de, orijinaller S3'te depolanır

Desteklenen Formatlar

Platform; Excel, CSV ve Google Sheets'i (tam geri yazma ile), yerel ve taranmış PDF'leri (salt okunur) ve Word belgelerini ve Google Docs'u (sınırlı geri yazma) destekler.

Temel Özellikler

Çok Ajanlı Mimari — Elektronik tablolar, belgeler ve çapraz referanslama için uzmanlaşmış ajanlar
AI Orkestratörü — Karmaşık sorguları çok adımlı yürütme planlarına ayırır
Belgeler Arası Referans — Dosya türleri arasında varlık bağlantısı ve veri mutabakatı
Vektör Destekli Erişim — Anlamsal arama, LLM bağlam sınırlarının ötesindeki veri kümelerini yönetir
Elektronik Tablo Geri Yazma — AI, hücreleri düzenler, sütunları doldurur ve kullanıcı onayı ile formülleri enjekte eder
Büyük Veri Kümesi Desteği — 50.000'den fazla satırlık elektronik tablolar, vektör araması aracılığıyla indekslenebilir ve sorgulanabilir
Sürüm Kontrolü — Her düzenleme, fark günlüğü ve geri alma yeteneği ile sürümlendirilir
Doğal Dil Sorguları — Karmaşık analitik soruları sade İngilizce ile sorun
Çoklu Format Desteği — Excel, CSV, Google Sheets, PDF, Word, Google Docs
Düzenleme Önizlemesi — Herhangi bir değişiklik uygulanmadan önce fark vurgulu önizleme

Yapay Zeka Destekli Elektronik Tablo ve Belge Analizi, Çoklu Ajan Orkestrasyonu ve Belgeler Arası Referans ile

Zorluk

Çözümümüz

Mimari

Çok Ajanlı Mimari

Ajan Rolleri

Vektör Veritabanı Katmanı

Belgeler için Neden Vektör DB?

İndeksleme Stratejisi

Erişim Hattı

Orkestrasyon Motoru

Sorgu Ayrıştırma

Ajan İletişimi

Elektronik Tablo Düzenleme ve Geri Yazma

Düzenleme Yetenekleri

Geri Yazma Hattı

Sürüm Kontrolü

Yeni Belgeler İçin İşleme Hattı

Dosya Yükleme Akışı

Desteklenen Formatlar

Temel Özellikler

Sonuçlar

Teknoloji Yığını

caseStudyDetail.more Vaka Çalışmaları

Hibrit Arama ve Çok Biçimli Destekli Yerel-Önce Belge RAG Sistemi

Kickly: Girişimler için Yapay Zeka Destekli Proje Platformu

İşletmenizi Dönüştürmeye Hazır mısınız?

AI Destekli Fatura İşleme (OCR ve QuickBooks Entegrasyonu ile)

Sıkça Sorulan Sorular