Büyük belgeler için vektör veritabanı destekli erişim, farklı belge türleri için uzmanlaşmış ajanlar, belgeler arası akıl yürütme için bir orkestratör ve elektronik tablo düzenleme için geri yazma yeteneklerine sahip çok ajanlı bir AI belge zekası platformu inşa ettik.
Mimari
- Orkestratör: Uzmanlaşmış ajanlar arasında çok adımlı iş akışlarını koordine eden AI orkestratör ajanı
- Elektronik Tablo Ajanı: Excel/CSV/Google Sheets analizini, formül oluşturmayı ve hücre düzenlemelerini yönetir
- Belge Ajanı: PDF/Word belge okumayı, çıkarmayı ve özetlemeyi yönetir
- Çapraz Referans Ajanı: Belge türleri arasında birleştirmeler, karşılaştırmalar ve mutabakat yapar
- Vektör Veritabanı: Belge parçacıklarının ve elektronik tablo satırlarının anlamsal indekslenmesi için Milvus
- LLM Katmanı: Fonksiyon çağırma özellikli çoklu model yaklaşımı
- Arka Uç: Belge işleme ve ajan orkestrasyonu için Python/FastAPI
- Ön Uç: Dosya yükleme, sohbet arayüzü ve canlı elektronik tablo önizlemesi ile React kontrol paneli
- Depolama: Orijinal dosyalar için S3, meta veri ve iş takibi için PostgreSQL
Çok Ajanlı Mimari
Ajan Rolleri
1. Orkestratör Ajanı
Kullanıcı sorgularını alan, bunları alt görevlere ayıran ve uzmanlaşmış ajanlara devreden merkezi koordinatördür. Kullanıcı niyetini analiz eder, yürütme planları oluşturur, ajanlar arasındaki veri akışını yönetir, sonuçları birleştirir ve hata kurtarmayı ele alır.
2. Elektronik Tablo Ajanı
Şema anlama, doğal dilden sorguya çeviri, toplama ve filtreleme, formül oluşturma, hücre düzenleme ve sütun doldurma, grafik önerileri ve veri doğrulama/anomali tespiti dahil olmak üzere tablo veri işlemleri için uzmanlaşmıştır.
3. Belge Ajanı
OCR ve düzenlemeye duyarlı metin çıkarma, bölüm tanımlama, sözleşmelerden anahtar-değer çıkarma, özetleme, anlamsal madde arama ve PDF'lerden/Word belgelerinden tablo çıkarma dahil olmak üzere yapılandırılmamış ve yarı yapılandırılmış belgeler için uzmanlaşmıştır.
4. Çapraz Referans Ajanı
Belgeler arası varlık eşleştirme, veri mutabakatı ve tutarsızlık tespiti, zaman çizelgesi analizi, çakışan veriler için bağımlılık çözümü ve belge türleri arasında SQL benzeri birleştirme işlemleri dahil olmak üzere çok belgeli akıl yürütme için uzmanlaşmıştır.
Vektör Veritabanı Katmanı
Belgeler için Neden Vektör DB?
Büyük belgeler ve elektronik tablolar tek bir LLM bağlam penceresine sığmaz. Vektör veritabanı, milyonlarca satır ve belge parçacığı üzerinde anlamsal aramayı, sorgu başına yalnızca ilgili bölümlerin alınmasını, gömme benzerliği yoluyla belgeler arası varlık bağlantısını ve her sorguda yeniden işlem gerektirmeyen kalıcı indekslemeyi mümkün kılar.
İndeksleme Stratejisi
Elektronik Tablo İndeksleme:
Her satır, ana sütun değerleri birleştirilerek doğal dil temsiline dönüştürülür, ardından gömülür ve geri yazma işlemleri için orijinal dosya, sayfa ve satır indeksine referanslarla birlikte depolanır.
Belge İndeksleme:
Belgeler düzenlemeye duyarlı bir şekilde çıkarılır, örtüşmeli anlamsal parçalara ayrılır, gömülür ve kaynak dosya, bölüm ve sayfa numarasına referanslarla birlikte depolanır.
Belgeler Arası Varlık İndeksi:
Ayrı bir indeks, belgeler arasında varlıkları (satıcılar, ürünler, kişiler, fatura numaraları) birbirine bağlar ve kaynak dosyadan bağımsız olarak bir varlığın tüm bahsedildiği yerleri hızlıca bulmak için çapraz referans sorgularını etkinleştirir.
Erişim Hattı
Bir kullanıcı belgeler arası bir soru sorduğunda, orkestratör hangi belgelerin ve ajanların gerektiğini belirler, tüm kaynaklarda ilgili verileri bulmak için vektör aramaları yapar, işlem için uzmanlaşmış ajanlara devreder ve sonuçları tutarlı bir yanıtta birleştirir.
Orkestrasyon Motoru
Sorgu Ayrıştırma
Orkestratör karmaşık sorguları çok adımlı yürütme planlarına ayırır. Örneğin, "Geç teslimat yapan satıcıları bulun, sözleşme ceza maddelerini kontrol edin ve talep edilebilir cezaları hesaplayın" gibi bir soru sıralı adımlara ayrılır: Elektronik Tablo Ajanı aracılığıyla teslimat verilerini sorgulama, Belge Ajanı aracılığıyla sözleşmeleri arama ve Çapraz Referans Ajanı aracılığıyla sonuçları birleştirme.
Ajan İletişimi
- Ajanlar, tipik yüklerle yapılandırılmış mesajlar aracılığıyla iletişim kurar
- Orkestratör, ara sonuçlarla yürütme bağlamını sürdürür
- Başarısız adımlar yeniden deneme veya yedek stratejilerini tetikler
- Bazı adımlar tamamlanır ancak diğerleri başarısız olursa kısmi sonuçlar döndürülür
Elektronik Tablo Düzenleme ve Geri Yazma
Düzenleme Yetenekleri
Platform; hücre güncellemelerini, sütun doldurmaları, satır eklemeyi, koşullu biçimlendirmeyi, yeni sayfa oluşturmayı ve formül enjeksiyonunu destekler; bunların hepsi AI ajanları tarafından önerilir ve kullanıcı onayı ile uygulanır.
Geri Yazma Hattı
- Ajan, düzenleme işlemini (hangi hücreler, hangi değerler) belirler
- Fark vurgusu (eski ve yeni değerler) ile kullanıcıya düzenleme önizlemesi gösterilir
- Kullanıcı önerilen değişiklikleri onaylar veya değiştirir
- Arka uç, formata uygun kütüphaneleri kullanarak dosyaya değişiklikleri uygular
- Değiştirilen dosya, düzenleme denetim izi ile yeni bir sürüm olarak kaydedilir
- Değişen satırlar için vektör indeksi güncellenir
Sürüm Kontrolü
- Her düzenleme yeni bir dosya sürümü oluşturur (orijinal korunur)
- Fark günlüğü, tam olarak neyin, ne zaman ve neden değiştiğini gösterir
- Tek tıklamayla herhangi bir önceki sürüme geri dönme
- Düzenleme atıfı: Hangi ajanın veya kullanıcının her bir değişikliği yaptığı
Yeni Belgeler İçin İşleme Hattı
Dosya Yükleme Akışı
- Kullanıcı dosyaları yükler (sürükle-bırak veya API)
- Dosya türü algılanır ve uygun işlemciye yönlendirilir
- Elektronik Tablolar: Ayrıştırılır, şema çıkarılır, satırlar gömülür ve indekslenir
- PDF'ler: OCR (taranmışsa) → düzen çıkarma → parçalara ayırma → gömme → indeksleme
- Word Belgeleri: Metin çıkarma → bölüm ayrıştırma → parçalara ayırma → gömme → indeksleme
- Varlık Çıkarımı: NER, tüm belgeler arasında kişileri, kuruluşları, tarihleri, miktarları tanımlar
- Belgeler Arası Bağlantı: Varlık indeksi yeni bahsedilenlerle güncellenir
- Dosya meta verileri PostgreSQL'de, gömmeler vektör DB'de, orijinaller S3'te depolanır
Desteklenen Formatlar
Platform; Excel, CSV ve Google Sheets'i (tam geri yazma ile), yerel ve taranmış PDF'leri (salt okunur) ve Word belgelerini ve Google Docs'u (sınırlı geri yazma) destekler.
Temel Özellikler
- Çok Ajanlı Mimari — Elektronik tablolar, belgeler ve çapraz referanslama için uzmanlaşmış ajanlar
- AI Orkestratörü — Karmaşık sorguları çok adımlı yürütme planlarına ayırır
- Belgeler Arası Referans — Dosya türleri arasında varlık bağlantısı ve veri mutabakatı
- Vektör Destekli Erişim — Anlamsal arama, LLM bağlam sınırlarının ötesindeki veri kümelerini yönetir
- Elektronik Tablo Geri Yazma — AI, hücreleri düzenler, sütunları doldurur ve kullanıcı onayı ile formülleri enjekte eder
- Büyük Veri Kümesi Desteği — 50.000'den fazla satırlık elektronik tablolar, vektör araması aracılığıyla indekslenebilir ve sorgulanabilir
- Sürüm Kontrolü — Her düzenleme, fark günlüğü ve geri alma yeteneği ile sürümlendirilir
- Doğal Dil Sorguları — Karmaşık analitik soruları sade İngilizce ile sorun
- Çoklu Format Desteği — Excel, CSV, Google Sheets, PDF, Word, Google Docs
- Düzenleme Önizlemesi — Herhangi bir değişiklik uygulanmadan önce fark vurgulu önizleme