MicrocosmWorksDijital Kozmosu Yenilikçi ve Mimari Olarak Tasarlamak
Hakkındaİletişim
MicrocosmWorksDijital Kozmosu Yenilikçi ve Mimari Olarak İnşa Etmek

Önemli BT çözümleri sunuyoruz. Teknoloji, güvenlik ve işletmelerin güvenilir, yenilikçi BT altyapısı ile büyümesine yardımcı olmaktan tutkuluyuz.

[email protected]
+91 7011868196
New Delhi, India

AI Büyüme Merkezi

AI MerkeziStartup İnovasyonuKurumsal Hızlandırıcı

Çözümler

Tüm ÇözümlerSağlık ve Fitness UygulamalarıAI Video PlatformuAI Ajan Geliştirme

Kaynaklar

ÖngörülerSektör RehberleriKullanım Durumu ŞablonlarıMimari KalıplarVaka Çalışmaları

Şirket

HakkımızdaİletişimÇalışmalarımız

Hizmetler

Dijital DanışmanlıkBulut AltyapısıSaaS GeliştirmeYapay Zeka GeliştirmeVideo Teknolojisi
ERP GeliştirmeZoho ÖzelleştirmeOdoo GeliştirmeSalesforce EntegrasyonuÖzel CRM Geliştirme
QuickBooks EntegrasyonuIoT ÇözümleriBlokzincir Geliştirme
Siber Güvenlik DanışmanlığıIT Desteği - L3

© 2026 MicrocosmWorks. Tüm hakları saklıdır.

Gizlilik PolitikasıHizmet Şartları
Vaka Çalışmalarına Dön
Document IntelligenceYayınlandı June 22, 2026 · Güncellendi June 22, 2026

Yapay Zeka Destekli Elektronik Tablo ve Belge Analizi, Çoklu Ajan Orkestrasyonu ve Belgeler Arası Referans ile

Bir kurumsal veri ekibi, geniş elektronik tablo ve belge koleksiyonlarını (Excel, CSV, Google Sheets, PDFs, Word docs) doğal dil kullanarak analiz etme, sorgulama ve düzenleme ihtiyacı duydu; bu işlemde birden çok dosya arasında veri çapraz referansı yapma ve manuel veri düzenleme olmaksızın çok adımlı analitik iş akışlarını yürütme yeteneği gerekiyordu.

Projenizi Tartışın
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

Zorluk

Kurumsal belgelerle büyük ölçekte çalışmak sürtüşmelerle doluydu:

  • Silolu Veri — Kritik bilgiler düzinelerce elektronik tablo, PDF ve Word belgesine dağılmıştı ve bunlar arasında sorgulama yapmanın bir yolu yoktu
  • Manuel Çapraz Referanslama — Bir satıcı fiyat listesini (Excel) sözleşme koşullarıyla (PDF) ve fatura geçmişiyle (CSV) karşılaştırmak saatlerce manuel arama gerektiriyordu
  • Formül Sınırlamaları — Karmaşık analitik sorular yalnızca elektronik tablo formülleriyle yanıtlanamıyordu
  • Bağlam Penceresi Sınırlamaları — Büyük elektronik tablolar (50.000'den fazla satır) LLM bağlam pencerelerini aşıyordu ve bu da basit yaklaşımların başarısız olmasına neden oluyordu
  • Düzenleme Yeteneklerinin Olmaması — Mevcut AI araçları belgeleri analiz edebiliyor ancak değişiklikleri kaynak dosyalara geri yazamıyordu
  • Çok Adımlı Akıl Yürütme — Belgeler arasında sıralı analiz gerektiren sorular, orkestrasyonlu çok adımlı iş akışları gerektiriyordu

Çözümümüz

Büyük belgeler için vektör veritabanı destekli erişim, farklı belge türleri için uzmanlaşmış ajanlar, belgeler arası akıl yürütme için bir orkestratör ve elektronik tablo düzenleme için geri yazma yeteneklerine sahip çok ajanlı bir AI belge zekası platformu inşa ettik.

Mimari

  • Orkestratör: Uzmanlaşmış ajanlar arasında çok adımlı iş akışlarını koordine eden AI orkestratör ajanı
  • Elektronik Tablo Ajanı: Excel/CSV/Google Sheets analizini, formül oluşturmayı ve hücre düzenlemelerini yönetir
  • Belge Ajanı: PDF/Word belge okumayı, çıkarmayı ve özetlemeyi yönetir
  • Çapraz Referans Ajanı: Belge türleri arasında birleştirmeler, karşılaştırmalar ve mutabakat yapar
  • Vektör Veritabanı: Belge parçacıklarının ve elektronik tablo satırlarının anlamsal indekslenmesi için Milvus
  • LLM Katmanı: Fonksiyon çağırma özellikli çoklu model yaklaşımı
  • Arka Uç: Belge işleme ve ajan orkestrasyonu için Python/FastAPI
  • Ön Uç: Dosya yükleme, sohbet arayüzü ve canlı elektronik tablo önizlemesi ile React kontrol paneli
  • Depolama: Orijinal dosyalar için S3, meta veri ve iş takibi için PostgreSQL

Çok Ajanlı Mimari

Ajan Rolleri

1. Orkestratör Ajanı

Kullanıcı sorgularını alan, bunları alt görevlere ayıran ve uzmanlaşmış ajanlara devreden merkezi koordinatördür. Kullanıcı niyetini analiz eder, yürütme planları oluşturur, ajanlar arasındaki veri akışını yönetir, sonuçları birleştirir ve hata kurtarmayı ele alır.

2. Elektronik Tablo Ajanı

Şema anlama, doğal dilden sorguya çeviri, toplama ve filtreleme, formül oluşturma, hücre düzenleme ve sütun doldurma, grafik önerileri ve veri doğrulama/anomali tespiti dahil olmak üzere tablo veri işlemleri için uzmanlaşmıştır.

3. Belge Ajanı

OCR ve düzenlemeye duyarlı metin çıkarma, bölüm tanımlama, sözleşmelerden anahtar-değer çıkarma, özetleme, anlamsal madde arama ve PDF'lerden/Word belgelerinden tablo çıkarma dahil olmak üzere yapılandırılmamış ve yarı yapılandırılmış belgeler için uzmanlaşmıştır.

4. Çapraz Referans Ajanı

Belgeler arası varlık eşleştirme, veri mutabakatı ve tutarsızlık tespiti, zaman çizelgesi analizi, çakışan veriler için bağımlılık çözümü ve belge türleri arasında SQL benzeri birleştirme işlemleri dahil olmak üzere çok belgeli akıl yürütme için uzmanlaşmıştır.

Vektör Veritabanı Katmanı

Belgeler için Neden Vektör DB?

Büyük belgeler ve elektronik tablolar tek bir LLM bağlam penceresine sığmaz. Vektör veritabanı, milyonlarca satır ve belge parçacığı üzerinde anlamsal aramayı, sorgu başına yalnızca ilgili bölümlerin alınmasını, gömme benzerliği yoluyla belgeler arası varlık bağlantısını ve her sorguda yeniden işlem gerektirmeyen kalıcı indekslemeyi mümkün kılar.

İndeksleme Stratejisi

Elektronik Tablo İndeksleme:

Her satır, ana sütun değerleri birleştirilerek doğal dil temsiline dönüştürülür, ardından gömülür ve geri yazma işlemleri için orijinal dosya, sayfa ve satır indeksine referanslarla birlikte depolanır.

Belge İndeksleme:

Belgeler düzenlemeye duyarlı bir şekilde çıkarılır, örtüşmeli anlamsal parçalara ayrılır, gömülür ve kaynak dosya, bölüm ve sayfa numarasına referanslarla birlikte depolanır.

Belgeler Arası Varlık İndeksi:

Ayrı bir indeks, belgeler arasında varlıkları (satıcılar, ürünler, kişiler, fatura numaraları) birbirine bağlar ve kaynak dosyadan bağımsız olarak bir varlığın tüm bahsedildiği yerleri hızlıca bulmak için çapraz referans sorgularını etkinleştirir.

Erişim Hattı

Bir kullanıcı belgeler arası bir soru sorduğunda, orkestratör hangi belgelerin ve ajanların gerektiğini belirler, tüm kaynaklarda ilgili verileri bulmak için vektör aramaları yapar, işlem için uzmanlaşmış ajanlara devreder ve sonuçları tutarlı bir yanıtta birleştirir.

Orkestrasyon Motoru

Sorgu Ayrıştırma

Orkestratör karmaşık sorguları çok adımlı yürütme planlarına ayırır. Örneğin, "Geç teslimat yapan satıcıları bulun, sözleşme ceza maddelerini kontrol edin ve talep edilebilir cezaları hesaplayın" gibi bir soru sıralı adımlara ayrılır: Elektronik Tablo Ajanı aracılığıyla teslimat verilerini sorgulama, Belge Ajanı aracılığıyla sözleşmeleri arama ve Çapraz Referans Ajanı aracılığıyla sonuçları birleştirme.

Ajan İletişimi

  • Ajanlar, tipik yüklerle yapılandırılmış mesajlar aracılığıyla iletişim kurar
  • Orkestratör, ara sonuçlarla yürütme bağlamını sürdürür
  • Başarısız adımlar yeniden deneme veya yedek stratejilerini tetikler
  • Bazı adımlar tamamlanır ancak diğerleri başarısız olursa kısmi sonuçlar döndürülür

Elektronik Tablo Düzenleme ve Geri Yazma

Düzenleme Yetenekleri

Platform; hücre güncellemelerini, sütun doldurmaları, satır eklemeyi, koşullu biçimlendirmeyi, yeni sayfa oluşturmayı ve formül enjeksiyonunu destekler; bunların hepsi AI ajanları tarafından önerilir ve kullanıcı onayı ile uygulanır.

Geri Yazma Hattı

  1. Ajan, düzenleme işlemini (hangi hücreler, hangi değerler) belirler
  2. Fark vurgusu (eski ve yeni değerler) ile kullanıcıya düzenleme önizlemesi gösterilir
  3. Kullanıcı önerilen değişiklikleri onaylar veya değiştirir
  4. Arka uç, formata uygun kütüphaneleri kullanarak dosyaya değişiklikleri uygular
  5. Değiştirilen dosya, düzenleme denetim izi ile yeni bir sürüm olarak kaydedilir
  6. Değişen satırlar için vektör indeksi güncellenir

Sürüm Kontrolü

  • Her düzenleme yeni bir dosya sürümü oluşturur (orijinal korunur)
  • Fark günlüğü, tam olarak neyin, ne zaman ve neden değiştiğini gösterir
  • Tek tıklamayla herhangi bir önceki sürüme geri dönme
  • Düzenleme atıfı: Hangi ajanın veya kullanıcının her bir değişikliği yaptığı

Yeni Belgeler İçin İşleme Hattı

Dosya Yükleme Akışı

  1. Kullanıcı dosyaları yükler (sürükle-bırak veya API)
  2. Dosya türü algılanır ve uygun işlemciye yönlendirilir
  3. Elektronik Tablolar: Ayrıştırılır, şema çıkarılır, satırlar gömülür ve indekslenir
  4. PDF'ler: OCR (taranmışsa) → düzen çıkarma → parçalara ayırma → gömme → indeksleme
  5. Word Belgeleri: Metin çıkarma → bölüm ayrıştırma → parçalara ayırma → gömme → indeksleme
  6. Varlık Çıkarımı: NER, tüm belgeler arasında kişileri, kuruluşları, tarihleri, miktarları tanımlar
  7. Belgeler Arası Bağlantı: Varlık indeksi yeni bahsedilenlerle güncellenir
  8. Dosya meta verileri PostgreSQL'de, gömmeler vektör DB'de, orijinaller S3'te depolanır

Desteklenen Formatlar

Platform; Excel, CSV ve Google Sheets'i (tam geri yazma ile), yerel ve taranmış PDF'leri (salt okunur) ve Word belgelerini ve Google Docs'u (sınırlı geri yazma) destekler.

Temel Özellikler

  1. Çok Ajanlı Mimari — Elektronik tablolar, belgeler ve çapraz referanslama için uzmanlaşmış ajanlar
  2. AI Orkestratörü — Karmaşık sorguları çok adımlı yürütme planlarına ayırır
  3. Belgeler Arası Referans — Dosya türleri arasında varlık bağlantısı ve veri mutabakatı
  4. Vektör Destekli Erişim — Anlamsal arama, LLM bağlam sınırlarının ötesindeki veri kümelerini yönetir
  5. Elektronik Tablo Geri Yazma — AI, hücreleri düzenler, sütunları doldurur ve kullanıcı onayı ile formülleri enjekte eder
  6. Büyük Veri Kümesi Desteği — 50.000'den fazla satırlık elektronik tablolar, vektör araması aracılığıyla indekslenebilir ve sorgulanabilir
  7. Sürüm Kontrolü — Her düzenleme, fark günlüğü ve geri alma yeteneği ile sürümlendirilir
  8. Doğal Dil Sorguları — Karmaşık analitik soruları sade İngilizce ile sorun
  9. Çoklu Format Desteği — Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. Düzenleme Önizlemesi — Herhangi bir değişiklik uygulanmadan önce fark vurgulu önizleme

Sonuçlar

Sorgu Hızı: Belgeler arası sorular, saatler süren manuel arama yerine 10-30 saniyede yanıtlandı
Veri Ölçeği: Toplamda 2 milyondan fazla satır indekslenmiş 500'den fazla belge ve elektronik tablo işlendi
Düzenleme Doğruluğu: AI tarafından önerilen elektronik tablo düzenlemeleri, zamanın %85'inde değişiklik yapılmadan kabul edildi
Çapraz Referans: Varlık eşleştirme, belgeler arası verileri %92 doğrulukla bağladı
Erişim Hassasiyeti: Vektör araması, ilgili parçacıkları zamanın %94'ünde ilk 5 sonuç içinde döndürdü
Zaman Tasarrufu: Çok belgeli analiz iş akışlarını saatlerden dakikalara indirdi

Teknoloji Yığını

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCRDocument Processing Libraries

caseStudyDetail.more Vaka Çalışmaları

Daha fazla teknik uygulamamızı keşfedin

Document Intelligence

Hibrit Arama ve Çok Biçimli Destekli Yerel-Önce Belge RAG Sistemi

Geliştirici araçları geliştiren bir ekip, birden çok dosya formatını işleyebilen, aranabilir bilgi tabanları oluşturabilen ve Retrieval-Augmented Generation kullanarak doğal dil sorgularını yanıtlayabilen, tamamen yerel, gizliliği koruyan bir belge zekası sistemine ihtiyaç duyuyordu — harici API'lere hiçbir veri göndermeden.

Vaka Çalışmasını Oku
AI Accounting

AI Destekli Fatura İşleme (OCR ve QuickBooks Entegrasyonu ile)

Ayda yüzlerce satıcı faturasını işleyen orta ölçekli bir işletme, fatura verilerini AI/OCR kullanarak otomatik olarak çıkarıp muhasebe ve ödeme takibi için doğrudan QuickBooks'a senkronize ederek manuel veri girişini ortadan kaldırmak istedi.

Vaka Çalışmasını Oku
Video Encoding

İstemci Tarafında Reklam Ekleme (CSAI), SCTE-35 İşaretleyici Ayrıştırma ve Çok Platformlu Oynatıcı Entegrasyonu ile

Bir video akış platformu, sunucu tarafı reklam eklemenin sağlayamadığı tam reklam etkileşimi desteğiyle (tıklanabilir katmanlar, yardımcı banner'lar, atlama düğmeleri) kişiselleştirilmiş, cihaz düzeyinde reklam deneyimleri sunarak web, mobil ve akıllı TV uygulamaları genelinde Client-Side Ad Insertion (CSAI) uygulamasına ihtiyaç duyuyordu.

Vaka Çalışmasını Oku

Sıkça Sorulan Sorular

MicrocosmWorks, belge analizinin farklı yönlerini ele alan uzman aracılarla (örneğin, e-tablolar için bir tablo çıkarma aracısı, anlatı belgeleri için bir metin özetleme aracısı ve birden çok dosyadaki veri noktaları arasındaki ilişkileri tanımlayan bir çapraz referans aracısı gibi) bir çoklu aracı mimarisi tasarladı. Bu iş bölümü, her aracının odaklanmış bir bağlam penceresi içinde çalışması ve alana özgü yönlendirme stratejileri uygulaması nedeniyle, tek bir monolitik LLM çağrısından daha doğru sonuçlar üretir.

Evet, MicrocosmWorks, yapılandırılmış veriyi analiz ajanlarına iletmeden önce formül bağımlılıklarını çözen, özet tablo özetlerini genişleten ve sayfalar arası referansları izleyen bir e-tablo ayrıştırma motoru geliştirdi. Sistem, karmaşık Excel yapılarını LLM'lerin etkili bir şekilde akıl yürütebileceği düzleştirilmiş veri temsillerine dönüştürür ve sayfalar arasındaki ilişkisel bağlamı korur, böylece AI, birden çok sekmedeki verilerin birleştirilmesini gerektiren 'hangi departman Q3 bütçesini aştı' gibi soruları yanıtlayabilir.

MicrocosmWorks, yüklenen tüm belgelerden adlandırılmış varlıkları, sayısal tanımlayıcıları ve tarih referanslarını çıkaran, ardından dosyalar arasında ilgili referansları birbirine bağlayan bir varlık ilişkilendirme hattı uyguladı. Bir kullanıcı bir soru sorduğunda, çapraz referans aracısı bu grafiği dolaşarak birden fazla kaynak belgesinden ilgili verileri çeker ve bir insan analistin saatler sürecek manuel çapraz kontrolünü gerektirecek şekillerde bilgiyi sentezleyen yanıtlar sunar.

MicrocosmWorks sistemi, analiz oturumu başına 500 dosyaya kadar belge gruplarını (e-tablolar için tekil dosya boyutları 100MB'a ve PDF'ler için 50MB'a kadar) işlemek üzere tasarlandı. Büyük belgeler otomatik olarak chunked edilir ve birden fazla agent instance arasında paralel olarak işlenir. Orchestrator, agent çıktılarını bir unified knowledge representation'a dönüştürerek tüm belge setinin tutarlı bir görünümünü korur.

MicrocosmWorks, çoklu ajan belge analiz platformlarını saatlik 30-50 dolar oranında geliştirir. Üretime hazır bir sistem genellikle belge ayrıştırma, ajan orkestrasyonu, çapraz referans tespiti ve kullanıcıya yönelik bir sorgu arayüzü dahil olmak üzere 3-5 aylık bir geliştirme süresi gerektirir. Üretimde sorgu başına maliyet, belge hacmine ve LLM token kullanımına bağlıdır, ancak çoklu ajan mimarileri, tüm belge kümelerini tek bir prompt'a doldurmak yerine, her ajana yalnızca ilgili bağlamı yönlendirerek LLM maliyetlerini aslında azaltır.

İşletmenizi Dönüştürmeye Hazır mısınız?

Zorluklarınıza benzer çözümler uygulamamızın yollarını konuşalım.

İletişime GeçincaseStudyDetail.viewAllCaseStudies