Question 1

Bir RAG pipeline, birden çok belge kaynağından gelen çelişkili bilgileri nasıl ele alır?

Accepted Answer

MicrocosmWorks, RAG pipeline'larında çatışma çözümünü kaynak yetkisi sıralaması, zaman damgasına dayalı güncellik ağırlıklandırması ve her bir alınan pasajın iddiasını ne kadar güçlü desteklediğini değerlendiren güven puanlaması aracılığıyla uygular. Çelişkili pasajlar alındığında, pipeline'ımız en yüksek yetkiye sahip cevabı sunarken, anlaşmazlığı ve kaynak atıflarını şeffaf bir şekilde ortaya koyar, böylece kullanıcılar bilinçli kararlar verebilir. Ayrıca, alan uzmanlarının yanlış çözümleri işaretleyebileceği geri bildirim döngüleri oluştururuz; bu da zamanla alma sıralamasını iyileştirir.

Question 2

Bilgi tabanımız tabloları, kod parçacıklarını ve uzun metin belgelerini içerdiğinde hangi chunking stratejisini kullanmalıyız?

Accepted Answer

MicrocosmWorks, belge yapısına göre farklı stratejiler uygulayan içeriğe duyarlı chunking kullanır—düzyazı için anlamsal paragraf ayırma, başlık bağlamı korunmuş tablolar için satır düzeyinde veya bölüm düzeyinde chunking ve import ifadeleri eklenmiş kod için fonksiyon düzeyinde chunking. Her bir chunk'ı belge başlığı, bölüm hiyerarşisi ve içerik türü dahil olmak üzere meta verilerle zenginleştiriyoruz, böylece geri alma aşaması türe özgü puanlama uygulayabilir. Bu yaklaşım, müşteri projelerimizdeki geri alma alaka düzeyi karşılaştırmalarında basit sabit boyutlu chunking'i %25-40 oranında sürekli olarak geride bırakmaktadır.

Question 3

Bir RAG sistemini üretime dağıtmadan önce doğruluğunu nasıl değerlendirir ve ölçersiniz?

Accepted Answer

MicrocosmWorks, RAG pipeline'larını üç boyutta test eden değerlendirme donanımları geliştirir: geri çağırma alaka düzeyi (doğru parçaların bulunup bulunmadığı), cevap doğruluğu (oluşturulan cevabın gerçekten geri çağrılan içeriği yansıtıp yansıtmadığı) ve cevap eksiksizliği (sorunun tamamını ele alıp almadığı). Etki alanı uzmanlarıyla birlikte, bilinen cevaplı sorguları, düşmanca uç durumları ve çoklu belge sentezi gerektiren soruları içeren altın test setleri oluştururuz. Bu değerlendirme CI/CD'de otomatik olarak çalışır, böylece her pipeline değişikliği dağıtımdan önce temel kalite metriklerine göre kıyaslanır.

Question 4

RAG hattımız için hangi vektör veritabanını kullanmalıyız ve bu seçim ölçekte sorgu gecikmesini nasıl etkiler?

Accepted Answer

MicrocosmWorks, ölçeğiniz, sorgu modeliniz ve operasyonel gereksinimlerinize göre vektör veritabanlarını seçer—yönetilen basitlik için Pinecone, hibrit anahtar kelime-vektör araması için Weaviate, halihazırda PostgreSQL'e yatırım yapmış ekipler için pgvector ve yüksek verimli kendi kendine barındırılan dağıtımlar için Qdrant. 10 milyon vektörün altındaki ölçeklerde, çoğu seçenek 100ms altı gecikme süresi sunar, ancak farklılıklar, index type, quantization ve sharding strategy'nin muazzam önem taşıdığı yüz milyonlarca vektörde önemli hale gelir. Mimari tasarım aşamamızda, gerçek embedding boyutlarınızı ve sorgu modellerinizi kısa listeye alınan seçeneklere karşı kıyaslarız.

Question 5

Kaynak belgeler sık sık güncellendiğinde RAG bilgi tabanını nasıl güncel tutarsınız?

Accepted Answer

MicrocosmWorks, kaynak belge depolarındaki değişiklikleri izleyen, yalnızca değiştirilen bölümleri re-chunk ve re-embed eden ve tam bir reindex gerektirmeden vector store'u güncelleyen artımlı ingestion pipeline'ları kurar. Bölüm düzeyinde içerik değişikliklerini algılayan document fingerprinting uyguluyoruz, böylece tek bir paragraf düzenlemesi 200 sayfalık bir belgenin tamamının yeniden işlenmesini tetiklemez. Gerçek zamanlı güncellik gereksinimleri olan müşteriler için, yakın zamanda değiştirilmiş belgeler için doğrudan kaynak sistemi sorgulayan ve bu sonuçları vector search sonuçlarıyla birleştiren canlı bir retrieval layer ekliyoruz.

Katman	Teknolojiler
Belge Ayrıştırma (Document Parsing)	Unstructured, Apache Tika, LlamaParse, Docling, custom OCR (Tesseract, AWS Textract)
Embedding	OpenAI text-embedding-3-large, Cohere embed-v4, BGE-M3, E5-large-v2
Vector Database	Milvus, Pinecone, Qdrant, Weaviate, pgvector (küçük ölçek için)
Anahtar Kelime Arama (Keyword Search)	Elasticsearch, OpenSearch, PostgreSQL full-text search
Yeniden Sıralama (Reranking)	Cohere Rerank, BGE Reranker, ColBERT v2, FlashRank
LLM	Claude (AI Gateway aracılığıyla), GPT-4, Gemini — AI SDK aracılığıyla sağlayıcıdan bağımsız
Orkestrasyon (Orchestration)	LangChain, LlamaIndex veya özel pipeline (üretim için MW tercihi)

Kullanım Durumu	Kaçınma Durumu
Kullanıcıların, kuruluşunuzun belirli belgelerine dayanan yanıtlara ihtiyacı olduğunda	Bilgi tabanı < 50 sayfa olduğunda — doğrudan sistem prompt'una koyun
Belgeler sık sık güncellendiğinde ve AI'ın güncel bilgilere ihtiyacı olduğunda	Modelin yeni bir beceri/davranış öğrenmesi gerektiğinde, yeni gerçeklere erişmesi değil (bunun yerine fine-tune edin)
Kaynak gösterimi ve denetlenebilirlik gereksinim olduğunda (hukuk, uyumluluk, sağlık)	Sorular tamamen sohbet amaçlı olduğunda ve gerçeklere dayanma gerektirmediğinde
Birden çok kullanıcı grubunun farklı belge alt kümelerine erişmesi gerektiğinde (izinle filtrelenmiş RAG)	Gerçeklere dayalı doğruluğun amaç olmadığı yaratıcı bir yazma aracı oluşturuyorsanız

RAG Boru Hattı Mimarisi

Buna Ne Zaman İhtiyacınız Var?

Related Architecture Patterns

AI/ML İş Akışı Mimarisi

Bu Mimarinin Uygulanmasında Yardıma İhtiyacınız Var mı?

Desenlere Genel Bakış

Referans Mimari

Tasarım Kararları ve Değiş Tokuşlar

Teknoloji Seçimleri

Ne Zaman Kullanmalı / Ne Zaman Kaçınmalı

Yaklaşımımız

İlgili Şablonlar (Blueprints)

İlgili Sektör Rehberleri

İlgili Vaka Çalışmaları

Ölçeklenebilir Vektör Veritabanı Mimarisi

Çok Kiracılı SaaS Mimarisi

Sıkça Sorulan Sorular