MicrocosmWorksDijital Kozmosu Yenilikçi ve Mimari Olarak Tasarlamak
Hakkındaİletişim
MicrocosmWorksDijital Kozmosu Yenilikçi ve Mimari Olarak İnşa Etmek

Önemli BT çözümleri sunuyoruz. Teknoloji, güvenlik ve işletmelerin güvenilir, yenilikçi BT altyapısı ile büyümesine yardımcı olmaktan tutkuluyuz.

[email protected]
+91 7011868196
New Delhi, India

AI Büyüme Merkezi

AI MerkeziStartup İnovasyonuKurumsal Hızlandırıcı

Çözümler

Tüm ÇözümlerSağlık ve Fitness UygulamalarıAI Video PlatformuAI Ajan Geliştirme

Kaynaklar

ÖngörülerSektör RehberleriKullanım Durumu ŞablonlarıMimari KalıplarVaka Çalışmaları

Şirket

HakkımızdaİletişimÇalışmalarımız

Hizmetler

Dijital DanışmanlıkBulut AltyapısıSaaS GeliştirmeYapay Zeka GeliştirmeVideo Teknolojisi
ERP GeliştirmeZoho ÖzelleştirmeOdoo GeliştirmeSalesforce EntegrasyonuÖzel CRM Geliştirme
QuickBooks EntegrasyonuIoT ÇözümleriBlokzincir Geliştirme
Siber Güvenlik DanışmanlığıIT Desteği - L3

© 2026 MicrocosmWorks. Tüm hakları saklıdır.

Gizlilik PolitikasıHizmet Şartları
Mimari Desenlere Geri Dön
AI / DataEnterprise

AI/ML İş Akışı Mimarisi

Modeller kendi başlarına çalışmaz. Modellerinizi eğiten, doğrulayan, dağıtan ve izleyen iş akışı asıl üründür; model sadece bir eserdir.

June 22, 2026
|
3 topics covered
Bu Mimariyi Tartışın
ai-ml-pipeline-architecture.webp
AI / Data
Category
Enterprise
Complexity
Sağlık Hizmetleri, Finansal Hizmetler
Industries
3+
Technologies

Buna Ne Zaman İhtiyacınız Var?

Bir ML modelinin bir notebook'ta çalıştığını kanıtladınız. Şimdi bunu üretimde kullanmanız gerekiyor; tahminleri ölçekli olarak sunmak, yeni veriler üzerinde yeniden eğitmek, kaymayı (drift) izlemek ve yeni bir model mevcut olandan daha kötü performans gösterdiğinde geri almak. Çalışan bir prototip ile üretim ML sistemi arasındaki boşluk çok büyüktür. Veri alımını, özellik mühendisliğini, eğitimi, doğrulamayı, dağıtımı ve izlemeyi tekrarlanabilir, otomatik bir süreç olarak ele alan bir iş akışına ihtiyacınız var. Bu olmadan, "AI ürününüz" bir veri bilimcinin her hafta manuel olarak yeniden çalıştırdığı bir notebook'tur.

Related Architecture Patterns

Explore more design patterns and system architectures

scalable-vector-database-architecture.webp
AI / Data

Ölçeklenebilir Vektör Veritabanı Mimarisi

10 bin vektörde gömme araması kolaydır. 100 milyon vektörde, 100 ms'nin altında P99 ile bu bir altyapı sorunudur — ve bu kalıp bunu çözüyor.

EnterpriseView
rag-pipeline-architecture.webp

Bu Mimarinin Uygulanmasında Yardıma İhtiyacınız Var mı?

Mimarlarımız, bu deseni kullanarak belirli gereksinimleriniz için sistemler tasarlamanıza ve oluşturmanıza yardımcı olabilir.

İletişime Geçin

Desenlere Genel Bakış

AI/ML iş akışı mimarisi, ML yaşam döngüsünü ayrı, otomatikleştirilmiş aşamalara ayırır: veri alımı ve doğrulama, özellik mühendisliği ve depolama, model eğitimi ve hyperparameter ayarı, model değerlendirme ve doğrulama, model sunumu ve çıkarımı (inference) ile sürekli izleme. Her aşama sürümlü, tekrarlanabilir ve gözlemlenebilirdir. Mimari hem batch (planlı yeniden eğitim) hem de online (gerçek zamanlı özellik hesaplama) iş akışlarını destekler. Bir feature store, özellik mühendisliğini model eğitiminden ayırarak modeller arasında özellik yeniden kullanımını ve eğitim ile sunum arasında tutarlı özellikler sağlar.

Referans Mimari

İş akışı, veri kaynaklarından (veritabanları, API'ler, olay akışları) geçerek, özellikleri bir feature store'da (sunum için online, eğitim için offline) hesaplayan ve depolayan bir özellik mühendisliği katmanından ilerler. Bir eğitim orchestrator'ı deneyler yapar, parametreleri ve metrikleri kaydeder ve bir model registry'de depolanan sürümlü model artefaktları üretir. Bir dağıtım iş akışı, otomatikleştirilmiş canary değerlendirmesi ile modelleri staging'den üretime taşır. Model sunumu, A/B testi desteğiyle bir load balancer'ın arkasında çalışır. Bir izleme katmanı, yeniden eğitimi tetiklemek için tahmin kaymasını (prediction drift), veri kaymasını (data drift) ve iş metriklerini izler.

Temel Bileşenler
  • Feature Store: Eğitim için offline bir bileşen (S3 üzerinde Parquet/Delta Lake) ve düşük gecikmeli sunum için online bir bileşen (Redis/DynamoDB) içeren çift modlu bir depolama. Özellikler bir kez tanımlanır ve hem eğitim hem de çıkarım için tutarlı bir şekilde hesaplanır, bu da çoğu üretim ML hatasına neden olan eğitim-sunum çarpıklığını ortadan kaldırır.
  • Training Orchestrator: Deney takibi (MLflow, W&B), hyperparameter optimizasyonu (Optuna, Ray Tune) ve büyük modeller için dağıtılmış eğitim (PyTorch DDP, Horovod) ile eğitim süreçlerini yönetir. Meta veriler (eğitim verisi hash'i, hyperparameters, metrikler) içeren sürümlü model artefaktları üretir.
  • Model Registry ve Dağıtım: Model sürümlerini, onay durumunu ve dağıtım geçmişini izleyen merkezi bir registry (MLflow Model Registry, SageMaker Model Registry). Canary rollout ve otomatik geri alma özellikleriyle modelleri konteyner olarak (TorchServe, Triton, özel Flask/FastAPI) dağıtan bir CI/CD iş akışı.
  • İzleme ve Drift Algılama: Girdi verisi dağılımını (data drift), tahmin dağılımını (prediction drift) ve iş metriklerini (dönüşüm oranı, etiketli örneklerdeki doğruluk) izler. Kayma eşikleri aştığında otomatik uyarılar ve isteğe bağlı otomatik yeniden eğitim tetikleyicileri sağlar.

Tasarım Kararları ve Takaslar

Feature Store: Kendin Yap mı, Satın Al mı? Feast (açık kaynak), yeni başlayan ve temel online/offline özellik sunumuna ihtiyaç duyan ekipler için uygundur. Yönetilen altyapı ve anlık doğruluk garantileri gerektiren ekipler için Tecton veya SageMaker Feature Store. MW, çoğu proje için Feast'i önermektedir; her yere dağıtılabilir, vendor lock-in'i önler ve %80'lik kullanım durumunu karşılar. Özellik mühendisliği karmaşıklığı veya ekip büyüklüğü gerektirdiğinde yönetilen seçeneklere geçiş yaparız. Batch Yeniden Eğitim mi, Online Öğrenme mi? Batch yeniden eğitim (planlı, tüm iş akışının yeniden çalıştırılması) daha basittir, hata ayıklaması yapılabilir ve dünyanın yavaş değiştiği (haftalık/aylık) çoğu kullanım durumu için yeterlidir. Online öğrenme (her yeni veri noktasıyla model güncellemeleri) yalnızca dağılımın hızla değiştiği durumlarda (sahtekarlık tespiti, gerçek zamanlı öneri) gereklidir. MW, varsayılan olarak planlı iş akışlarıyla batch yeniden eğitimi kullanır ve online öğrenmeyi yalnızca dünya değişimi ile model güncellemesi arasındaki gecikme ölçülebilir bir iş problemi olduğunda ekler. Model Sunumu: Gerçek Zamanlı mı, Batch Çıkarım mı? Kullanıcıya yönelik tahminler için (öneriler, sınıflandırma, NLP) gerçek zamanlı sunum (REST/gRPC endpoint, <100ms gecikme). Dahili analizler, risk puanlaması veya ön hesaplama için batch çıkarım (bir veri kümesini puanlayan planlı bir iş). MW, sunum altyapısını ortalama yüke göre değil, P99 gecikme gereksinimlerine ve işlem hacmine göre boyutlandırır; ML sunumu yüksek varyansa sahiptir. Çıkarım için GPU mu, CPU mu? CPU çıkarımı, çoğu model için (gradient-boosted trees, küçük neural networks, geleneksel NLP) daha ucuz ve ölçeklendirmesi daha basittir. GPU paralelliğinin batch işleme avantajının maliyeti haklı çıkardığı büyük modeller (LLMs, computer vision, speech-to-text) için GPU çıkarımı. MW, her ikisinde de çıkarım gecikmesini profiller ve ekonomik bir durum değerlendirmesi yapar; birçok ekip varsayılan olarak GPU çıkarımına geçer ve 5 kat fazla harcama yapar.

Teknoloji Seçimleri

KatmanTeknolojiler
EğitimPyTorch, TensorFlow, scikit-learn, XGBoost, Hugging Face Transformers
OrchestrationKubeflow, SageMaker Pipelines, Airflow, Prefect, Dagster
Feature StoreFeast, Tecton, SageMaker Feature Store
Model SunumuTorchServe, Triton Inference Server, SageMaker Endpoints, FastAPI
Deney TakibiMLflow, Weights & Biases, Neptune
İzlemeEvidently AI, WhyLabs, özel Prometheus metrikleri

Ne Zaman Kullanmalı / Ne Zaman Kaçınmalı

Ne Zaman KullanmalıNe Zaman Kaçınmalı
Üretimde düzenli olarak yeniden eğitime ihtiyaç duyan ML modelleriniz varsaML'in sorunu çözüp çözmediğini hâlâ araştırıyorsanız; notebook'larla başlayın
Birden çok modelin özellikleri paylaştığı ve tutarlı özellik mühendisliğine ihtiyaç duyduğu durumlardaÜç ayda bir yeniden eğitilen tek bir modeliniz varsa; bir script ve cron işi yeterli olabilir
Sürümlü veri, kod ve modellerle tekrarlanabilir eğitime ihtiyacınız varsaML bileşeni, barındırılan bir LLM'e tek bir API çağrısıysa (bunun yerine AI SDK kalıplarını kullanın)
Model performans düşüşü iş metriklerini doğrudan etkiliyorsaEkibin iş akışını yönetecek ML mühendisliği becerileri yoksa

Yaklaşımımız

MW, ML iş akışlarını "üretim öncelikli" bir yaklaşımla geliştirir; modeli optimize etmeden önce sunum ve izleme altyapısıyla başlarız. Sağlam bir iş akışındaki vasat bir model, bir notebook'taki harika bir modeli yener. İş akışlarımız, otomatik veri doğrulaması (Great Expectations), eğitim-sunum çarpıklığı testleri, shadow mode dağıtımı (yeni model trafik alır ancak sonuçları sunmaz) ve metrik düşüşlerinde otomatik geri alma ile kademeli dağıtımı içerir. Sağlık, fintech ve computer vision alanlarında günde 50M'dan fazla tahmini işleyen iş akışları dağıttık.

İlgili Planlar

  • AI Tıbbi Kayıt Asistanı — Tıbbi belge anlama için NLP iş akışı
  • AI Kod İnceleme ve QA Aracısı — Kod analizi ve hata tahmini için ML modelleri
  • AI Uyum İzleme Aracısı — Düzenleyici veri akışları üzerinde sürekli model çıkarımı
  • Kalite Kontrol Otomasyonu — Üretim hatası tespiti için computer vision iş akışı
  • AI Destekli Tıbbi Görüntüleme Analizi — DICOM entegrasyonu ile tıbbi görüntüleme çıkarımı

İlgili Vaka Çalışmaları

  • AI Gözetim Sistemi — Model versiyonlaması ile gerçek zamanlı computer vision çıkarım iş akışı
  • Video Analizi — Nesne takibi ve aktif konuşmacı tespiti ML iş akışları
  • Sağlık ve Zindelik AI — Sağlık koçluğu önerileri için çoklu aracı ML sistemi
Related Technologies
AI GeliştirmeBulut ÇözümleriDijital Danışmanlık
AI / Data

RAG Boru Hattı Mimarisi

LLM'nize özel ayarlama yapmadan verilerinize erişim sağlayın. RAG, genel amaçlı dil modelleri ile alana özel bilgi arasındaki boşluğu doldurur.

AdvancedView
multi-tenant-saas-architecture.webp
Application

Çok Kiracılı SaaS Mimarisi

Tek bir kod tabanı, yüzlerce kiracı, sıfır veri sızıntısı — her ölçeklenebilir SaaS işinin temeli.

AdvancedView

Sıkça Sorulan Sorular

MicrocosmWorks, her model sürümünü eğitim verisi snapshot'ı, hyperparameters ve değerlendirme metrikleriyle birlikte takip eden MLflow veya Weights & Biases gibi araçları kullanarak bir model registry pattern uygular. Dağıtım pipeline'larımız, yeni bir modelin trafiğin küçük bir yüzdesine hizmet verdiği, temel performans göstergelerini izlerken, doğruluk veya latency tanımlı eşiklerin ötesinde bozulursa otomatik rollback tetikleyicileriyle canary release'leri destekler. Bu, kötü performans gösteren bir modelin kullanıcılarınızın kontrol edilen bir kısmından fazlasını asla etkilememesini sağlar.

MicrocosmWorks, ML ardışık düzenlerini, ayrı eğitim ve sunum altyapılarını bir artifact store aracılığıyla bağlayarak tasarlar; böylece yeniden eğitim işleri, üretim çıkarım uç noktalarıyla kaynaklar için rekabet etmeden geçici GPU kümelerinde çalışır. Veri kayması tespiti veya sabit programlarda yeniden eğitimi tetiklemek için Kubeflow Pipelines veya Apache Airflow gibi orkestrasyon araçları kullanırız; bu araçlar, yeniden eğitilmiş bir modeli ancak mevcut sürümden daha iyi performans gösterirse üretime geçiren otomatik doğrulama geçitlerine sahiptir. Bu mimari, modellerinizin herhangi bir sunum kesintisi olmadan sürekli olarak gelişmesini sağlar.

MicrocosmWorks, her üretim ML pipeline'ına kayma tespitini, özellik dağılımları için Kolmogorov-Smirnov testi gibi istatistiksel testler ve gerçek doğruluk etiketleri (ground truth labels) kullanılabilir hale geldikçe tahmin doğruluğunu takip eden performans izleme panoları (dashboards) kullanarak entegre eder. Kayma yapılandırılmış eşikleri aştığında, pipeline'ımız en son verilerle otomatik olarak yeniden eğitimi (retraining) tetikler veya kayma deseni beklenmedikse manuel inceleme için ekibi uyarır. Bu proaktif yaklaşım, model bozulmasını aşağı akış iş metrikleri (downstream business metrics) aracılığıyla fark edilmesinden haftalar önce tespit eder.

MicrocosmWorks, ekiplerin saatlik 15-45 dolar olarak ücretlendirildiği uçtan uca ML hatları kurar. Veri alımı, feature engineering, eğitim orkestrasyonu, model kayıt ve serving infrastructure'ı kapsayan tipik bir üretim hattı, veri karmaşıklığına ve uyumluluk gereksinimlerine bağlı olarak 10-20 hafta sürer. Eğitim iş yükleri için spot instance'lar kullanarak ve gerçek inference talebine göre auto-scaling ile serving infrastructure'ı doğru boyutlandırarak maliyetleri düşürüyoruz. Her proje, tam inşa başlamadan önce ayrıntılı bir mimari planı ve maliyet tahmini üreten 2 haftalık bir discovery sprint'i ile başlar.

MicrocosmWorks, her eğitim çalıştırması için kod sürümlerini, veri kümesi hash'lerini, ortam yapılandırmalarını, random seed'leri ve hiperparametreleri otomatik olarak yakalayan bir deney takip altyapısı kurarak, geçmişteki herhangi bir deneyi aylar sonra tamamen tekrarlanabilir hale getirir. Eğitim ortamlarını sabitlenmiş bağımlılık sürümleriyle kapsayıcıya alırız ve veri kümelerini kod değişiklikleriyle eş zamanlı olarak sürümlemek için Git ile birlikte DVC'yi (Data Version Control) kullanırız. Bu, bir veri bilimcisinin makinesinde çalışan ancak ekip tarafından tekrarlanamayan sonuçların ortaya çıkardığı yaygın sorunu ortadan kaldırır.