Question 1

Parti iş yükleri için her zaman açık altyapıya kıyasla açma-kapama ölçeklendirme bulut maliyetlerini ne kadar azaltabilir?

Accepted Answer

Parti yoğun veya periyodik iş yüklerine sahip MicrocosmWorks müşterileri, açma-kapama ölçeklendirmeyi uyguladıktan sonra genellikle %60-80 oranında bulut maliyeti düşüşü görür, çünkü bilgi işlem kaynakları 7/24 çalışmak yerine yalnızca aktif işlem pencerelerinde çalışır. Ölçeklendirme politikalarını gerçek kullanım telemetrisine göre tasarlarız; örneğin, günde 4 saat çalışan bir veri işleme hattı, tam 24 saat yerine yalnızca bu 4 saatin ücretini öder. Mimarlarımız, herhangi bir uygulamanın başlamasından önce kesin tasarrufları tahmin etmek için keşif aşamasında iş yükü modellerinizi analiz eder.

Question 2

Açma-kapama ölçeklendirme için soğuk başlangıç cezası nedir ve MicrocosmWorks bunu nasıl en aza indirir?

Accepted Answer

Soğuk başlangıç süreleri, önceden ısıtılmış düğüm havuzlarındaki kapsayıcılı uygulamalar için 2-3 saniyeden, özel GPU örnekleri veya büyük model yüklemesi gerektiren iş yükleri için 5-10 dakikaya kadar değişir ve MicrocosmWorks bu gecikmeyi en aza indirmek için çeşitli teknikler kullanır. Geçmiş trafik modellerini ve planlanmış olayları kullanarak beklenen talepten önce kaynakları devreye sokan öngörücü ölçeklendirme uyguluyoruz ve gecikmeye duyarlı iş yükleri için kapsayıcı görüntüsü önceden çekme (pre-pulling) ve sıcak havuz rezervasyonları kullanıyoruz. Hiçbir soğuk başlangıcı tolere edemeyen uygulamalar için, talep geldiğinde agresif bir şekilde ölçeklenen minimum sıcak bir taban hattı sürdürüyoruz.

Question 3

Öngörülemeyen trafik artışlarına sahip uygulamalar için açma-kapama ölçeklendirme nasıl çalışır?

Accepted Answer

MicrocosmWorks, kuyruk derinliği, CPU kullanımı veya özel uygulama metrikleri tarafından tetiklenen agresif ölçeklendirme politikalarına sahip reaktif otomatik ölçeklendirme uygular ve bu politikalar, aşırı yüklenmeyi (thrashing) önlemek için bekleme sürelerini içeren daha kademeli ölçeklendirme politikalarıyla birleştirilir. Ölçeklendirme olayları sırasında aşırı sağlama (over-provisioning) tamponları yapılandırırız, böylece sistem talebi tek tek örneklerle kovalamak yerine sürekli büyümeyi tahmin eder. Flaş satışlar veya viral olaylar gibi gerçekten öngörülemeyen ani artışlar için, pazarlama veya operasyon takviminizden gelen olay odaklı tetikleyicileri kullanarak kapasiteyi önceden sağlarız.

Question 4

Açma-kapama ölçeklendirme veritabanlarına uygulanabilir mi, yoksa yalnızca durum bilgisi olmayan (stateless) bilgi işlem için mi pratiktir?

Accepted Answer

MicrocosmWorks, boşta kalma sürelerinde bilgi işlemi sıfıra ölçeklendirirken depolamayı kalıcı ve anında erişilebilir tutan Aurora Serverless, Neon veya PlanetScale gibi sunucusuz veritabanı tekliflerini kullanarak veritabanlarına açma-kapama ölçeklendirmesi uygular. Sunucusuz veritabanlarını kullanamayan durum bilgisi olan (stateful) iş yükleri için, sorgu yüküne göre replikalar ekleyip çıkaran ve minimum bir birincil örneği her zaman çalışır durumda tutan okuma replikası ölçeklendirmesi uyguluyoruz. Bu hibrit yaklaşım, istemcilere veri katmanları için ölçeklendirmenin maliyet faydalarını, kapatma ve yeniden başlatma döngüleri sırasında veritabanı durumunu yönetmenin karmaşıklığı olmadan sunar.

Question 5

MicrocosmWorks, açma-kapama ölçeklendirmesinin kesintilere neden olmamasını sağlamak için hangi izleme ve uyarı sistemlerini kurar?

Accepted Answer

MicrocosmWorks, Grafana veya Datadog panolarını kullanarak örnek sayılarını, ölçeklendirme olayı gecikmesini, başarısız ölçeklendirme girişimlerini ve istenen ile gerçek kapasite arasındaki farkı gerçek zamanlı olarak izleyen kapsamlı ölçeklendirme gözlemlenebilirliği dağıtır. Ölçeklendirme hataları, ölçeklendirme tavanının çok düşük olduğunu düşündüren sürekli yüksek kullanım ve kontrol dışı ölçeklendirmeyi gösteren maliyet anormallikleri için çok kanallı uyarılar yapılandırırız. Runbooklarımız, bulut sağlayıcısı örnek limitlerine ulaşma veya belirli kullanılabilirlik bölgelerinde yetersiz kapasite hatalarıyla karşılaşma gibi yaygın hata modları için otomatik düzeltmeleri içerir.

Katman	Teknolojiler
Hesaplama	AWS EC2 Spot (G5/P4), GCP Preemptible (A2/L4), RunPod Serverless, Modal
Orkestrasyon	Kubernetes (Karpenter for autoscaling), AWS Batch, custom job orchestrator
İş Kuyruğu	AWS SQS, BullMQ (Redis), Temporal, Celery
Depolama	S3 (checkpoints, model artifacts), NVMe (model cache), EFS (shared workspace)
İzleme	CloudWatch/Prometheus (queue depth, instance utilization, job latency), custom cost dashboards

Ne Zaman Kullanılmalı	Ne Zaman Kaçınılmalı
İş yükü ani artışlar gösteriyorsa — pik talep ortalama talebin 5 katı veya daha fazlasıysa	Trafik sabit ve öngörülebilirse — doğru boyutlandırılmış ayrılmış örnekler daha ucuzdur
Boşta dururken maliyetli olan GPU/yüksek hesaplama işleri	İş yükü sunucusuz (Lambda) için uygun, hafif CPU işleme ise
İşler, soğuk havuz kaynak sağlaması için 1-5 dakikalık soğuk başlatmaya tahammül edebiliyorsa	Saniye altı iş başlatma gecikmesi gerekiyorsa — sürekli açık altyapıya ihtiyacınız var demektir
Maliyet optimizasyonu birincil endişe kaynağı ise ve spot fiyatlandırma %60-90 tasarruf sunuyorsa	Spot kesintisi, denetim noktası kaydının gideremeyeceği veri kaybına neden olacaksa

Açma-Kapama Ölçeklendirme Mimarisi

Ne Zaman İhtiyaç Duyarsınız

Related Architecture Patterns

Buluta Özel Altyapı

Bu Mimarinin Uygulanmasında Yardıma İhtiyacınız Var mı?

Desenlere Genel Bakış

Referans Mimari

Tasarım Kararları ve Takaslar

Teknoloji Seçimleri

Ne Zaman Kullanılmalı / Ne Zaman Kaçınılmalı

Yaklaşımımız

İlgili Taslaklar

İlgili Vaka Çalışmaları

Önce Güvenlik Mimarisi

Sunucusuz Odaklı Mimari

Sıkça Sorulan Sorular