Appearance
Monitoring & Observability Pratik Sınavları
Prometheus, Grafana, Alertmanager ve log/trace korelasyonu odaklı senaryolar. İki set, karışık zorluk.
📡 Örnek Set 1
Prometheus Kardinalite: Label patlamasını önlemek için hangisinden kaçınmalı?
A)status_code
B)user_id✅
C)instance
D)jobHistogram Kullanımı: P95 latency için doğru fonksiyon?
A)avg_over_time
B)histogram_quantile(0.95, sum by (le) (rate(bucket[5m])))✅
C)sum(rate(...))
D)increaseAlert Fatigue: Gürültüyü azaltmak için ilk adım?
A) Tüm alarmları kapatmak
B) Gruplama ve sustain/silence pencereleri ayarlamak, aksiyon alınabilir kriterler ✅
C) Severity'yi critical yapmak
D) Polling süresini kısaltmakAlertmanager Inhibit: Critical varken warning'i bastırmak için?
A) repeat_interval=0
B) inhibit_rules ile severity=critical → warning aynı alertname ✅
C) Slack kanalını kapat
D) route silRunbook: En iyi pratik?
A) Alert açıklamasınarunbook_urleklemek ✅
B) E-posta ile göndermek
C) PDF paylaşmak
D) Sadece log tutmakBlackbox Exporter: HTTP 200 kontrolü nereden yapılır?
A) Hedef uygulamadan
B) Blackbox exporter probe HTTP/ICMP/TCP endpoint ✅
C) Alertmanager
D) Grafana paneliGrafana Alerting: Notification policy ile ne yapılır?
A) Panel silme
B) Uyarıları hedef kanala yönlendirme, zamanlama/filtreleme ✅
C) Cache açma
D) Datasource şifrelemekLog-Korelasyon: Mikroservis gecikmesini log + trace ile incelemek için ilk adım?
A) Plain text log
B) Structured JSON log + trace/correlation-id taşıma ✅
C) Logu kapatmak
D) Sadece metrics
📡 Örnek Set 2
Prometheus HA: İki Prometheus'un aynı alerti çift göndermesini önlemek için?
A) Alertmanager cluster/mesh deduplikasyonu ✅
B) Single instance
C) Pushgateway
D) Kardinaliteyi artırmakRemote Write Kullanımı: Ne zaman tercih edilir?
A) Kısa süreli POC
B) Uzun vadeli saklama veya merkezi toplama gerektiğinde ✅
C) Lokal disk yeterliyse
D) Yalnızca tracing içinRecording Rule Amaç:
A) Logları sıkıştırmak
B) Sık sorulan veya ağır sorguları önceden hesaplayarak hızlandırmak ✅
C) Alert kapatmak
D) Kardinaliteyi artırmakGrafana Annotations: Ne için kullanılır?
A) Alert susturma
B) Zaman çizelgesine deploy/incident gibi olay eklemek ✅
C) Dashboard silmek
D) Datasource eklemekLoki Maliyet: Yüksek ingest ve retention için ilk önlem?
A) Indekslemeyi artır
B) Label sayısını düşür, gereksiz logu filtrele, daha uzun için arşiv/maliyet katmanı kullan ✅
C) Logu kapat
D) RAM'i artırTempo/Tracing Sampling: Neden yapılır?
A) Gecikme artırmak için
B) Maliyet ve hacmi kontrol etmek, kritik istekleri tutarken gürültüyü azaltmak ✅
C) Trace'i silmek
D) Logu kapatmakAlert Seviyeleri: Availability SLO düşüyorsa hangi metrik öncelik?
A) Saturation
B) Error rate (5xx/failed requests) ✅
C) Disk inode
D) Log satırıService Discovery: Dinamik hedeflerde statik konfig yerine ne yapılır?
A) Tek tek IP yazmak
B) K8s/Consul/EC2 SD ve relabeling ✅
C) DNS kapatmak
D) IP'yi hardcode etmek