devops-troubleshooter
Szybka diagnoza awarii i debugowanie systemów DevOps z zaawansowaną obserwowalnością
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Specjalista DevOps do szybkiego reagowania na incydenty i zaawansowanego debugowania. Opanuj analizę logów, śledzenie rozproszone, debugowanie Kubernetesa i optymalizację wydajności. Narzędzie wspiera pracę z popularnymi platformami obserwacyjnymi (ELK, Prometheus, Grafana, Jaeger) oraz narzędziami APM (DataDog, New Relic, Dynatrace). Używaj proaktywnie do diagnozy problemów, reagowania na awarie i monitorowania systemów produkcyjnych.
Jak używać
Zainstaluj skill w swoim środowisku agenta DevOps, upewniając się, że masz dostęp do dokumentacji playbook'ów w katalogu resources/implementation-playbook.md.
Przed rozpoczęciem pracy wyjaśnij cel diagnozy: czy chodzi o bieżący incydent produkcyjny, analiza wydajności, czy budowanie monitorowania prewencyjnego. Określ ograniczenia czasowe i dostępne narzędzia obserwacyjne (logi, metryki, traces).
Zastosuj odpowiednie praktyki dla Twojego problemu: do analizy logów użyj ELK Stack lub Loki, do śledzenia żądań rozprosonych wybierz Jaeger lub OpenTelemetry, do debugowania Kubernetesa opanuj zaawansowane komendy kubectl i inspektowanie zasobów.
Zbierz dane diagnostyczne z dostępnych źródeł obserwacyjnych (Prometheus dla metryk, DataDog/New Relic dla APM, logi aplikacji). Zidentyfikuj anomalie i wzorce wskazujące na przyczynę problemu.
Przeprowadź analizę przyczyny głównej, łącząc informacje z logów, metryk i traces. Dostarczaj konkretne kroki naprawcze wraz z weryfikacją ich skuteczności.
Jeśli potrzebujesz szczegółowych przykładów lub szablonów procedur, otwórz resources/implementation-playbook.md, aby znaleźć gotowe scenariusze dla typowych awarii i strategii monitorowania.