Toolverse
Wszystkie skille

devops-troubleshooter

autor: sickn33

Szybka diagnoza awarii i debugowanie systemów DevOps z zaawansowaną obserwowalnością

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
sickn33
Kategoria
DevOps
Wyświetlenia
1

O skillu

Specjalista DevOps do szybkiego reagowania na incydenty i zaawansowanego debugowania. Opanuj analizę logów, śledzenie rozproszone, debugowanie Kubernetesa i optymalizację wydajności. Narzędzie wspiera pracę z popularnymi platformami obserwacyjnymi (ELK, Prometheus, Grafana, Jaeger) oraz narzędziami APM (DataDog, New Relic, Dynatrace). Używaj proaktywnie do diagnozy problemów, reagowania na awarie i monitorowania systemów produkcyjnych.

Jak używać

  1. Zainstaluj skill w swoim środowisku agenta DevOps, upewniając się, że masz dostęp do dokumentacji playbook'ów w katalogu resources/implementation-playbook.md.

  2. Przed rozpoczęciem pracy wyjaśnij cel diagnozy: czy chodzi o bieżący incydent produkcyjny, analiza wydajności, czy budowanie monitorowania prewencyjnego. Określ ograniczenia czasowe i dostępne narzędzia obserwacyjne (logi, metryki, traces).

  3. Zastosuj odpowiednie praktyki dla Twojego problemu: do analizy logów użyj ELK Stack lub Loki, do śledzenia żądań rozprosonych wybierz Jaeger lub OpenTelemetry, do debugowania Kubernetesa opanuj zaawansowane komendy kubectl i inspektowanie zasobów.

  4. Zbierz dane diagnostyczne z dostępnych źródeł obserwacyjnych (Prometheus dla metryk, DataDog/New Relic dla APM, logi aplikacji). Zidentyfikuj anomalie i wzorce wskazujące na przyczynę problemu.

  5. Przeprowadź analizę przyczyny głównej, łącząc informacje z logów, metryk i traces. Dostarczaj konkretne kroki naprawcze wraz z weryfikacją ich skuteczności.

  6. Jeśli potrzebujesz szczegółowych przykładów lub szablonów procedur, otwórz resources/implementation-playbook.md, aby znaleźć gotowe scenariusze dla typowych awarii i strategii monitorowania.

Podobne skille