k8s-incident

Name: k8s-incident
Author: rohitg00

autor: rohitg00

Szybka diagnostyka i reagowanie na incydenty Kubernetes — runbooki i narzędzia do naprawy awarii

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: rohitg00
Kategoria: Bezpieczeństwo
Wyświetlenia: 3

Repozytorium GitHub

O skillu

Skill do obsługi incydentów w Kubernetesie z gotowymi runbookami i narzędziami diagnostycznymi. Pomaga zidentyfikować i naprawić awarie podów, problemy z węzłami, niedostępność usług i zaburzenia płaszczyzny kontrolnej. Zawiera 15 narzędzi do szybkiej oceny stanu klastra, zbierania logów, analizy zdarzeń i wdrażania rollbacków. Idealne dla operatorów obsługujących produkcyjne klastry Kubernetes w sytuacjach awaryjnych.

Jak używać

Zainstaluj skill k8s-incident w swoim środowisku Claude/Copilot, wskazując repozytorium rohitg00/kubectl-mcp-server.
Gdy zauważysz problem w klastrze (awaria, pod nie uruchamia się, węzeł niedostępny), poproś Claude o "incident response" — skill automatycznie aktywuje się na słowa kluczowe takie jak "incident", "outage", "emergency" czy "down".
Zacznij od szybkiej kontroli zdrowia klastra: skill uruchomi get_nodes() aby sprawdzić stan węzłów, get_pods(namespace="kube-system") aby zweryfikować płaszczyznę kontrolną, oraz get_events() aby zebrać zdarzenia przed wprowadzeniem zmian.
W zależności od typu incydentu postępuj wg runbooka: dla podów w CrashLoopBackOff użyj get_pod_logs(previous=True) aby zobaczyć poprzednie logi, następnie describe_pod() dla szczegółów; dla węzła niedostępnego sprawdź describe_node(); dla niedostępnej usługi zweryfikuj get_endpoints() i get_network_policies().
Zbieraj zdarzenia i logi zanim wprowadzisz zmiany — skill priorytetyzuje dokumentację przed akcjami naprawczymi, aby zachować ścieżkę audytu.
Jeśli to bezpieczne, użyj rollback_deployment() aby przywrócić poprzednią wersję, lub postępuj wg konkretnego runbooka dla Twojego scenariusza (kontrolna płaszczyzna, zasoby, polityki sieciowe).

Podobne skille

typescript-review

autor: metabase

Automatyczna kontrola kodu TypeScript i JavaScript zgodnie ze standardami projektu

Bezpieczeństwo

17133

python-expert

autor: Shubhamsaboo

Ekspert Pythona – czysty kod, optymalizacja i best practices

Bezpieczeństwo

2777

openapi-spec-generation

autor: wshobson

Generuj specyfikacje OpenAPI 3.1 z kodu i projektów API — dokumentacja zawsze zsynchronizowana

Bezpieczeństwo

18109

windows-ui-automation

autor: martinholovsky

Automatyzuj aplikacje Windows z bezpiecznym dostępem do UI Automation i Win32 API

Bezpieczeństwo

10115

backend-security-coder

autor: sickn33

Bezpieczny kod backendowy – walidacja, autentykacja i ochrona API

Bezpieczeństwo

1133

gmail-manager

autor: jeffvincent

Zarządzaj swoją skrzynką Gmail bezpośrednio z Claude — wysyłaj, czytaj i wyszukuj maile bez opuszczania czatu.

Bezpieczeństwo

17128