incident-response-incident-response
Zautomatyzuj reagowanie na incydenty z praktykami SRE i wieloagentową koordynacją
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do zarządzania incydentami w systemach produkcyjnych. Organizuje wieloagentowe przepływy pracy zgodnie z nowoczesnymi praktykami Site Reliability Engineering (SRE), obejmując fazy: detekcji, śledztwa, komunikacji i rozwiązania. Wspiera klasyfikację zdarzeń po poziomach ważności (P0–P3), automatyzuje kroki mitygacji i wymusza bezzastrzeżeniowe postmortemy. Przydatny dla zespołów DevOps, SRE i inżynierów infrastruktury obsługujących awarie usług, degradacje wydajności i incydenty bezpieczeństwa.
Jak używać
Zainstaluj skill w swoim środowisku agenta (Claude, Copilot lub innym wspieranym systemie) poprzez dodanie repozytorium do konfiguracji agenta.
Przed użyciem zdefiniuj cel incydentu: określ typ zdarzenia (awaria usługi, degradacja wydajności, incydent bezpieczeństwa, problem z integralnością danych), poziom ważności (P0–P3) oraz główne ograniczenia czasowe i zasobowe.
Uruchom skill z opisem incydentu. Agent automatycznie przejdzie przez fazę detekcji i triaży: sklasyfikuje zdarzenie, przypisze poziom ważności i zidentyfikuje typ problemu.
W fazie śledztwa i mitygacji skill przeprowadzi Cię przez kroki diagnostyczne, zaproponuje działania naprawcze i będzie weryfikować wyniki każdego kroku. Utrzymuj jasne kanały komunikacji z zespołem.
Po rozwiązaniu incydentu skill ułatwi przeprowadzenie bezzastrzeżeniowego postmortem — dokumentu, który zamienia każdy incydent w lekcję dla zespołu i wyzwala systematyczne ulepszenia.
W razie potrzeby szczegółowych przykładów i scenariuszy otwórz plik
resources/implementation-playbook.mddołączony do skill'u.