Toolverse
Wszystkie skille

incident-response-incident-response

autor: sickn33

Zautomatyzuj reagowanie na incydenty z praktykami SRE i wieloagentową koordynacją

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
sickn33
Wyświetlenia
20

O skillu

Skill do zarządzania incydentami w systemach produkcyjnych. Organizuje wieloagentowe przepływy pracy zgodnie z nowoczesnymi praktykami Site Reliability Engineering (SRE), obejmując fazy: detekcji, śledztwa, komunikacji i rozwiązania. Wspiera klasyfikację zdarzeń po poziomach ważności (P0–P3), automatyzuje kroki mitygacji i wymusza bezzastrzeżeniowe postmortemy. Przydatny dla zespołów DevOps, SRE i inżynierów infrastruktury obsługujących awarie usług, degradacje wydajności i incydenty bezpieczeństwa.

Jak używać

  1. Zainstaluj skill w swoim środowisku agenta (Claude, Copilot lub innym wspieranym systemie) poprzez dodanie repozytorium do konfiguracji agenta.

  2. Przed użyciem zdefiniuj cel incydentu: określ typ zdarzenia (awaria usługi, degradacja wydajności, incydent bezpieczeństwa, problem z integralnością danych), poziom ważności (P0–P3) oraz główne ograniczenia czasowe i zasobowe.

  3. Uruchom skill z opisem incydentu. Agent automatycznie przejdzie przez fazę detekcji i triaży: sklasyfikuje zdarzenie, przypisze poziom ważności i zidentyfikuje typ problemu.

  4. W fazie śledztwa i mitygacji skill przeprowadzi Cię przez kroki diagnostyczne, zaproponuje działania naprawcze i będzie weryfikować wyniki każdego kroku. Utrzymuj jasne kanały komunikacji z zespołem.

  5. Po rozwiązaniu incydentu skill ułatwi przeprowadzenie bezzastrzeżeniowego postmortem — dokumentu, który zamienia każdy incydent w lekcję dla zespołu i wyzwala systematyczne ulepszenia.

  6. W razie potrzeby szczegółowych przykładów i scenariuszy otwórz plik resources/implementation-playbook.md dołączony do skill'u.

Podobne skille