Toolverse
Wszystkie skille

posthog-incident-runbook

autor: jeremylongshore

Szybka odpowiedź na incydenty PostHog — triage, mitygacja i postmortem w jednym miejscu.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Umiejętność do automatycznego reagowania na awarie i problemy integracji PostHog. Zawiera drzewo decyzyjne triage'u, procedury dla błędów 401/429/500, strategie graceful degradation oraz zbieranie dowodów do postmortem. Uruchamiasz ją frazami takimi jak "posthog incident", "posthog outage" czy "posthog down". Narzędzie najpierw sprawdza, czy problem leży po stronie PostHog Cloud (status.posthog.com), czy w Twojej integracji, następnie prowadzi Cię przez kroki triage'u, oceny poziomu ważności (P1–P4) i zbierania informacji diagnostycznych potrzebnych do rozwiązania problemu.

Jak używać

  1. Zainstaluj umiejętność w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Grep, Bash z uprawnieniami kubectl i curl.

  2. Uruchom umiejętność, gdy podejrzewasz problem z PostHog — użyj jednej z fraz wyzwalających: "posthog incident", "posthog outage", "posthog down", "posthog on-call", "posthog emergency" lub "posthog broken production".

  3. Pozwól narzędziu wykonać szybki triage: sprawdzi dostępność PostHog Cloud (endpoint healthz), możliwość przechwytywania zdarzeń (capture endpoint) oraz ewaluacji flag funkcji (flag evaluation endpoint). Wyniki pokażą, czy problem jest po stronie PostHog czy Twojej aplikacji.

  4. Na podstawie wyniku triage'u narzędzie zaklasyfikuje incydent do poziomu ważności (P1 do P4) i zasugeruje czas odpowiedzi — od poniżej 15 minut dla P1 (analytics całkowicie niedostępny) do następnego dnia dla P4 (brak wpływu na użytkowników).

  5. Postępuj zgodnie z procedurami mitygacji dla konkretnego błędu (401 — problem z API key, 429 — rate limiting, 500 — błąd serwera) i zbieraj dowody diagnostyczne (logi, żądania curl, statusy HTTP).

  6. Po rozwiązaniu problemu użyj zebranych danych do postmortem — przeanalizuj przyczynę, zidentyfikuj luki w monitorowaniu i zaplanuj działania zapobiegawcze.

Podobne skille