conducting-chaos-engineering
Testuj odporność systemów poprzez kontrolowane scenariusze awarii
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność Claude'a do projektowania i przeprowadzania eksperymentów chaos engineering. Pomagam Ci symulować rzeczywiste awarie, testy wstrzykiwania błędów, opóźnienia sieciowe i wyczerpanie zasobów. Wykorzystuję narzędzia takie jak Chaos Mesh, Gremlin, Toxiproxy i AWS FIS, aby zidentyfikować słabe punkty systemu i zaproponować ulepszenia mechanizmów odporności, takich jak circuit breaker czy logika retry.
Jak używać
Opisz swój system i cele testowania — powiedz mi, jaką usługę chcesz testować i jakie scenariusze awarii Cię interesują (np. symulacja opóźnień, wyczerpanie zasobów, przerwy w połączeniu).
Wspólnie definiujemy zakres eksperymentu — określamy docelowy komponent, typ awarii oraz metryki, które będziemy monitorować podczas testu.
Wybieram odpowiednie narzędzie — na podstawie Twojego środowiska (Kubernetes, AWS, lokalne) rekomenduje Chaos Mesh, Gremlin, Toxiproxy lub AWS FIS.
Pomagam skonfigurować eksperyment — przygotowuję konfigurację, skrypty lub parametry potrzebne do uruchomienia testu w Twoim systemie.
Monitorujemy zachowanie systemu — obserwujemy, jak system reaguje na symulowane awarie, zbierając dane o wydajności i błędach.
Analizuję wyniki i daję rekomendacje — identyfikuję odkryte słabe punkty i proponuję konkretne ulepszenia mechanizmów odporności, takich jak timeout'y, retry'e lub failover'y.