Toolverse
Wszystkie skille

conducting-chaos-engineering

autor: jeremylongshore

Testuj odporność systemów poprzez kontrolowane scenariusze awarii

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Umiejętność Claude'a do projektowania i przeprowadzania eksperymentów chaos engineering. Pomagam Ci symulować rzeczywiste awarie, testy wstrzykiwania błędów, opóźnienia sieciowe i wyczerpanie zasobów. Wykorzystuję narzędzia takie jak Chaos Mesh, Gremlin, Toxiproxy i AWS FIS, aby zidentyfikować słabe punkty systemu i zaproponować ulepszenia mechanizmów odporności, takich jak circuit breaker czy logika retry.

Jak używać

  1. Opisz swój system i cele testowania — powiedz mi, jaką usługę chcesz testować i jakie scenariusze awarii Cię interesują (np. symulacja opóźnień, wyczerpanie zasobów, przerwy w połączeniu).

  2. Wspólnie definiujemy zakres eksperymentu — określamy docelowy komponent, typ awarii oraz metryki, które będziemy monitorować podczas testu.

  3. Wybieram odpowiednie narzędzie — na podstawie Twojego środowiska (Kubernetes, AWS, lokalne) rekomenduje Chaos Mesh, Gremlin, Toxiproxy lub AWS FIS.

  4. Pomagam skonfigurować eksperyment — przygotowuję konfigurację, skrypty lub parametry potrzebne do uruchomienia testu w Twoim systemie.

  5. Monitorujemy zachowanie systemu — obserwujemy, jak system reaguje na symulowane awarie, zbierając dane o wydajności i błędach.

  6. Analizuję wyniki i daję rekomendacje — identyfikuję odkryte słabe punkty i proponuję konkretne ulepszenia mechanizmów odporności, takich jak timeout'y, retry'e lub failover'y.

Podobne skille