Toolverse
Wszystkie skille

observability-engineer

autor: sickn33

Zbuduj systemy monitorowania i alertów dla produkcji na skalę enterprise

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
sickn33
Kategoria
DevOps
Wyświetlenia
32

O skillu

Skill dla inżynierów niezawodności, którzy projektują monitoring, logging i tracing dla dużych aplikacji. Pomaga definiować SLI/SLO, budować dashboardy w Grafanie, konfigurować alerty i badać problemy wydajności. Pracuj z Prometheus, DataDog, New Relic lub CloudWatch — skill dostosuje się do Twojego stosu technologicznego i pomoże wdrożyć obserwacyjność na poziomie enterprise.

Jak używać

  1. Załaduj skill observability-engineer jako agenta lub MCP server w swoim środowisku (szczegóły instalacji znajdziesz w dokumentacji antigravity-awesome-skills).

  2. Przygotuj informacje o Twojej infrastrukturze: wymień krytyczne usługi, ścieżki użytkownika, które chcesz monitorować, oraz docelowe wskaźniki niezawodności (SLO).

  3. Poproś skill o zdefiniowanie sygnałów obserwacyjności — jakie metryki zbierać, gdzie umieścić instrumentację, jak długo przechowywać dane. Skill zaproponuje podejście dostosowane do Twojego stosu (Prometheus, Grafana, DataDog itp.).

  4. Użyj skill do zaprojektowania dashboardów i reguł alertów wyrównanych z Twoimi SLO. Skill pomoże napisać zapytania PromQL, szablony Grafany lub konfiguracje dla wybranego narzędzia.

  5. Waliduj jakość sygnałów — sprawdź, czy alerty rzeczywiście wyłapują problemy bez szumu. Skill wskaże, które progi alertów są zbyt czułe lub zbyt słabe.

  6. Gdy pojawią się problemy wydajności lub awarie, użyj skill do analizy — skill pomoże przeanalizować logi, ślady rozproszone i metryki, aby znaleźć przyczynę.

Podobne skille