observability-engineer
Zbuduj systemy monitorowania i alertów dla produkcji na skalę enterprise
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill dla inżynierów niezawodności, którzy projektują monitoring, logging i tracing dla dużych aplikacji. Pomaga definiować SLI/SLO, budować dashboardy w Grafanie, konfigurować alerty i badać problemy wydajności. Pracuj z Prometheus, DataDog, New Relic lub CloudWatch — skill dostosuje się do Twojego stosu technologicznego i pomoże wdrożyć obserwacyjność na poziomie enterprise.
Jak używać
Załaduj skill observability-engineer jako agenta lub MCP server w swoim środowisku (szczegóły instalacji znajdziesz w dokumentacji antigravity-awesome-skills).
Przygotuj informacje o Twojej infrastrukturze: wymień krytyczne usługi, ścieżki użytkownika, które chcesz monitorować, oraz docelowe wskaźniki niezawodności (SLO).
Poproś skill o zdefiniowanie sygnałów obserwacyjności — jakie metryki zbierać, gdzie umieścić instrumentację, jak długo przechowywać dane. Skill zaproponuje podejście dostosowane do Twojego stosu (Prometheus, Grafana, DataDog itp.).
Użyj skill do zaprojektowania dashboardów i reguł alertów wyrównanych z Twoimi SLO. Skill pomoże napisać zapytania PromQL, szablony Grafany lub konfiguracje dla wybranego narzędzia.
Waliduj jakość sygnałów — sprawdź, czy alerty rzeczywiście wyłapują problemy bez szumu. Skill wskaże, które progi alertów są zbyt czułe lub zbyt słabe.
Gdy pojawią się problemy wydajności lub awarie, użyj skill do analizy — skill pomoże przeanalizować logi, ślady rozproszone i metryki, aby znaleźć przyczynę.