Toolverse
Wszystkie skille

groq-observability

autor: jeremylongshore

Monitoruj szybkość i wydajność Groq — latencję, przepustowość tokenów i limity zapytań w jednym miejscu.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Skill do konfiguracji obserwacji integracji Groq. Śledź kluczowe metryki: czas do pierwszego tokena (TTFT), przepustowość tokenów na sekundę, wykorzystanie limitów zapytań, błędy i szacunkowe koszty. Groq wyróżnia się prędkością (280–560 tok/s), dlatego monitorowanie latencji jest priorytetem. Skill automatycznie zbiera dane z nagłówków API i metadanych odpowiedzi, buduje histogramy, mierniki i liczniki, a następnie konfiguruje alerty Prometheus. Użyj gdy wdrażasz monitoring operacji Groq, tworzysz dashboardy lub chcesz skonfigurować alertowanie dla zdrowia integracji.

Jak używać

  1. Zainstaluj skill groq-observability w swoim środowisku Claude Code, Codex lub OpenClaw. Skill wymaga dostępu do narzędzi Read, Write i Edit do konfiguracji plików monitorowania.

  2. Wyzwól skill frazami takimi jak "groq monitoring", "groq metrics", "groq observability", "monitor groq", "groq alerts" lub "groq dashboard".

  3. Skill automatycznie skonfiguruje klienta Groq z instrumentacją. Będzie zbierać metryki z każdej odpowiedzi API: czas do pierwszego tokena (TTFT), całkowitą latencję, przepustowość tokenów na sekundę, pozostałe limity zapytań z nagłówków oraz użycie tokenów do śledzenia kosztów.

  4. Zdefiniuj metryki do śledzenia: histogramy latencji, mierniki przepustowości i limitów, liczniki błędów oraz szacunkowe koszty na podstawie ceny modelu. Skill mapuje ceny dla popularnych modeli (np. llama-3.1-8b-instant).

  5. Skonfiguruj alerty Prometheus na podstawie priorytetów: najpierw monitoruj degradację latencji (główna wartość Groq), następnie błędy 429 (wyczerpane limity) i błędy API.

  6. Uruchom dashboard, aby wizualizować metryki w czasie rzeczywistym. Skill przygotuje konfigurację do integracji z systemem monitorowania — wystarczy podłączyć źródło danych i wybrać wizualizacje dla latencji, przepustowości i kosztów.

Podobne skille