Toolverse
Wszystkie skille

groq-rate-limits

autor: jeremylongshore

Obsługuj limity API Groq z automatycznym retry i backoffem exponentialnym

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Skill do zarządzania ograniczeniami szybkości w API Groq. Implementuje obsługę błędów 429, exponentialny backoff, kolejkowanie żądań i parsowanie nagłówków retry-after. Automatycznie monitoruje pozostałe żądania (RPM, TPM) i tokeny, aby zoptymalizować przepustowość. Przydatny dla deweloperów integrujących Groq w aplikacjach wymagających niezawodności i efektywności.

Jak używać

  1. Zainstaluj skill w swoim projekcie Claude Code, Codex lub OpenClaw, wskazując repozytorium jeremylongshore/claude-code-plugins-plus-skills.
  2. Wyzwól skill frazami takimi jak "groq rate limit", "groq throttling", "groq 429", "groq retry" lub "groq backoff" w kontekście kodu obsługującego API Groq.
  3. Skill automatycznie parsuje nagłówki odpowiedzi Groq: x-ratelimit-limit-requests, x-ratelimit-remaining-tokens, retry-after i inne, aby wyodrębnić informacje o limitach.
  4. Implementuje logikę exponentialnego backoffu — gdy napotkasz błąd 429, skill oblicza czas oczekiwania na podstawie nagłówka retry-after i automatycznie powtarza żądanie.
  5. Monitoruje jednocześnie oba ograniczenia: RPM (żądania na minutę) i TPM (tokeny na minutę), ponieważ Groq egzekwuje je równocześnie na poziomie organizacji.
  6. Sprawdź aktualne limity dla swojego planu na console.groq.com/settings/limits, aby dostosować strategię kolejkowania żądań do dostępnych zasobów.

Podobne skille