G
groq-rate-limits
Obsługuj limity API Groq z automatycznym retry i backoffem exponentialnym
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do zarządzania ograniczeniami szybkości w API Groq. Implementuje obsługę błędów 429, exponentialny backoff, kolejkowanie żądań i parsowanie nagłówków retry-after. Automatycznie monitoruje pozostałe żądania (RPM, TPM) i tokeny, aby zoptymalizować przepustowość. Przydatny dla deweloperów integrujących Groq w aplikacjach wymagających niezawodności i efektywności.
Jak używać
- Zainstaluj skill w swoim projekcie Claude Code, Codex lub OpenClaw, wskazując repozytorium jeremylongshore/claude-code-plugins-plus-skills.
- Wyzwól skill frazami takimi jak "groq rate limit", "groq throttling", "groq 429", "groq retry" lub "groq backoff" w kontekście kodu obsługującego API Groq.
- Skill automatycznie parsuje nagłówki odpowiedzi Groq:
x-ratelimit-limit-requests,x-ratelimit-remaining-tokens,retry-afteri inne, aby wyodrębnić informacje o limitach. - Implementuje logikę exponentialnego backoffu — gdy napotkasz błąd 429, skill oblicza czas oczekiwania na podstawie nagłówka
retry-afteri automatycznie powtarza żądanie. - Monitoruje jednocześnie oba ograniczenia: RPM (żądania na minutę) i TPM (tokeny na minutę), ponieważ Groq egzekwuje je równocześnie na poziomie organizacji.
- Sprawdź aktualne limity dla swojego planu na console.groq.com/settings/limits, aby dostosować strategię kolejkowania żądań do dostępnych zasobów.