mistral-rate-limits
Zarządzaj limitami API Mistral — automatyczne retry, backoff i optymalizacja przepustowości
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do obsługi limitów taryfowych Mistral AI. Implementuje logikę ponownych prób, exponential backoff i monitorowanie pozostałych requestów na minutę (RPM) oraz tokenów na minutę (TPM). Automatycznie śledzi limity na poziomie workspace'u i reaguje na błędy 429. Obsługuje wszystkie endpointy Mistral: chat/completions, embeddings, fim/completions i moderations. Skonfiguruj klucz API, zdefiniuj limity dla swojego planu (Experiment lub Scale), a skill będzie zarządzać kolejkowaniem i opóźnieniami.
Jak używać
Zainstaluj skill w swoim projekcie Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Write i Edit.
Skonfiguruj klucz API Mistral w zmiennych środowiskowych lub w konfiguracji aplikacji. Określ typ workspace'u (Experiment dla darmowego poziomu lub Scale dla płatnego).
Sprawdź aktualne limity RPM i TPM dla Twojego workspace'u na stronie admin.mistral.ai/plateforme/limits — limity są wspólne dla wszystkich kluczy w workspace'ie.
Wyzwól skill frazami takimi jak "mistral rate limit", "mistral throttling", "mistral 429", "mistral retry" lub "mistral backoff" w kontekście obsługi błędów API.
Skill automatycznie implementuje token-aware rate limiter, który śledzi nagłówki odpowiedzi (x-ratelimit-remaining-requests, x-ratelimit-remaining-tokens) i stosuje exponential backoff na podstawie nagłówka Retry-After w przypadku błędów 429.
Monitoruj pozostałe requesty i tokeny w logu — skill będzie opóźniać żądania, aby nie przekroczyć limitów RPM i TPM dla Twojego endpointu (chat/completions, embeddings, fim/completions lub moderations).