Toolverse
Wszystkie skille

mistral-rate-limits

autor: jeremylongshore

Zarządzaj limitami API Mistral — automatyczne retry, backoff i optymalizacja przepustowości

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Skill do obsługi limitów taryfowych Mistral AI. Implementuje logikę ponownych prób, exponential backoff i monitorowanie pozostałych requestów na minutę (RPM) oraz tokenów na minutę (TPM). Automatycznie śledzi limity na poziomie workspace'u i reaguje na błędy 429. Obsługuje wszystkie endpointy Mistral: chat/completions, embeddings, fim/completions i moderations. Skonfiguruj klucz API, zdefiniuj limity dla swojego planu (Experiment lub Scale), a skill będzie zarządzać kolejkowaniem i opóźnieniami.

Jak używać

  1. Zainstaluj skill w swoim projekcie Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Write i Edit.

  2. Skonfiguruj klucz API Mistral w zmiennych środowiskowych lub w konfiguracji aplikacji. Określ typ workspace'u (Experiment dla darmowego poziomu lub Scale dla płatnego).

  3. Sprawdź aktualne limity RPM i TPM dla Twojego workspace'u na stronie admin.mistral.ai/plateforme/limits — limity są wspólne dla wszystkich kluczy w workspace'ie.

  4. Wyzwól skill frazami takimi jak "mistral rate limit", "mistral throttling", "mistral 429", "mistral retry" lub "mistral backoff" w kontekście obsługi błędów API.

  5. Skill automatycznie implementuje token-aware rate limiter, który śledzi nagłówki odpowiedzi (x-ratelimit-remaining-requests, x-ratelimit-remaining-tokens) i stosuje exponential backoff na podstawie nagłówka Retry-After w przypadku błędów 429.

  6. Monitoruj pozostałe requesty i tokeny w logu — skill będzie opóźniać żądania, aby nie przekroczyć limitów RPM i TPM dla Twojego endpointu (chat/completions, embeddings, fim/completions lub moderations).

Podobne skille