openrouter-performance-tuning
Zoptymalizuj szybkość i przepustowość zapytań do OpenRouter
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność do tuningu wydajności OpenRouter — zmniejsz opóźnienia i czasy odpowiedzi w aplikacjach real-time. Narzędzie pomaga wybrać szybsze modele, włączyć streaming, uruchamiać żądania równolegle i dostroić routing do szybszej infrastruktury. Zawiera benchmarking latencji, optymalizację strumienia, przetwarzanie współbieżne i konfigurację połączeń. Idealne dla deweloperów budujących systemy wymagające niskich czasów pierwszej odpowiedzi (TTFT).
Jak używać
Zainstaluj umiejętność w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się że masz dostęp do narzędzi Read, Write, Edit, Bash i Grep.
Ustaw zmienną środowiskową OPENROUTER_API_KEY z Twoim kluczem API OpenRouter, a także nagłówki HTTP-Referer i X-Title wskazujące na Twoją aplikację.
Wyzwól umiejętność frazami takimi jak "openrouter performance", "openrouter latency", "speed up openrouter" lub "optimize openrouter throughput" — system automatycznie rozpozna zapytanie dotyczące optymalizacji.
Użyj funkcji benchmark_model() do pomiaru latencji wybranego modelu — narzędzie zwróci medianę (p50), percentyl 95 (p95), średnią, minimum i maksimum czasu odpowiedzi w milisekundach.
Na podstawie wyników benchmarku wybierz mniejszy model (szybszy), włącz streaming aby zmniejszyć TTFT, rozważ przetwarzanie równoległe dla wielu żądań i zmniejsz rozmiar promptu jeśli to możliwe.
Przetestuj konfigurację z rzeczywistymi zapytaniami, monitoruj czasy odpowiedzi i iteracyjnie dostrajaj routing dostawcy oraz parametry modelu aż osiągniesz docelową wydajność.