Toolverse
Wszystkie skille

openrouter-performance-tuning

autor: jeremylongshore

Zoptymalizuj szybkość i przepustowość zapytań do OpenRouter

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Wyświetlenia
1

O skillu

Umiejętność do tuningu wydajności OpenRouter — zmniejsz opóźnienia i czasy odpowiedzi w aplikacjach real-time. Narzędzie pomaga wybrać szybsze modele, włączyć streaming, uruchamiać żądania równolegle i dostroić routing do szybszej infrastruktury. Zawiera benchmarking latencji, optymalizację strumienia, przetwarzanie współbieżne i konfigurację połączeń. Idealne dla deweloperów budujących systemy wymagające niskich czasów pierwszej odpowiedzi (TTFT).

Jak używać

  1. Zainstaluj umiejętność w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się że masz dostęp do narzędzi Read, Write, Edit, Bash i Grep.

  2. Ustaw zmienną środowiskową OPENROUTER_API_KEY z Twoim kluczem API OpenRouter, a także nagłówki HTTP-Referer i X-Title wskazujące na Twoją aplikację.

  3. Wyzwól umiejętność frazami takimi jak "openrouter performance", "openrouter latency", "speed up openrouter" lub "optimize openrouter throughput" — system automatycznie rozpozna zapytanie dotyczące optymalizacji.

  4. Użyj funkcji benchmark_model() do pomiaru latencji wybranego modelu — narzędzie zwróci medianę (p50), percentyl 95 (p95), średnią, minimum i maksimum czasu odpowiedzi w milisekundach.

  5. Na podstawie wyników benchmarku wybierz mniejszy model (szybszy), włącz streaming aby zmniejszyć TTFT, rozważ przetwarzanie równoległe dla wielu żądań i zmniejsz rozmiar promptu jeśli to możliwe.

  6. Przetestuj konfigurację z rzeczywistymi zapytaniami, monitoruj czasy odpowiedzi i iteracyjnie dostrajaj routing dostawcy oraz parametry modelu aż osiągniesz docelową wydajność.

Podobne skille