perplexity-performance-tuning
Przyspieszaj zapytania do Perplexity API dzięki cachowaniu, routingowi modeli i batching.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia optymalizację wydajności API Perplexity Sonar poprzez inteligentny routing modeli, cachowanie wyników i batching zapytań. Narzędzie automatycznie dobiera odpowiedni model (sonar, sonar-pro, sonar-reasoning-pro lub sonar-deep-research) na podstawie złożoności pytania, redukując opóźnienia z zakresu 1-60 sekund. Idealne gdy doświadczasz wolnych odpowiedzi, wdrażasz strategie cachowania lub optymalizujesz przepustowość integracji z Perplexity.
Jak używać
Skonfiguruj klucz API Perplexity w zmiennych środowiskowych (PERPLEXITY_API_KEY) i upewnij się, że masz dostęp do infrastruktury cache (Redis lub wbudowanego LRU).
Zainstaluj skill w swoim projekcie Claude Code, Codex lub OpenClaw, dodając go do sekcji umiejętności agenta.
Wyzwól skill frazami takimi jak "perplexity performance", "optimize perplexity", "perplexity latency", "perplexity caching" lub "perplexity slow" w kontekście swojego zapytania.
Skill automatycznie klasyfikuje złożoność Twojego pytania (proste, standardowe, głębokie) i wybiera odpowiedni model: sonar dla szybkich odpowiedzi (1-3s), sonar-pro dla badań z cytowaniami (3-8s), sonar-reasoning-pro dla wieloetapowej analizy (5-15s) lub sonar-deep-research dla kompleksowych raportów (10-60s).
Implementuj cachowanie wyników zapytań, aby uniknąć powtarzających się żądań do API i znacznie zmniejszyć opóźnienia dla podobnych pytań.
Monitoruj rzeczywiste opóźnienia i dostosowuj routing modeli na podstawie obserwowanych wzorców latencji w Twojej aplikacji.