agent-benchmark-suite
Automatyczne testowanie wydajności, wykrywanie regresji i walidacja performansu agentów
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność agenta do kompleksowego benchmarkingu wydajności. Mierzysz przepustowość, opóźnienia, skalowalność i zużycie zasobów. Narzędzie wykrywa regresje wydajności, porównuje wyniki z linią bazową i analizuje dane z systemów rozproszonych. Konfiguruj czas trwania testów, liczbę iteracji, okresy rozgrzewania i tryb równoległy. Idealne do walidacji zmian kodu przed wdrożeniem.
Jak używać
Zainstaluj umiejętność w swoim środowisku agenta, dodając agent-benchmark-suite do listy dostępnych skills. Upewnij się, że masz dostęp do repozytorium ruvnet/claude-flow i ścieżki .agents/skills/agent-benchmark-suite.
Wywołaj skill za pomocą komendy $agent-benchmark-suite w kontekście agenta. Skill automatycznie załaduje konfigurację domyślną z czasem trwania 5 minut i 10 iteracjami testów.
Zdefiniuj konfigurację benchmarku, przekazując parametry: duration (czas w ms), iterations (liczba powtórzeń), warmupTime (rozgrzewka), cooldownTime (ochłodzenie) oraz baseline (linia bazowa do porównania). Przykład: duration 300000, iterations 10, warmupTime 30000.
Uruchom kompletny zestaw testów, który mierzy przepustowość, opóźnienia, skalowalność, zużycie zasobów, koordynację w systemach rozproszonych i tolerancję na błędy. Skill wykonuje wszystkie benchmarki sekwencyjnie lub równolegle w zależności od konfiguracji.
Przeanalizuj raport z wynikami, który zawiera podsumowanie, szczegółowe dane dla każdego benchmarku oraz porównanie z linią bazową. Identyfikuj regresje wydajności i anomalie w działaniu systemu.
Użyj analizatora danych do głębszego zbadania wyników, porównaj wydajność między wersjami kodu i podejmij decyzje optymalizacyjne na podstawie konkretnych metryk.