evaluate-presets

Name: evaluate-presets
Author: mikeyobrien

autor: mikeyobrien

Testuj i waliduj konfiguracje presertów hat collection w Ralph za pomocą skryptów CLI

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: mikeyobrien
Kategoria: Testowanie
Wyświetlenia: 1

Repozytorium GitHub

O skillu

Skill do systematycznego testowania presertów kolekcji kapeluszy w Ralph. Pozwala na walidację konfiguracji presertów, audyt biblioteki pod kątem błędów i problemów UX oraz sprawdzenie poprawności działania nowych presertów. Uruchamia testy za pomocą skryptów bash z możliwością ewaluacji pojedynczego presetu lub całej biblioteki. Zbiera metryki takie jak liczba iteracji, aktywowane kapelusze i opublikowane zdarzenia. Idealne dla zespołów rozwijających i utrzymujących Ralph, szczególnie po zmianach w logice routingu presertów.

Jak używać

Zainstaluj skill w swoim projekcie Ralph, umieszczając katalog evaluate-presets w ścieżce .claude/skills/. 2. Przygotuj plik preset-test-tasks.yml w katalogu tools, jeśli chcesz definiować zadania testowe dla presertów. 3. Aby przetestować pojedynczy preset, użyj skryptu evaluate-preset.sh z nazwą presetu i backendem: ./tools/evaluate-preset.sh nazwa-presetu claude. Zastąp "nazwa-presetu" rzeczywistą nazwą presetu bez rozszerzenia .yml, a "claude" lub "kiro" wybranym backendem. 4. Aby przetestować wszystkie presety naraz, uruchom ./tools/evaluate-all-presets.sh claude. Skrypt załaduje konfiguracje, uruchomi Ralph z flagą --record-session i zbierze metryki. 5. Ponieważ testy mogą trwać wiele godzin, zawsze uruchamiaj skrypty w tle z timeout 600000 (10 minut) i użyj narzędzia TaskOutput z opcją block: false, aby sprawdzać postęp bez czekania na zakończenie. 6. Wyniki testów znajdziesz w katalogu .eval/ zawierającym logi, kody wyjścia, czasy wykonania i wyodrębnione metryki iteracji oraz aktywowanych presertów.

Podobne skille

differential-review

autor: trailofbits

Automatyczna analiza bezpieczeństwa zmian w kodzie – wykryj zagrożenia przed mergem

Testowanie

2510

hono

autor: openstatusHQ

Rozwijaj aplikacje Hono szybciej dzięki CLI z wyszukiwaniem dokumentacji i testowaniem żądań

Testowanie

1257

playwright

autor: BloomBooks

Pisz solidne testy end-to-end bez pułapek i hacków

Testowanie

1298

code-review-excellence

autor: wshobson

Konstruktywne recenzje kodu, które łapią błędy i budują wiedzę zespołu

Testowanie

1145

langchain

autor: zechenzhangAGI

Framework do budowania aplikacji AI z agentami, łańcuchami i wyszukiwaniem dokumentów

Testowanie

21123

vitest

autor: antfu

Szybkie testy jednostkowe z API kompatybilnym z Jestem, napędzane przez Vite

Testowanie

1236