evaluating-machine-learning-models
Oceniaj wydajność modeli ML za pomocą kompleksowego zestawu metryk i wskaźników
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność do oceny modeli uczenia maszynowego z wykorzystaniem zaawansowanego pakietu metryk. Analizujesz dokładność, precyzję, czułość, F1-score i niestandardowe KPI, aby podejmować świadome decyzje o wyborze i optymalizacji modelu. Skill automatycznie identyfikuje kontekst żądania użytkownika i generuje szczegółowe raporty wydajności, wskazując obszary do poprawy i gotowość do wdrożenia.
Jak używać
Zainstaluj skill w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Write, Edit, Grep, Glob i Bash.
Przygotuj model do oceny — upewnij się, że model jest dostępny w Twoim projekcie lub repozytorium, wraz z danymi testowymi lub walidacyjnymi.
Poproś Claude o ocenę modelu, używając naturalnego języka, np. "Oceń dokładność mojego modelu klasyfikacji obrazów" lub "Porównaj wydajność tych dwóch modeli".
Skill automatycznie analizuje Twoje żądanie, identyfikuje model do oceny i wybiera odpowiednie metryki na podstawie kontekstu.
Claude wykonuje ocenę za pomocą komendy
/eval-modelz pakietu model-evaluation-suite, generując metryki takie jak dokładność, precyzję, czułość i F1-score.Przejrzyj wyniki — Claude prezentuje wygenerowane metryki, wskazuje kluczowe wskaźniki wydajności i sugeruje obszary do optymalizacji modelu lub podjęcia decyzji o wdrożeniu.
Podobne skille
skill-creator
autor: anthropics
notebooklm
autor: leegonzales
a-stock-analysis
autor: openclaw
nano-banana-pro
autor: garg-aayush
claude-automation-recommender
autor: anthropics
infographic-creation
autor: antvis