Toolverse
Wszystkie skille

evaluating-machine-learning-models

autor: jeremylongshore

Oceniaj wydajność modeli ML za pomocą kompleksowego zestawu metryk i wskaźników

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
3

O skillu

Umiejętność do oceny modeli uczenia maszynowego z wykorzystaniem zaawansowanego pakietu metryk. Analizujesz dokładność, precyzję, czułość, F1-score i niestandardowe KPI, aby podejmować świadome decyzje o wyborze i optymalizacji modelu. Skill automatycznie identyfikuje kontekst żądania użytkownika i generuje szczegółowe raporty wydajności, wskazując obszary do poprawy i gotowość do wdrożenia.

Jak używać

  1. Zainstaluj skill w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Write, Edit, Grep, Glob i Bash.

  2. Przygotuj model do oceny — upewnij się, że model jest dostępny w Twoim projekcie lub repozytorium, wraz z danymi testowymi lub walidacyjnymi.

  3. Poproś Claude o ocenę modelu, używając naturalnego języka, np. "Oceń dokładność mojego modelu klasyfikacji obrazów" lub "Porównaj wydajność tych dwóch modeli".

  4. Skill automatycznie analizuje Twoje żądanie, identyfikuje model do oceny i wybiera odpowiednie metryki na podstawie kontekstu.

  5. Claude wykonuje ocenę za pomocą komendy /eval-model z pakietu model-evaluation-suite, generując metryki takie jak dokładność, precyzję, czułość i F1-score.

  6. Przejrzyj wyniki — Claude prezentuje wygenerowane metryki, wskazuje kluczowe wskaźniki wydajności i sugeruje obszary do optymalizacji modelu lub podjęcia decyzji o wdrożeniu.

Podobne skille