hugging-face-evaluation

Name: hugging-face-evaluation
Author: huggingface

autor: huggingface

Dodawaj i zarządzaj wynikami ewaluacji modeli na kartach Hugging Face

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: huggingface
Kategoria: Data Science
Wyświetlenia: 14

Repozytorium GitHub

O skillu

Skill do strukturalnego dodawania wyników ewaluacji do kart modeli na Hugging Face. Pozwala ekstrahować tabele ewaluacji z zawartości README, importować wyniki benchmarków z API Artificial Analysis oraz uruchamiać własne ewaluacje modeli przy użyciu vLLM lub lighteval. Integruje się z formatem metadanych model-index i wspiera publikowanie wyników na leaderboardach.

Jak używać

Zainstaluj skill jako zależność w swoim projekcie Claude/Copilot, upewniając się, że masz Python 3.8+ i narzędzie uv do zarządzania środowiskiem.
Przed utworzeniem pull requesta sprawdź istniejące otwarte PRy w repozytorium, aby uniknąć duplikatów — jest to krok krytyczny przed użyciem flagi --create-pr.
Wybierz metodę dodania wyników ewaluacji: ekstrahuj istniejące tabele z README modelu, zaimportuj wyniki z API Artificial Analysis, lub uruchom własną ewaluację.
Dla ewaluacji niestandardowych z vLLM zainstaluj dodatkowe zależności (torch, transformers, accelerate, lighteval) — będą zainstalowane automatycznie jeśli używasz uv run ze skryptami PEP 723.
Skill zaktualizuje metadane model-index w formacie kompatybilnym z Papers with Code i leaderboardami Hugging Face.
Jeśli uruchamiasz ewaluacje na Hugging Face Jobs, skill obsługuje integrację z uv do zarządzania zależnościami i GPU inference przez vLLM.

Podobne skille

pdf-processing

autor: Ming-Kai-LC

Przetwarzaj duże pliki PDF bez limitów Claude'a – dzielenie, ekstrakcja tekstu i OCR

Data Science

23134

rust-coding-skill

autor: UtakataKyosui

Umiejętność Claude'a do pisania idiomatycznego, wydajnego kodu w Rust z prawidłową architekturą

Data Science

248325

pptx

autor: anthropics

Twórz, edytuj i analizuj prezentacje PowerPoint bezpośrednio w Claude'u

Data Science

134310

ml-paper-writing

autor: davila7

Pisz artykuły naukowe gotowe do publikacji w top konferencjach AI z pomocą Claude'a

Data Science

2681

infographic-creation

autor: antvis

Przekształć tekst w piękne infografiki za pomocą szablonów i wizualizacji danych

Data Science

60199

data-storytelling

autor: wshobson

Zamień dane w przekonujące opowieści dla decydentów i inwestorów

Data Science

26105