slm-lab-benchmark

Name: slm-lab-benchmark
Author: kengz

autor: kengz

Uruchamiaj benchmarki deep RL, monitoruj zadania i aktualizuj wyniki w tabelach

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: kengz
Kategoria: Backend
Wyświetlenia: 2

Repozytorium GitHub

O skillu

Umiejętność do uruchamiania benchmarków SLM-Lab dla algorytmów deep reinforcement learning. Pozwala na uruchomienie testów wydajności, monitorowanie postępu zadań w dstack, ekstrakcję wyników treningów oraz automatyczną aktualizację dokumentacji BENCHMARKS.md. Obsługuje generowanie wykresów porównawczych i zarządzanie danymi na Hugging Face. Idealna dla badaczy i inżynierów pracujących nad optymalizacją modeli RL.

Jak używać

Zainstaluj umiejętność w swoim projekcie SLM-Lab, upewniając się, że masz dostęp do dstack oraz skonfigurowany plik .env z kredencjałami Hugging Face.
Poproś Claude'a o uruchomienie benchmarków, podając nazwę środowiska (env) i parametry testów. Umiejętność automatycznie przygotuje specyfikacje zadań, respektując zmienną ${max_frame} i inne ustawienia z pliku konfiguracyjnego.
Monitoruj postęp uruchomionych zadań za pomocą polecenia dstack ps. Umiejętność będzie śledzić status każdego uruchomienia i czekać na jego zakończenie. Pamiętaj, że maksymalnie 10 zadań może być uruchomione jednocześnie — jeśli potrzebujesz więcej, umiejętność uruchomi je w partiach.
Po zakończeniu każdego zadania umiejętność automatycznie wyodrębni wynik (total_reward_ma), pobierze folder danych z Hugging Face i zaktualizuje tabelę wyników w BENCHMARKS.md wraz z linkami do danych.
Poproś o wygenerowanie wykresów porównawczych dla danego środowiska. Umiejętność zbierze wszystkie foldery danych, dopasuje je do wpisów w BENCHMARKS.md i utworzy wizualizacje za pomocą polecenia slm-lab plot.
Nigdy nie zatwierdzaj zmian w repozytorium zdalnym bez wyraźnej zgody — umiejętność będzie czekać na Twoją autoryzację przed push'em do gałęzi.

Podobne skille

stripe-integration

autor: wshobson

Integracja płatności Stripe z pełną obsługą subskrypcji i webhooków

Backend

40147

seedream-image-gen

autor: openclaw

Generuj obrazy AI synchronicznie za pomocą Seedream – bez czekania na polling

Backend

6235

scientific-writing

autor: K-Dense-AI

Pisz artykuły naukowe w pełnych akapitach z poprawnymi cytacjami i strukturą IMRAD.

Backend

47191

clickup

autor: civitai

Zarządzaj zadaniami i dokumentami ClickUp bezpośrednio z Claude'a

Backend

2483

literature-review

autor: K-Dense-AI

Systematyczne przeglądy literatury naukowej z weryfikacją cytacji i formatowaniem PDF

Backend

238507

context-optimizer

autor: openclaw

Zarządzaj kontekstem AI inteligentnie – automatyczna kompresja i optymalizacja dla DeepSeek

Backend

2964