T
torchforge-rl-training
Trenuj modele RL w PyTorch bez zawiłości infrastruktury — fokus na algorytmy, nie na skalowanie.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
torchforge to biblioteka Meta do wzmacniającego uczenia się (RL) napisana natywnie w PyTorch. Oddziela problemy infrastruktury od logiki algorytmów, dzięki czemu możesz szybko eksperymentować z nowymi metodami RL — GRPO, DAPO, SAPO — bez konfigurowania rozproszonego treningu. Skaluje się automatycznie od jednej karty GPU do tysięcy dzięki systemowi aktorów Monarch i integracji z TorchTitan.
Jak używać
- Zainstaluj zależności: upewnij się, że masz PyTorch ≥2.9.0, TorchTitan ≥0.2.0, vLLM i Monarch dostępne w swoim środowisku. 2. Zdefiniuj swoją funkcję straty i model nagrody — torchforge dostarcza wbudowane implementacje GRPO, DAPO, CISPO, GSPO i SAPO, które możesz użyć bezpośrednio lub dostosować. 3. Napisz kod algorytmu w warstwie aplikacji (Your Code) — torchforge obsługuje infrastrukturę, ty skupiasz się na logice RL. Algorytm może być zaimplementowany w około 100 linii kodu. 4. Skonfiguruj skalowanie: jeśli trenujesz na jednej karcie, uruchom bezpośrednio; dla wielu GPU użyj Monarch do automatycznego zarządzania aktorami i TorchTitan do paralelizmu modelu. 5. Monitoruj trening — torchforge automatycznie synchronizuje wagi między węzłami za pośrednictwem TorchStore, a vLLM obsługuje wnioskowanie. Nie musisz ręcznie zarządzać komunikacją między procesami.
Podobne skille
F
feishu-docs
autor: openclaw
Bezpieczeństwo
1574
L
llama-cpp
autor: zechenzhangAGI
Bezpieczeństwo
11252
S
software-security
autor: project-codeguard
Bezpieczeństwo
1678
A
academic-researcher
autor: Shubhamsaboo
Bezpieczeństwo
1260
G
google-analytics
autor: davila7
Bezpieczeństwo
1260
1
1password
autor: openclaw
Bezpieczeństwo
1174