pufferlib

Name: pufferlib
Author: K-Dense-AI

autor: K-Dense-AI

Framework uczenia wzmacniającego z szybkością milionów kroków na sekundę

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: K-Dense-AI
Kategoria: Bezpieczeństwo
Wyświetlenia: 1

Repozytorium GitHub

O skillu

PufferLib to biblioteka do uczenia wzmacniającego zoptymalizowana pod kątem szybkości i skali. Osiąga przyspieszenie 2–10x w porównaniu ze standardowymi implementacjami dzięki wektoryzacji, natywnej obsłudze wieloagentowej i wydajnemu algorytmowi PPO. Trenuj agentów na środowiskach Gymnasium, PettingZoo, Atari, Procgen i NetHack. Idealna do eksperymentów wymagających równoległego trenowania na milionach kroków na sekundę.

Jak używać

Zainstaluj PufferLib za pomocą pip, a następnie zaimportuj bibliotekę oraz moduł PuffeRL w swoim skrypcie Pythona. 2. Przygotuj środowisko treningowe — możesz użyć istniejącego ze zbiorów Gymnasium, PettingZoo lub Procgen, albo zdefiniować własne, korzystając z API PufferEnv. 3. Skonfiguruj parametry treningu, takie jak urządzenie (CPU/GPU), współczynnik uczenia i architekturę sieci (CNN, LSTM lub niestandardowa). 4. Uruchom trening z linii poleceń poleceniem puffer train z nazwą środowiska i parametrami, na przykład puffer train procgen-coinrun --train.device cuda --train.learning-rate 3e-4. 5. Dla treningu rozproszonego na wielu GPU użyj torchrun z parametrem --nproc_per_node, aby przyspieszyć eksperymentację na dużych zbiorach danych. 6. Monitoruj postęp treningu i dostosowuj hiperparametry w zależności od osiąganych wyników.

Podobne skille

qmd

autor: tobi

Przeszukuj swoje notatki i dokumenty markdown za pomocą hybrydowego silnika wyszukiwania z AI

Bezpieczeństwo

1951

google-analytics

autor: davila7

Analizuj dane Google Analytics i odkrywaj możliwości wzrostu Twojej strony

Bezpieczeństwo

1260

better-auth-best-practices

autor: novuhq

Integruj Better Auth – framework uwierzytelniania TypeScript z obsługą OAuth, magic linków i passkeys

Bezpieczeństwo

1148

llama-cpp

autor: zechenzhangAGI

Uruchamiaj modele językowe na CPU i Mac'ach bez karty NVIDIA

Bezpieczeństwo

11252

obsidian

autor: gapmiss

Kompletny przewodnik tworzenia wtyczek Obsidian z regułami ESLint i best practices

Bezpieczeństwo

14111

gmail-manager

autor: jeffvincent

Zarządzaj swoją skrzynką Gmail bezpośrednio z Claude — wysyłaj, czytaj i wyszukuj maile bez opuszczania czatu.

Bezpieczeństwo

17128