peft-fine-tuning
Dostrajaj duże modele AI na słabszym sprzęcie — trenuj zaledwie ułamek parametrów
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia efektywne dostrajanie dużych modeli językowych (7B–70B parametrów) na konsumenckich GPU-ach. Zamiast trenować wszystkie wagi, trenujesz mniej niż 1% parametrów za pomocą metod LoRA, QLoRA i 25+ innych technik adaptacyjnych. Zintegrowana biblioteka HuggingFace oszczędza pamięć GPU (adaptery zajmują 6MB zamiast 14GB pełnego modelu) i przyspiesza iterację. Idealna, gdy dysponujesz ograniczoną mocą obliczeniową, ale potrzebujesz szybkiego dostrajania dla wielu zadań.
Jak używać
Zainstaluj bibliotekę PEFT wraz z zależnościami: uruchom
pip install peft transformers accelerate bitsandbytes datasets. Opcjonalnie dodajbitsandbytesdla wsparcia kwantyzacji, jeśli planujesz pracować z modelami 70B na GPU z 24GB pamięci.Załaduj bazowy model i tokenizer z HuggingFace Hub, na przykład Llama 3.1 8B lub inny model obsługiwany przez bibliotekę transformers.
Skonfiguruj LoRA poprzez
LoraConfig, określając parametry takie jak ranga (rank), współczynnik skalowania (lora_alpha) i warstwy docelowe. Dla większości przypadków domyślne wartości działają dobrze.Owinięcie modelu w
get_peft_model()aktywuje dostrajanie efektywne — model będzie trenować tylko adaptery, a nie wszystkie wagi.Przygotuj swój zbiór danych (własny lub z biblioteki
datasets) i uruchom trening za pomocąTrainerzTrainingArguments. Określ liczbę epok, rozmiar batcha i ścieżkę zapisu.Po treningu zapisz adapter (
model.save_pretrained()) — zajmie on kilka MB. Możesz załadować go później i łączyć z bazowym modelem do wnioskowania lub dalszego dostrajania dla innych zadań.
Podobne skille
architect-review
autor: sickn33
skill-writer
autor: pytorch
reverse-engineering-tools
autor: gmh5225
google-analytics
autor: davila7
youtube-watcher
autor: openclaw
backend-security-coder
autor: sickn33