peft-fine-tuning

Name: peft-fine-tuning
Author: davila7

autor: davila7

Dostrajaj duże modele AI na słabszym sprzęcie — trenuj zaledwie ułamek parametrów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Bezpieczeństwo
Wyświetlenia: 1

Repozytorium GitHub

O skillu

Umożliwia efektywne dostrajanie dużych modeli językowych (7B–70B parametrów) na konsumenckich GPU-ach. Zamiast trenować wszystkie wagi, trenujesz mniej niż 1% parametrów za pomocą metod LoRA, QLoRA i 25+ innych technik adaptacyjnych. Zintegrowana biblioteka HuggingFace oszczędza pamięć GPU (adaptery zajmują 6MB zamiast 14GB pełnego modelu) i przyspiesza iterację. Idealna, gdy dysponujesz ograniczoną mocą obliczeniową, ale potrzebujesz szybkiego dostrajania dla wielu zadań.

Jak używać

Zainstaluj bibliotekę PEFT wraz z zależnościami: uruchom pip install peft transformers accelerate bitsandbytes datasets. Opcjonalnie dodaj bitsandbytes dla wsparcia kwantyzacji, jeśli planujesz pracować z modelami 70B na GPU z 24GB pamięci.
Załaduj bazowy model i tokenizer z HuggingFace Hub, na przykład Llama 3.1 8B lub inny model obsługiwany przez bibliotekę transformers.
Skonfiguruj LoRA poprzez LoraConfig, określając parametry takie jak ranga (rank), współczynnik skalowania (lora_alpha) i warstwy docelowe. Dla większości przypadków domyślne wartości działają dobrze.
Owinięcie modelu w get_peft_model() aktywuje dostrajanie efektywne — model będzie trenować tylko adaptery, a nie wszystkie wagi.
Przygotuj swój zbiór danych (własny lub z biblioteki datasets) i uruchom trening za pomocą Trainer z TrainingArguments. Określ liczbę epok, rozmiar batcha i ścieżkę zapisu.
Po treningu zapisz adapter (model.save_pretrained()) — zajmie on kilka MB. Możesz załadować go później i łączyć z bazowym modelem do wnioskowania lub dalszego dostrajania dla innych zadań.

Podobne skille

architect-review

autor: sickn33

Recenzje architektury oprogramowania przez doświadczonego architekta

Bezpieczeństwo

2773

skill-writer

autor: pytorch

Twórz umiejętności agenta Claude z przewodnikiem po strukturze i najlepszych praktykach

Bezpieczeństwo

15116

reverse-engineering-tools

autor: gmh5225

Przewodnik po narzędziach inżynierii wstecznej dla badań bezpieczeństwa gier

Bezpieczeństwo

3168

google-analytics

autor: davila7

Analizuj dane Google Analytics i odkrywaj możliwości wzrostu Twojej strony

Bezpieczeństwo

1260

youtube-watcher

autor: openclaw

Pobierz transkrypcje filmów YouTube i wyciągaj z nich informacje

Bezpieczeństwo

2231

backend-security-coder

autor: sickn33

Bezpieczny kod backendowy – walidacja, autentykacja i ochrona API

Bezpieczeństwo

1133