llama-factory
Dostrajaj duże modele językowe bez kodowania – WebUI, 100+ modeli, QLoRA
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność do precyzyjnego dostrajania modeli LLM za pomocą LLaMA-Factory. Pracujesz bez pisania kodu – interfejs webowy obsługuje ponad 100 modeli, obsługuje kwantyzację 2/3/4/5/6/8-bitową z QLoRA i wspiera modele multimodalne. Zawiera dokumentację, przykłady i odnośniki do oficjalnych źródeł. Idealna dla badaczy i inżynierów pracujących z modelami Llama, Qwen czy Gemma.
Jak używać
Zainstaluj zależności wymagane przez umiejętność: llmtuner, torch, transformers, datasets, peft, accelerate i gradio. Upewnij się, że masz dostęp do repozytorium LLaMA-Factory.
Wczytaj umiejętność w swoim agencie lub środowisku Claude/Copilot. Umiejętność zawiera dokumentację zorganizowaną w folderze references/ – pliki getting_started.md, advanced.md, api.md i inne zawierają szczegółowe wyjaśnienia, przykłady kodu i linki do oficjalnej dokumentacji.
Zacznij od dokumentacji dla początkujących – przeczytaj getting_started.md, aby zrozumieć podstawowe koncepcje dostrajania modeli LLM i interfejsu WebUI.
Wybierz model do dostrajania spośród ponad 100 obsługiwanych modeli (Llama, Qwen, Gemma itp.). Umiejętność pomoże ci skonfigurować parametry kwantyzacji (2/3/4/5/6/8-bitowe QLoRA) odpowiednie dla twojego sprzętu.
Przygotuj swoje dane treningowe i użyj interfejsu WebUI do konfiguracji procesu dostrajania. Umiejętność zawiera referencje do zaawansowanych opcji w pliku advanced.md, jeśli potrzebujesz dostosować przepływ pracy.
W razie problemów z kodem lub konfiguracją skonsultuj się z umiejętnością – zawiera ona najlepsze praktyki, rozwiązywanie problemów i przykłady implementacji bezpośrednio z oficjalnej dokumentacji LLaMA-Factory.
Podobne skille
obsidian
autor: gapmiss
gmail-manager
autor: jeffvincent
reviewing-code
autor: CaptainCrouton89
senior-security
autor: davila7
typescript-review
autor: metabase
content-creator
autor: alirezarezvani