knowledge-distillation

Name: knowledge-distillation
Author: davila7

autor: davila7

Zmniejsz duże modele AI, zachowując ich możliwości — szybsze wdrażanie, niższe koszty

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Bezpieczeństwo

Repozytorium GitHub

O skillu

Umieść wiedzę dużych modeli (np. GPT-4) w mniejszych modelach za pomocą destylacji wiedzy. Technika pozwala zmniejszyć rozmiar modelu z 70 miliardów do 7 miliardów parametrów, zachowując ponad 90% wydajności. Idealna do wdrażania na urządzeniach z ograniczonymi zasobami, transferu możliwości modeli proprietarnych na otwarte rozwiązania (LLaMA, Mistral) oraz redukcji kosztów inferencji. Obsługuje skalowanie temperatury, miękkie cele, odwrotną dywergencję KL, destylację logitów i strategie treningu MiniLLM.

Jak używać

Zainstaluj wymagane biblioteki: pip install transformers datasets accelerate torch deepspeed wandb. Opcjonalnie sklonuj repozytorium MiniLLM z GitHub (microsoft/LMOps), aby uzyskać zaawansowane implementacje destylacji.
Przygotuj parę modeli: załaduj duży model nauczycielski (np. Llama-2-70b) i mały model ucznia (np. Llama-2-7b) za pomocą AutoModelForCausalLM z biblioteki transformers.
Wybierz technikę destylacji odpowiednią do Twojego przypadku użycia: skalowanie temperatury dla prostszych scenariuszy, destylację logitów dla transferu wiedzy z modeli proprietarnych, lub odwrotną dywergencję KL (MiniLLM) dla zaawansowanej kompresji.
Przygotuj dane treningowe — możesz użyć danych syntetycznych wygenerowanych przez model nauczycielski lub istniejące zbiory danych dostosowane do Twojej domeny.
Skonfiguruj parametry treningu w TrainingArguments (liczba epok, rozmiar batcha, współczynnik uczenia) i uruchom trening za pomocą klasy Trainer, monitorując postęp w Weights & Biases.
Po treningu przetestuj model ucznia na zadaniach docelowych, aby potwierdzić, że zachował co najmniej 90% wydajności oryginalnego modelu nauczycielskiego przy znacznie mniejszym rozmiarze.

Podobne skille

reviewing-code

autor: CaptainCrouton89

Systematyczna ocena zmian w kodzie pod kątem bezpieczeństwa, poprawności i zgodności ze specyfikacją

Bezpieczeństwo

1493

llama-cpp

autor: zechenzhangAGI

Uruchamiaj modele językowe na CPU i Mac'ach bez karty NVIDIA

Bezpieczeństwo

11252

zendesk

autor: vm0-ai

Zarządzaj biletami i użytkownikami Zendesk przez API – automatyzuj obsługę klienta

Bezpieczeństwo

11100

security-compliance

autor: davila7

Bezpieczeństwo i zgodność od podstaw — architektura obrony warstwowej, compliance i zarządzanie incydentami

Bezpieczeństwo

1172

accessibility-compliance

autor: wshobson

Twoje interfejsy będą dostępne dla wszystkich — WCAG 2.2, czytniki ekranu, klawiatura

Bezpieczeństwo

2173

python-expert

autor: Shubhamsaboo

Ekspert Pythona – czysty kod, optymalizacja i best practices

Bezpieczeństwo

2777