model-merging
Łącz wytrenowane modele AI bez konieczności ponownego trenowania — szybko i na CPU
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia połączenie wielu wyspecjalizowanych modeli w jeden, łączący ich możliwości bez kosztownego retrainingu. Idealny, gdy chcesz stworzyć model łączący wiedzę z matematyki, kodowania i konwersacji, lub szybko eksperymentować z wariantami. Obsługuje zaawansowane techniki merowania: SLERP, TIES-Merging, DARE i Task Arithmetic. Działa na CPU, co oznacza znaczne oszczędności kosztów obliczeniowych. Typowo zwiększa wydajność o 5-10% w porównaniu z pojedynczymi modelami.
Jak używać
Zainstaluj mergekit, klonując repozytorium z GitHub (https://github.com/arcee-ai/mergekit.git), wchodząc do folderu i uruchamiając
pip install -e ., lub zainstaluj bezpośrednio przez pip:pip install mergekit. Opcjonalnie zainstaluj bibliotekę transformers i torch:pip install transformers torch.Przygotuj plik konfiguracyjny w formacie YAML (np. config.yml), w którym zdefiniujesz metodę merowania (linear, SLERP, TIES-Merging, DARE lub Task Arithmetic), listę modeli do połączenia z ich wagami oraz typ danych (np. bfloat16). Przykład: ustaw merge_method na "linear", dodaj dwa modele z wagą 0.5 każdy.
Uruchom mergekit z linią poleceń, używając komendy
mergekit-yaml config.yml ./merged_model, gdzie config.yml to Twój plik konfiguracyjny, a ./merged_model to ścieżka wyjściowa dla połączonego modelu.Czekaj na zakończenie procesu merowania — zajmuje to zwykle kilka minut na CPU, w zależności od rozmiaru modeli i wybranej metody.
Zweryfikuj wynik, testując połączony model na swoich danych testowych, aby potwierdzić, że uzyskałeś oczekiwane połączenie możliwości z oryginalnych modeli.