llama-cpp

Name: llama-cpp
Author: zechenzhangAGI

autor: zechenzhangAGI

Uruchamiaj modele językowe na CPU i Mac'ach bez karty NVIDIA

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: zechenzhangAGI
Kategoria: Bezpieczeństwo
Wyświetlenia: 252

Repozytorium GitHub

O skillu

Llama.cpp to narzędzie do wnioskowania LLM zoptymalizowane dla procesorów i sprzętu bez NVIDIA. Uruchamiaj modele na zwykłych komputerach, Mac'ach z Apple Silicon (M1/M2/M3), kartach AMD/Intel oraz urządzeniach brzegowych. Obsługuje kwantyzację GGUF (1,5-8 bitów), zmniejszając zużycie pamięci i przyspieszając pracę 4-10 razy w stosunku do PyTorch na CPU. Idealne do wdrażania na Raspberry Pi i systemach wbudowanych bez zależności od Dockera czy Pythona.

Jak używać

Zainstaluj llama.cpp: na macOS/Linux użyj brew install llama.cpp, lub sklonuj repozytorium z GitHub (github.com/ggerganov/llama.cpp) i uruchom make. Jeśli masz Mac z Apple Silicon, dodaj flagę LLAMA_METAL=1, dla AMD GPU użyj LLAMA_HIP=1.
Pobierz model w formacie GGUF z HuggingFace, np. Llama-2-7B-Chat-GGUF. Użyj komendy huggingface-cli download, podając nazwę modelu i wersję kwantyzacji (np. Q4_K_M). Modele zapisz w katalogu models/.
Uruchom proste wnioskowanie: użyj llama-cli z flagą -m wskazującą ścieżkę do modelu, -p z pytaniem lub instrukcją, oraz -n określającą maksymalną liczbę tokenów odpowiedzi (np. 256).
Do interaktywnej rozmowy dodaj flagę --interactive, co pozwoli na wielokrotne pytania bez restartowania programu.
Dla zaawansowanego użytku uruchom tryb serwera (server mode), który umożliwia dostęp do modelu przez API — szczegóły znajdują się w dokumentacji README.

Podobne skille

senior-security

autor: davila7

Kompleksny zestaw narzędzi do testowania bezpieczeństwa, modelowania zagrożeń i audytów zgodności

Bezpieczeństwo

2482

content-creator

autor: alirezarezvani

Twórz treści SEO z konsystentnym głosem marki – analizator, optymalizator i szablony w jednym

Bezpieczeństwo

25124

youtube-watcher

autor: openclaw

Pobierz transkrypcje filmów YouTube i wyciągaj z nich informacje

Bezpieczeństwo

2231

payload

autor: payloadcms

Asystent Claude do projektów Payload CMS — debugowanie, konfiguracja i optymalizacja API

Bezpieczeństwo

50171

backend-security-coder

autor: sickn33

Bezpieczny kod backendowy – walidacja, autentykacja i ochrona API

Bezpieczeństwo

1133

qmd

autor: tobi

Przeszukuj swoje notatki i dokumenty markdown za pomocą hybrydowego silnika wyszukiwania z AI

Bezpieczeństwo

1951