sentence-transformers
Generuj osadzenia tekstu i obrazów dla wyszukiwania semantycznego i RAG — bez API, lokalnie i tanio.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Sentence Transformers to framework oparty na PyTorch do tworzenia wysokiej jakości osadzeń zdań, tekstu i obrazów. Masz dostęp do ponad 5000 wstępnie wytrenowanych modeli wspierających ponad 100 języków, w tym polszczyznę. Narzędzie doskonale sprawdza się w systemach RAG, wyszukiwaniu semantycznym, klastrowaniu tekstu i zadaniach podobieństwa. Uruchamiasz go lokalnie na swoim sprzęcie — bez zależności od API ani kosztów subskrypcji. Wybieraj między modelami ogólnego przeznaczenia a specjalistycznymi dla konkretnych dziedzin.
Jak używać
- Zainstaluj framework poleceniem
pip install sentence-transformers. Wymaga PyTorch i biblioteki transformers — instalator pobierze je automatycznie. - Załaduj wybrany model, np.
all-MiniLM-L6-v2(szybki, lekki) luball-mpnet-base-v2(dokładniejszy). WywołajSentenceTransformer('nazwa-modelu')— przy pierwszym uruchomieniu model pobierze się z huggingface.co. - Przygotuj listę tekstów do osadzenia (zdania, paragrafy, dokumenty). Przekaż je metodzie
model.encode(lista_tekstów)— otrzymasz macierz wektorów. - Oblicz podobieństwo między osadzeniami za pomocą
cos_sim()z modułusentence_transformers.util. Wynik to wartość od 0 do 1 — im bliżej 1, tym bardziej podobne teksty. - Użyj osadzeń w systemie RAG: indeksuj dokumenty wektorami, a przy zapytaniu użytkownika porównaj jego osadzenie z bazą — zwróć najbardziej podobne dokumenty jako kontekst dla LLM.
- Dla wielojęzyczności wybierz model z prefiksem
multilingual-(np.multilingual-e5-base) — obsługuje 100+ języków w jednym modelu, bez potrzeby tłumaczenia.
Podobne skille
feishu-docs
autor: openclaw
architect-review
autor: sickn33
python-expert
autor: Shubhamsaboo
qmd
autor: tobi
software-security
autor: project-codeguard
windows-ui-automation
autor: martinholovsky