sentence-transformers

Name: sentence-transformers
Author: davila7

autor: davila7

Generuj osadzenia tekstu i obrazów dla wyszukiwania semantycznego i RAG — bez API, lokalnie i tanio.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Bezpieczeństwo
Wyświetlenia: 14

Repozytorium GitHub

O skillu

Sentence Transformers to framework oparty na PyTorch do tworzenia wysokiej jakości osadzeń zdań, tekstu i obrazów. Masz dostęp do ponad 5000 wstępnie wytrenowanych modeli wspierających ponad 100 języków, w tym polszczyznę. Narzędzie doskonale sprawdza się w systemach RAG, wyszukiwaniu semantycznym, klastrowaniu tekstu i zadaniach podobieństwa. Uruchamiasz go lokalnie na swoim sprzęcie — bez zależności od API ani kosztów subskrypcji. Wybieraj między modelami ogólnego przeznaczenia a specjalistycznymi dla konkretnych dziedzin.

Jak używać

Zainstaluj framework poleceniem pip install sentence-transformers. Wymaga PyTorch i biblioteki transformers — instalator pobierze je automatycznie.
Załaduj wybrany model, np. all-MiniLM-L6-v2 (szybki, lekki) lub all-mpnet-base-v2 (dokładniejszy). Wywołaj SentenceTransformer('nazwa-modelu') — przy pierwszym uruchomieniu model pobierze się z huggingface.co.
Przygotuj listę tekstów do osadzenia (zdania, paragrafy, dokumenty). Przekaż je metodzie model.encode(lista_tekstów) — otrzymasz macierz wektorów.
Oblicz podobieństwo między osadzeniami za pomocą cos_sim() z modułu sentence_transformers.util. Wynik to wartość od 0 do 1 — im bliżej 1, tym bardziej podobne teksty.
Użyj osadzeń w systemie RAG: indeksuj dokumenty wektorami, a przy zapytaniu użytkownika porównaj jego osadzenie z bazą — zwróć najbardziej podobne dokumenty jako kontekst dla LLM.
Dla wielojęzyczności wybierz model z prefiksem multilingual- (np. multilingual-e5-base) — obsługuje 100+ języków w jednym modelu, bez potrzeby tłumaczenia.

Podobne skille

feishu-docs

autor: openclaw

Zarządzaj dokumentami Feishu przez API — twórz, edytuj, usuwaj i udostępniaj zawartość programowo.

Bezpieczeństwo

1574

architect-review

autor: sickn33

Recenzje architektury oprogramowania przez doświadczonego architekta

Bezpieczeństwo

2773

python-expert

autor: Shubhamsaboo

Ekspert Pythona – czysty kod, optymalizacja i best practices

Bezpieczeństwo

2777

qmd

autor: tobi

Przeszukuj swoje notatki i dokumenty markdown za pomocą hybrydowego silnika wyszukiwania z AI

Bezpieczeństwo

1951

software-security

autor: project-codeguard

Bezpieczny kod od początku — umiejętność dla agentów AI integrująca się z Project CodeGuard

Bezpieczeństwo

1678

windows-ui-automation

autor: martinholovsky

Automatyzuj aplikacje Windows z bezpiecznym dostępem do UI Automation i Win32 API

Bezpieczeństwo

10115