qdrant-vector-search
Szybka wyszukiwarka wektorowa dla systemów RAG — filtrowanie, skalowanie, pełna kontrola danych
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Qdrant to wysokowydajny silnik wyszukiwania wektorowego napisany w Rust, dedykowany do produkcyjnych systemów RAG i wyszukiwania semantycznego. Oferuje hybrydowe wyszukiwanie łączące wektory z filtrowaniem metadanych, rozproszone przechowywanie z replikacją, oraz obsługę wielowektorową na jeden rekord. Idealny, gdy potrzebujesz niskich opóźnień, pełnej kontroli nad danymi i możliwości skalowania horyzontalnego. Dostępny zarówno przez REST, jak i gRPC.
Jak używać
Zainstaluj klienta Pythona za pomocą polecenia pip install qdrant-client — to umożliwi komunikację z serwerem Qdrant z poziomu Twojego kodu.
Uruchom Qdrant w Dockerze poleceniem docker run -p 6333:6333 -p 6334:6334 qdrant/qdrant — serwer będzie dostępny na porcie 6333 dla REST i 6334 dla gRPC. Dla trwałego przechowywania danych dodaj flagę -v $(pwd)/qdrant_storage:/qdrant/storage.
Zaimportuj QdrantClient w swoim skrypcie Pythona i połącz się z serwerem, podając adres hosta i port.
Utwórz kolekcję wektorów, definiując wymiar wektorów i metrykę podobieństwa (np. cosine similarity) — to będzie kontener dla Twoich danych.
Wstaw wektory wraz z metadanymi (payload) do kolekcji — każdy punkt może zawierać gęste wektory, rzadkie wektory lub oba jednocześnie.
Wykonaj wyszukiwanie hybrydowe, podając wektor zapytania i filtry na polach metadanych — Qdrant zwróci najbliższe sąsiedztwo z uwzględnieniem ograniczeń.