similarity-search-patterns

Name: similarity-search-patterns
Author: wshobson

autor: wshobson

Wdrażaj efektywne wyszukiwanie semantyczne z bazami wektorowymi

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: wshobson
Kategoria: Data Science
Wyświetlenia: 46

Repozytorium GitHub

O skillu

Umiejętność do budowania systemów wyszukiwania semantycznego i silników rekomendacji opartych na bazach wektorowych. Dowiesz się, jak wybierać metryki odległości (cosinus, euklidesowa, dot product), implementować różne typy indeksów (flat, HNSW, IVF+PQ) i optymalizować wydajność wyszukiwania dla milionów wektorów. Zawiera gotowe szablony dla Pinecone i innych platform, umożliwiające szybkie wdrożenie RAG retrieval i hybrydowego wyszukiwania semantyczno-słownikowego.

Jak używać

Zainstaluj umiejętność w swoim projekcie agenta, dodając repozytorium do ścieżki skills. Upewnij się, że masz dostęp do wybranej bazy wektorowej (Pinecone, Weaviate lub inna) i klucz API.
Wybierz metrykę odległości odpowiednią dla Twoich danych: cosinus dla znormalizowanych embeddingów, euklidesową dla surowych wektorów, dot product gdy ważna jest wielkość wektora, lub Manhattan dla rzadkich wektorów.
Zdecyduj o typie indeksu na podstawie rozmiaru danych: flat dla małych zbiorów (dokładne wyniki), HNSW dla średnich i dużych zbiorów (szybkie, ~95-99% recall), lub IVF+PQ dla bardzo dużych zbiorów (skompresowane, ~90-95% recall).
Skorzystaj z dostarczonego szablonu Pinecone lub dostosuj go do wybranej bazy wektorowej. Zainicjuj połączenie z API, definiując wymiar wektorów (np. 1536 dla OpenAI) i metrykę.
Implementuj wyszukiwanie semantyczne poprzez konwersję zapytań użytkownika na embeddingi, a następnie wyszukaj najbliższe wektory w indeksie. Dla RAG retrieval zwróć dokumenty powiązane z topowymi wynikami.
Opcjonalnie połącz wyszukiwanie semantyczne z tradycyjnym wyszukiwaniem słownikowym, aby poprawić trafność wyników dla zapytań zawierających specjalistyczne terminy lub nazwy własne.

Podobne skille

prompt-optimizer

autor: solatis

Doskonał prompty dla agentów Claude – wzorce oparte na badaniach naukowych

Data Science

15109

rust-coding-skill

autor: UtakataKyosui

Umiejętność Claude'a do pisania idiomatycznego, wydajnego kodu w Rust z prawidłową architekturą

Data Science

248325

market-research-reports

autor: davila7

Raporty badań rynku na poziomie firm konsultingowych w kilka minut

Data Science

16115

market-analysis

autor: xbklairith

Analiza rynków z wskaźnikami technicznymi, wsparciem i oporem, trendami multi-timeframe

Data Science

29144

skill-installer

autor: openai

Instaluj umiejętności Codex z oficjalnej listy lub prywatnych repozytoriów GitHub.

Data Science

23118

deep-research

autor: davidorex

Automatyczne badanie złożonych problemów w VCV Rack — od szybkiej analizy do głębokich poszukiwań

Data Science

16151