hybrid-search-implementation

Name: hybrid-search-implementation
Author: wshobson

autor: wshobson

Połącz wyszukiwanie wektorowe i słownikowe dla lepszych wyników w systemach RAG

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: wshobson
Kategoria: Data Science
Wyświetlenia: 74

Repozytorium GitHub

O skillu

Umiejętność łączenia wyszukiwania wektorowego z wyszukiwaniem słownikowym w celu poprawy jakości wyszukiwania. Zastosuj ją podczas budowania systemów RAG, wdrażania wyszukiwarek lub gdy żadne z podejść osobno nie daje wystarczającej liczby trafień. Skill zawiera wzorce architektoniczne oraz cztery metody fuzji wyników: Reciprocal Rank Fusion do zastosowań ogólnych, Linear do elastycznego równoważenia wyników, Cross-encoder dla najwyższej jakości oraz Cascade dla wydajności. Idealna dla systemów, które muszą łączyć semantyczne rozumienie tekstu z dokładnym dopasowaniem słów kluczowych, nazw czy kodów.

Jak używać

Zainstaluj skill w swoim projekcie agenta, dodając moduł hybrid-search-implementation do katalogu umiejętności. Skill zawiera gotowe szablony implementacyjne w Pythonie, które możesz zintegrować z istniejącym kodem.
Przygotuj dwie listy wyników: jedną z wyszukiwania wektorowego (semantic search) oraz drugą z wyszukiwania słownikowego (keyword search). Każdy wynik powinien zawierać identyfikator dokumentu i wynik (score).
Wybierz metodę fuzji odpowiednią do Twojego przypadku użycia. Dla większości scenariuszy zacznij od Reciprocal Rank Fusion (RRF), która jest uniwersalna i nie wymaga dostrajania. Jeśli potrzebujesz kontroli nad wagą każdego podejścia, użyj metody Linear. Dla najwyższej jakości wyników zastosuj Cross-encoder, który ponownie klasyfikuje połączone kandydaty za pomocą modelu neuronowego.
Zaimplementuj wybraną metodę fuzji, przekazując obie listy wyników. W przypadku RRF użyj dostarczonego szablonu z parametrem k (domyślnie 60) – wyższa wartość k daje większą wagę wynikom z niższych pozycji rankingu.
Przetestuj system na zapytaniach zawierających konkretne terminy (nazwy, kody) oraz zapytaniach semantycznych. Hybrid search powinien zwrócić lepsze wyniki niż każde z podejść osobno, szczególnie dla domeny z specjalistycznym słownictwem.
Dostosuj parametry (wagi, wartość k, próg filtrowania w metodzie Cascade) na podstawie wyników testów, aby osiągnąć optymalny balans między precyzją a recall dla Twojego systemu RAG.

Podobne skille

pdf-processing

autor: Ming-Kai-LC

Przetwarzaj duże pliki PDF bez limitów Claude'a – dzielenie, ekstrakcja tekstu i OCR

Data Science

23134

claude-automation-recommender

autor: anthropics

Analizuj kod i odkryj, jakie automatyzacje Claude Code będą dla Ciebie najlepsze

Data Science

1787

notebooklm

autor: leegonzales

Zadawaj pytania swoim dokumentom w NotebookLM i otrzymuj odpowiedzi z cytowaniem źródeł, bez halucynacji.

Data Science

142112

deep-research

autor: davidorex

Automatyczne badanie złożonych problemów w VCV Rack — od szybkiej analizy do głębokich poszukiwań

Data Science

16151

ml-paper-writing

autor: davila7

Pisz artykuły naukowe gotowe do publikacji w top konferencjach AI z pomocą Claude'a

Data Science

2681

prompt-optimizer

autor: solatis

Doskonał prompty dla agentów Claude – wzorce oparte na badaniach naukowych

Data Science

15109