rag-engineer

Name: rag-engineer
Author: davila7

autor: davila7

Zbuduj inteligentne systemy wyszukiwania dokumentów z RAG dla swoich modeli AI

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Data Science
Wyświetlenia: 15

Repozytorium GitHub

O skillu

Opanuj architekturę systemów Retrieval-Augmented Generation (RAG) — od przygotowania dokumentów przez embeddingi aż po optymalizację wyszukiwania semantycznego. Ta umiejętność nauczy Cię projektować potoki retrieval, które dostarczają modelom LLM najlepszy kontekst. Dowiesz się, jak chunking, bazy wektorowe i hybrydowe wyszukiwanie wpływają na jakość odpowiedzi AI. Idealna dla tych, którzy chcą zbudować systemy wyszukiwania dokumentów, które rzeczywiście działają.

Jak używać

Zainstaluj umiejętność rag-engineer w swoim środowisku Claude lub kompatybilnym systemie agenta. Upewnij się, że masz dostęp do dokumentacji modeli embeddingów i podstawową wiedzę o NLP.
Przygotuj swoje dokumenty do indeksowania, stosując semantic chunking — dziel tekst na fragmenty oparte na znaczeniu, a nie na arbitralnych limitach tokenów. Zachowaj strukturę dokumentu (nagłówki, paragrafy) i dodaj metadane dla przyszłego filtrowania.
Wygeneruj embeddingi dla każdego fragmentu dokumentu, wybierając odpowiedni model embeddingów. Przechowuj je w bazie wektorowej, która wspiera wyszukiwanie podobieństwa.
Zaimplementuj wyszukiwanie hybrydowe, łączące wyszukiwanie semantyczne (przez podobieństwo wektorów) z wyszukiwaniem słów kluczowych (BM25/TF-IDF). Użyj Reciprocal Rank Fusion do połączenia wyników z obu podejść.
Optymalizuj okno kontekstu, testując różne rozmiary fragmentów i strategie retrieval. Rozważ hierarchiczne wyszukiwanie — indeksuj dokumenty na wielu poziomach (paragraf, sekcja, dokument) i wykonaj dwuetapową retrieval dla lepszej precyzji.
Ewaluuj jakość retrieval przed wdrożeniem — garbage in, garbage out. Upewnij się, że fragmenty zwracane przez system rzeczywiście zawierają odpowiedzi na pytania użytkowników.

Podobne skille

arxiv-search

autor: langchain-ai

Przeszukuj arXiv i znajdź najnowsze prace badawcze z fizyki, matematyki i informatyki

Data Science

76172

rust-coding-skill

autor: UtakataKyosui

Umiejętność Claude'a do pisania idiomatycznego, wydajnego kodu w Rust z prawidłową architekturą

Data Science

248325

stock-analyzer

autor: FrancyJGLisboa

Analiza techniczna akcji i ETF-ów w naturalnym języku – sygnały kupna i sprzedaży na podstawie RSI, MACD i Bollinger Bands.

Data Science

23128

xlsx

autor: anthropics

Twórz, edytuj i analizuj arkusze kalkulacyjne z formułami i wykresami

Data Science

40128

skill-installer

autor: openai

Instaluj umiejętności Codex z oficjalnej listy lub prywatnych repozytoriów GitHub.

Data Science

23118

excalidraw

autor: ryanquinn3

Deleguj przetwarzanie diagramów Excalidraw agentom, aby zaoszczędzić kontekst

Data Science

124204