Toolverse
Wszystkie skille

rag-engineer

autor: davila7

Zbuduj inteligentne systemy wyszukiwania dokumentów z RAG dla swoich modeli AI

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
davila7
Kategoria
Data Science
Wyświetlenia
15

O skillu

Opanuj architekturę systemów Retrieval-Augmented Generation (RAG) — od przygotowania dokumentów przez embeddingi aż po optymalizację wyszukiwania semantycznego. Ta umiejętność nauczy Cię projektować potoki retrieval, które dostarczają modelom LLM najlepszy kontekst. Dowiesz się, jak chunking, bazy wektorowe i hybrydowe wyszukiwanie wpływają na jakość odpowiedzi AI. Idealna dla tych, którzy chcą zbudować systemy wyszukiwania dokumentów, które rzeczywiście działają.

Jak używać

  1. Zainstaluj umiejętność rag-engineer w swoim środowisku Claude lub kompatybilnym systemie agenta. Upewnij się, że masz dostęp do dokumentacji modeli embeddingów i podstawową wiedzę o NLP.

  2. Przygotuj swoje dokumenty do indeksowania, stosując semantic chunking — dziel tekst na fragmenty oparte na znaczeniu, a nie na arbitralnych limitach tokenów. Zachowaj strukturę dokumentu (nagłówki, paragrafy) i dodaj metadane dla przyszłego filtrowania.

  3. Wygeneruj embeddingi dla każdego fragmentu dokumentu, wybierając odpowiedni model embeddingów. Przechowuj je w bazie wektorowej, która wspiera wyszukiwanie podobieństwa.

  4. Zaimplementuj wyszukiwanie hybrydowe, łączące wyszukiwanie semantyczne (przez podobieństwo wektorów) z wyszukiwaniem słów kluczowych (BM25/TF-IDF). Użyj Reciprocal Rank Fusion do połączenia wyników z obu podejść.

  5. Optymalizuj okno kontekstu, testując różne rozmiary fragmentów i strategie retrieval. Rozważ hierarchiczne wyszukiwanie — indeksuj dokumenty na wielu poziomach (paragraf, sekcja, dokument) i wykonaj dwuetapową retrieval dla lepszej precyzji.

  6. Ewaluuj jakość retrieval przed wdrożeniem — garbage in, garbage out. Upewnij się, że fragmenty zwracane przez system rzeczywiście zawierają odpowiedzi na pytania użytkowników.

Podobne skille