Toolverse
Wszystkie skille

rag-architect

autor: alirezarezvani

Projektuj i optymalizuj potoki RAG dla produkcji — od chunking'u dokumentów po ewaluację

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
8

O skillu

RAG Architect to umiejętność dla Claude'a, która daje Ci pełny zestaw narzędzi do budowania zaawansowanych systemów retrieval-augmented generation. Nauczysz się strategii podziału dokumentów (fixed-size, sentence-based, paragraph-based, semantic), technik embedowania, optymalizacji wyszukiwania i oceny jakości pipeline'u. Idealna dla inżynierów pracujących nad skalowalnymi systemami RAG w produkcji.

Jak używać

  1. Zainstaluj umiejętność RAG Architect w swoim środowisku Claude'a, dodając ją do dostępnych skills dla agenta.

  2. Zapoznaj się z czterema głównymi strategiami chunking'u: fixed-size (dzielenie po znakach lub tokenach), sentence-based (respektowanie granic zdań), paragraph-based (zachowanie struktury dokumentu) i semantic (grupowanie po znaczeniu tematycznym). Każda ma inne zalety — wybierz na podstawie typu dokumentu, który przetwarzasz.

  3. Zdefiniuj parametry chunking'u dla Twojego pipeline'u: rozmiar chunk'a (np. 512, 1024 znaków), procent overlap'u (10-20% aby zachować kontekst) i metodę detekcji granic (NLTK, spaCy, regex).

  4. Skonfiguruj embedding'i i wyszukiwanie: wybierz model embedowania, ustal metrykę podobieństwa (cosine, dot product) i parametry retrieval'u (liczba zwracanych dokumentów, próg podobieństwa).

  5. Wdrażaj ewaluację pipeline'u — testuj dokładność retrieval'u na rzeczywistych zapytaniach, mierz latencję i koszt, iteruj nad parametrami na podstawie wyników.

  6. Skaluj system w produkcji: zastosuj optymalizacje dla dużych zbiorów dokumentów, monitoruj wydajność i dostosowuj strategię chunking'u w zależności od zmian w danych.

Podobne skille