rag-skills
Wzorce RAG dla LlamaIndex, ChromaDB i Celery – poradnik wdrażania i optymalizacji
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność zawierająca sprawdzone praktyki dla systemów RAG (Retrieval-Augmented Generation). Obejmuje konfigurację LlamaIndex do przetwarzania dokumentów, ChromaDB do przechowywania wektorów oraz Celery do asynchronicznych zadań indeksowania i wyszukiwania. Zawiera wzorce bezpiecznego pozyskiwania plików, wyboru embedderów (OpenAI, Ollama, uniwersalne) i strategii retrieval. Idealna dla deweloperów budujących pipelines wyszukiwania semantycznego.
Jak używać
Zainstaluj umiejętność w swoim projekcie LlamaFarm, upewniając się, że masz Python 3.11+, LlamaIndex 0.13+, ChromaDB 1.0+ i Celery 5.5+. Umiejętność rozszerza python-skills, więc wszystkie praktyki Pythona mają zastosowanie.
Skonfiguruj Celery w pliku celery_app.py, definiując brokera wiadomości i backendu wyników. Umiejętność zawiera gotowe szablony konfiguracji dla typowych ustawień.
Wybierz dostawcę embeddings (OpenAI, Ollama lub uniwersalny) i skonfiguruj go w komponencie embedders/. Umiejętność zawiera moduł embedding_safety.py z circuit breakerem i walidacją, aby chronić przed błędami API.
Zdefiniuj pipeline pozyskiwania dokumentów, korzystając z ingest_handler.py do bezpiecznego ładowania plików i blob_processor.py do przetwarzania plików binarnych. Wybierz parser z komponenty parsers/ zgodnie z formatem dokumentów (PDF, TXT, Markdown itp.).
Uruchom asynchroniczne zadania indeksowania za pomocą ingest_tasks.py, które będą przetwarzać dokumenty w tle. Monitoruj postęp za pomocą health_tasks.py i stats_tasks.py.
Wdrażaj zapytania poprzez search_tasks.py lub query_tasks.py, wybierając strategię retrieval z komponenty retrievers/. API w api.py udostępnia interfejsy do wyszukiwania i dostępu do bazy wektorowej ChromaDB.