Toolverse
Wszystkie skille

exa-data-handling

autor: jeremylongshore

Zarządzaj wynikami wyszukiwania Exa — ekstrakcja treści, cache i kontekst RAG dla LLM

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Skill do obsługi danych z API wyszukiwania neuronowego Exa. Kontrolujesz zakres ekstrakcji treści (metadane, highlights, pełny tekst), implementujesz cache'owanie wyników z TTL, deduplikujesz cytowania i zarządzasz budżetem tokenów dla okna kontekstu modelu. Obsługuje integracje z exa-js SDK oraz opcjonalne cache'owanie w pamięci (LRU) lub Redis. Idealne do budowania pipelinów RAG z kontrolą kosztów i wydajności.

Jak używać

  1. Zainstaluj zależności: exa-js SDK oraz opcjonalnie lru-cache (cache w pamięci) lub ioredis (Redis). Ustaw zmienną środowiskową EXA_API_KEY z kluczem API Exa.
  2. Wybierz poziom ekstrakcji treści w zależności od potrzeb: metadane tylko (najszybciej, najtaniej — zwraca URL, tytuł, score), highlights (zbalansowana cena/wartość — zwraca fragmenty tekstu skoncentrowane na zapytaniu), lub pełny tekst z limitem znaków (do 2000 znaków dla kontroli budżetu tokenów).
  3. Dla wyszukiwania z samymi metadanymi użyj exa.search(query, { type: "auto", numResults: 10 }) — bez opcji content zwraca tylko podstawowe dane.
  4. Dla highlights użyj exa.searchAndContents(query, { numResults: 10, highlights: { maxCharacters: 500, query: query } }) — query w highlights skupia fragmenty na oryginalnym zapytaniu.
  5. Dla pełnego tekstu użyj exa.searchAndContents(query, { numResults: 5, text: { maxCharacters: 2000 }, highlights: {...} }) — ograniczenie znaków chroni budżet tokenów LLM.
  6. Implementuj cache'owanie wyników z TTL (time-to-live) aby uniknąć powtarzających się zapytań do API — użyj LRU-cache dla małych zbiorów lub Redis dla produkcji. Deduplikuj cytowania przed wysłaniem do modelu, aby zmniejszyć szum w kontekście.

Podobne skille