Toolverse
Wszystkie skille

tabstack-extractor

autor: openclaw

Automatycznie wyciągaj ustrukturyzowane dane ze stron internetowych za pomocą API Tabstack.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Backend

O skillu

Skill do ekstrakcji danych ze stron internetowych w formacie JSON lub markdown. Idealny do zbierania informacji z ogłoszeń o pracę, artykułów prasowych, opisów produktów i innych treści o regularnej strukturze. Umożliwia definiowanie własnych schematów danych, automatyczne konwertowanie na markdown oraz obsługę ponownych prób i cachowania wyników. Wymaga klucza API Tabstack.

Jak używać

  1. Zainstaluj Babashka, narzędzie wymagane do uruchomienia skilla. Wybierz jedną z trzech opcji: pobierz ze strony GitHub (curl -s https://raw.githubusercontent.com/babashka/babashka/master/install | bash), zainstaluj przez Nix (nix-shell -p babashka) lub przez Homebrew (brew install borkdude/brew/babashka).

  2. Uzyskaj klucz API Tabstack, rejestrując się na stronie https://console.tabstack.ai/signup. Następnie ustaw zmienną środowiskową poleceniem export TABSTACK_API_KEY="twoj_klucz_api_tutaj" lub zapisz klucz w pliku konfiguracyjnym ~/.config/tabstack/config.edn w formacie {:api-key "twoj_klucz_api_tutaj"}.

  3. Przetestuj połączenie z API, uruchamiając bb scripts/tabstack.clj test. Polecenie powinno potwierdzić, że klucz API jest poprawnie skonfigurowany.

  4. Wyciągnij dane w formacie markdown z dowolnej strony internetowej, używając polecenia bb scripts/tabstack.clj markdown "https://przyklad.com". Wynik będzie zawierać czytelny tekst bez HTML.

  5. Wyciągnij dane w formacie JSON, definiując własny schemat. Uruchom bb scripts/tabstack.clj json "https://przyklad.com" references/simple_article.json, gdzie plik JSON zawiera definicję struktury danych do pobrania. Zacznij od prostych schematów dla szybszych wyników.

  6. Dla bardziej zaawansowanych scenariuszy użyj polecenia json-retry (bb scripts/tabstack.clj json-retry "https://przyklad.com" references/simple_article.json) do automatycznych ponownych prób w przypadku błędu, lub json-cache do cachowania wyników przez 24 godziny.

Podobne skille