Toolverse
Wszystkie skille

web-scraper

autor: openclaw

Wyciągaj strukturalne dane z dowolnych stron internetowych – bez kodowania

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Backend
Wyświetlenia
21

O skillu

Skonfigurowalny serwis scrapingu stron. Automatycznie ekstrahuj dane produktów, ofert nieruchomości, ogłoszeń o pracę i postów z mediów społecznych w formacie CSV, JSON lub Excel. Narzędzie obsługuje zarówno strony statyczne, jak i dynamiczne wymagające JavaScript. Wbudowane zabezpieczenia przed blokowaniem – randomizacja opóźnień i rotacja User-Agent. Idealne dla agencji, analityków danych i firm e-commerce, które potrzebują regularnych aktualizacji informacji z publicznych źródeł.

Jak używać

  1. Zainstaluj wymagane biblioteki: npm install puppeteer cheerio. Puppeteer obsługuje strony dynamiczne (wymagające JavaScript), cheerio służy do parsowania HTML stron statycznych.

  2. Przygotuj URL strony docelowej i określ, jakie dane chcesz wyciągnąć – nazwy produktów, ceny, obrazy, opisy, adresy, dane kontaktowe lub inne elementy widoczne na stronie.

  3. Dla stron statycznych użyj prostego polecenia: "Wyciągnij wszystkie nazwy produktów z [URL]" lub "Ekstrahuj ceny i opisy z [strona]". Narzędzie automatycznie pobierze HTML i wyodrębni żądane dane.

  4. Dla stron dynamicznych, które ładują zawartość przez JavaScript, określ szczegółowo: URL, listę pól do ekstrakcji (np. name, price, image, description), maksymalną liczbę stron do przetworzenia oraz format wyjściowy (CSV, JSON lub Excel).

  5. Narzędzie automatycznie stosuje ochronę przed blokowaniem – dodaje losowe opóźnienia między żądaniami (2–5 sekund) i rotuje User-Agent, aby uniknąć wykrycia przez systemy anty-bot.

  6. Otrzymasz dane w wybranym formacie, gotowe do importu do bazy danych, arkusza kalkulacyjnego lub systemu analitycznego.

Podobne skille