web-to-markdown
Konwertuj strony internetowe na czysty Markdown – obsługuje JavaScript i dynamiczne treści
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill web-to-markdown automatycznie pobiera zawartość stron internetowych i konwertuje je do formatu Markdown. Narzędzie obsługuje strony renderowane przez JavaScript za pomocą przeglądarki Chromium (Chrome, Brave, Edge) i bibliotek Puppeteer oraz Readability. Wynik możesz wyświetlić w konsoli, zapisać do pliku lub folderu. Idealny do archiwizacji treści, przetwarzania artykułów lub integracji z innymi narzędziami pracującymi na Markdown.
Jak używać
Upewnij się, że masz zainstalowany web2md lokalnie oraz jedną z przeglądarek rodziny Chromium (Chrome, Chromium, Brave lub Edge). Skill wymaga jawnego polecenia – zawsze wpisz frazę zawierającą "use the skill web-to-markdown" lub "use a skill web-to-markdown", aby go aktywować.
Przygotuj adres URL strony, którą chcesz skonwertować. Jeśli chcesz przetwarzać wiele stron naraz, przygotuj listę adresów URL.
Określ sposób zapisu wyniku: użyj flagi --print aby wyświetlić Markdown w konsoli, --out ./plik.md aby zapisać do konkretnego pliku, lub --out ./folder/ aby automatycznie zapisać do folderu z nazwą opartą na tytule strony.
Jeśli strona wymaga logowania lub interakcji użytkownika, dodaj flagę --interactive. Przeglądarka otworzy się w trybie widocznym, pozwalając Ci zalogować się lub wykonać potrzebne czynności. Po zakończeniu naciśnij Enter, aby kontynuować konwersję.
W przypadku problemów z renderowaniem (np. strona ładuje się zbyt wolno lub wymaga czekania na określone elementy) użyj dodatkowych flag: --wait-until networkidle2 (czeka aż sieć się uspokoi), --wait-for '.selector' (czeka na konkretny element CSS), lub --wait-ms 5000 (czeka określoną liczbę milisekund). Jeśli przeglądarka nie zostanie znaleziona automatycznie, wskaż ścieżkę za pomocą --chrome-path /ścieżka/do/chrome.
Uruchom skill z przygotowanymi parametrami. Narzędzie pobierze stronę, wyodrębni główną zawartość i skonwertuje ją do czystego Markdown z oczyszczonymi linkami i opcjonalnym nagłówkiem YAML.