Toolverse
Wszystkie skille

marker

autor: benchflow-ai

Konwertuj PDF-y na Markdown z zachowaniem wzorów LaTeX i struktury dokumentu

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
31

O skillu

Marker to narzędzie do automatycznej konwersji dokumentów PDF na format Markdown. Idealnie sprawdza się przy pracy z artykułami naukowymi i dokumentami technicznymi zawierającymi notację matematyczną — wszystkie wzory LaTeX, równania i formatowanie tekstu pozostają niezmienione. Skrypt wykorzystuje CLI marker_single i działa bezpośrednio z Claudem, umożliwiając szybkie wyodrębnianie treści z PDF-ów bez utraty ważnych elementów strukturalnych.

Jak używać

  1. Zainstaluj pakiet marker-pdf, jeśli jeszcze go nie masz. Uruchom w terminalu: pip install marker-pdf. Upewnij się, że masz zainstalowanego Pythona w wersji 3.10 lub nowszej.

  2. Przygotuj plik PDF, który chcesz przekonwertować. Umieść go w dostępnym dla skryptu katalogu, np. w bieżącym folderze roboczym.

  3. Użyj skryptu z linii poleceń, wpisując: python scripts/marker_to_markdown.py paper.pdf (zastąp paper.pdf nazwą swojego pliku). Wynik w formacie Markdown pojawi się w terminalu.

  4. Jeśli chcesz zachować pliki tymczasowe do inspekcji, dodaj flagę --keep-temp: python scripts/marker_to_markdown.py paper.pdf --keep-temp. Pliki będą zapisane w folderze obok PDF-a.

  5. W przypadku dużych dokumentów, które konwersja zajmuje długo, zwiększ limit czasu za pomocą --timeout: python scripts/marker_to_markdown.py paper.pdf --timeout 1200 (wartość w sekundach).

  6. Jeśli marker_single nie zostanie znaleziony, sprawdź, czy pakiet marker-pdf jest poprawnie zainstalowany i dostępny w PATH systemowym.

Podobne skille