markdown-tools
Konwertuj dokumenty do markdown z inteligentnym wyborem narzędzi dla najlepszej jakości
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Narzędzie do konwersji PDF, DOCX i PPTX na markdown z dwoma trybami pracy. Tryb Szybki oferuje szybką konwersję pojedynczym narzędziem, a Tryb Zaawansowany łączy wyniki wielu konwerterów równolegle, aby uzyskać najwyższą jakość. Idealne do ekstrakcji obrazów z dokumentów, walidacji konwersji i przygotowania tekstu zoptymalizowanego dla modeli języka.
Jak używać
Zainstaluj wymagane zależności: uruchom uv tool install "markitdown[pdf]", następnie pip install pymupdf4llm i brew install pandoc (lub odpowiednik dla Twojego systemu operacyjnego). Te pakiety umożliwiają obsługę różnych formatów dokumentów.
Przygotuj dokument do konwersji — obsługiwane są pliki PDF, DOCX, PPTX i XLSX. Upewnij się, że masz dostęp do pliku na swoim komputerze.
Aby szybko skonwertować dokument, użyj Trybu Szybkiego (domyślny): uruchom uv run --with pymupdf4llm --with markitdown scripts/convert.py nazwa_pliku.pdf -o output.md. Narzędzie automatycznie wybierze najlepszy konwerter dla Twojego formatu.
Jeśli potrzebujesz najwyższej jakości konwersji złożonych dokumentów, dodaj flagę --heavy: uv run --with pymupdf4llm --with markitdown scripts/convert.py nazwa_pliku.pdf -o output.md --heavy. Tryb Zaawansowany uruchamia wiele narzędzi równolegle i łączy najlepsze fragmenty wyniku.
Aby sprawdzić, które narzędzia są dostępne dla Twojego dokumentu, uruchom uv run scripts/convert.py --list-tools. Wynik markdown znajdziesz w pliku output.md.