markdown-converter
Konwertuj dokumenty, obrazy i audio do Markdown dla AI — bez instalacji
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Markdown Converter to narzędzie do szybkiej konwersji plików do formatu Markdown, gotowego do przetwarzania przez modele AI. Obsługuje PDF, Word, PowerPoint, Excel, HTML, obrazy z OCR, audio z transkrypcją, archiwa ZIP, linki YouTube i EPuby. Działa przez linię poleceń bez konieczności instalacji — wystarczy polecenie uvx. Zachowuje strukturę dokumentu: nagłówki, tabele, listy i linki. Idealne do przygotowania danych tekstowych do analizy lub przetwarzania przez LLM.
Jak używać
Otwórz terminal i przejdź do folderu z plikiem, który chcesz skonwertować. Upewnij się, że masz zainstalowany Python i dostęp do polecenia uvx (część ekosystemu Python).
Aby skonwertować plik do Markdown i wyświetlić wynik w terminalu, wpisz: uvx markitdown nazwa_pliku.pdf (zastąp .pdf rozszerzeniem swojego pliku — obsługiwane są .docx, .xlsx, .pptx, .html i wiele innych).
Aby zapisać wynik do pliku, dodaj flagę -o: uvx markitdown dokument.docx -o dokument.md. Plik wyjściowy pojawi się w tym samym folderze.
Jeśli konwertujesz plik ze stdin (na przykład z potoku), możesz podać wskazówkę o typie pliku flagą -x: cat plik | uvx markitdown -x .pdf -o wynik.md.
Dla skomplikowanych plików PDF z trudną do wyodrębnienia zawartością użyj Azure Document Intelligence, dodając flagi -d i -e z adresem URL Twojego zasobu: uvx markitdown scan.pdf -d -e https://twoj-zasob.cognitiveservices.azure.com/.
Pierwsza konwersja pobierze zależności i będzie trwać dłużej; kolejne uruchomienia będą szybsze dzięki cache'owaniu.