Toolverse
Wszystkie skille

markdown-converter

autor: steipete

Konwertuj dokumenty, obrazy i audio do Markdown dla AI — bez instalacji

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
24

O skillu

Markdown Converter to narzędzie do szybkiej konwersji plików do formatu Markdown, gotowego do przetwarzania przez modele AI. Obsługuje PDF, Word, PowerPoint, Excel, HTML, obrazy z OCR, audio z transkrypcją, archiwa ZIP, linki YouTube i EPuby. Działa przez linię poleceń bez konieczności instalacji — wystarczy polecenie uvx. Zachowuje strukturę dokumentu: nagłówki, tabele, listy i linki. Idealne do przygotowania danych tekstowych do analizy lub przetwarzania przez LLM.

Jak używać

  1. Otwórz terminal i przejdź do folderu z plikiem, który chcesz skonwertować. Upewnij się, że masz zainstalowany Python i dostęp do polecenia uvx (część ekosystemu Python).

  2. Aby skonwertować plik do Markdown i wyświetlić wynik w terminalu, wpisz: uvx markitdown nazwa_pliku.pdf (zastąp .pdf rozszerzeniem swojego pliku — obsługiwane są .docx, .xlsx, .pptx, .html i wiele innych).

  3. Aby zapisać wynik do pliku, dodaj flagę -o: uvx markitdown dokument.docx -o dokument.md. Plik wyjściowy pojawi się w tym samym folderze.

  4. Jeśli konwertujesz plik ze stdin (na przykład z potoku), możesz podać wskazówkę o typie pliku flagą -x: cat plik | uvx markitdown -x .pdf -o wynik.md.

  5. Dla skomplikowanych plików PDF z trudną do wyodrębnienia zawartością użyj Azure Document Intelligence, dodając flagi -d i -e z adresem URL Twojego zasobu: uvx markitdown scan.pdf -d -e https://twoj-zasob.cognitiveservices.azure.com/.

  6. Pierwsza konwersja pobierze zależności i będzie trwać dłużej; kolejne uruchomienia będą szybsze dzięki cache'owaniu.

Podobne skille