M
markitdown
Konwertuj dokumenty, obrazy i audio na Markdown zoptymalizowany dla modeli AI
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
MarkItDown to narzędzie do konwersji plików w ponad 20 formatach (PDF, DOCX, XLSX, PPTX, obrazy, audio, HTML, CSV, JSON) na czysty Markdown. Idealne do przygotowania dokumentów dla modeli językowych — format Markdown jest oszczędny pod względem tokenów i natywnie wspierany przez współczesne LLM. Obsługuje OCR dla skanów, transkrypcję audio, ekstrakcję treści z YouTube'a oraz przetwarzanie dużych partii plików.
Jak używać
- Zainstaluj MarkItDown jako zależność w swoim projekcie Python. Narzędzie wymaga Pythona 3.8+ i jest dostępne w repozytorium GitHub (microsoft/markitdown). 2. Przygotuj plik do konwersji — może to być dokument Office (DOCX, XLSX, PPTX), PDF, obraz (PNG, JPG, GIF), plik audio (MP3, WAV), HTML, CSV, JSON, XML, EPUB lub link do YouTube'a. 3. Uruchom konwersję za pomocą skryptu lub API MarkItDown, podając ścieżkę do pliku wejściowego. Narzędzie automatycznie wykryje format i zastosuje odpowiednią metodę przetwarzania. 4. Dla obrazów zawierających tekst lub skanów dokumentów aktywuj OCR — MarkItDown wyodrębni tekst i strukturę. Dla plików audio narzędzie przeprowadzi transkrypcję do tekstu. 5. Otrzymasz wynik w formacie Markdown, gotowy do bezpośredniego użytku w promptach dla modeli AI lub jako źródło do dalszej edycji. 6. W przypadku przetwarzania wielu plików możesz zautomatyzować proces, przetwarzając całe foldery lub archiwa ZIP — MarkItDown obsługuje przetwarzanie wsadowe.