doc-parser

Name: doc-parser
Author: openclaw

autor: openclaw

Parsuj złożone dokumenty z precyzją – tabele, figury i wielokolumnowe układy

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: Bezpieczeństwo
Wyświetlenia: 2

Repozytorium GitHub

O skillu

Umiejętność zaawansowanego parsowania dokumentów oparta na bibliotece docling od IBM. Obsługuje pliki PDF, Word, PowerPoint, obrazy i HTML – ekstrahuje tabele, figury i tekst, zachowując strukturę dokumentu. Idealny do analizy raportów, artykułów naukowych i skomplikowanych layoutów. Zwraca dane w formacie markdown lub strukturyzowanym, gotowym do dalszego przetwarzania.

Jak używać

Udostępnij dokument do parsowania – może to być plik PDF, Word (.docx), PowerPoint (.pptx), obraz (.png, .jpg) lub HTML. Narzędzie obsługuje zarówno dokumenty natywne, jak i zeskanowane.
Określ, co chcesz wyekstrahować – czy interesują Cię tabele, figury z podpisami, cały tekst czy struktura dokumentu. Możesz poprosić o konkretne elementy lub pełną analizę.
Umiejętność przetworzy dokument za pomocą docling i zwróci dane w formacie markdown lub strukturyzowanym. Tekst zostanie wyekstrahowany z zachowaniem oryginalnego układu, tabele będą czytelne, a figury zidentyfikowane.
Wykorzystaj wynik – skopiuj markdown do edytora, użyj danych do dalszej analizy lub zintegruj z innym procesem. Struktura dokumentu jest w pełni zachowana, co ułatwia pracę z wielokolumnowymi i złożonymi layoutami.
W razie potrzeby poproś o konwersję do innego formatu – umiejętność obsługuje eksport do markdown, co czyni dane uniwersalnymi i łatwymi do przetworzenia.

Podobne skille

qmd

autor: tobi

Przeszukuj swoje notatki i dokumenty markdown za pomocą hybrydowego silnika wyszukiwania z AI

Bezpieczeństwo

1951

accessibility-compliance

autor: wshobson

Twoje interfejsy będą dostępne dla wszystkich — WCAG 2.2, czytniki ekranu, klawiatura

Bezpieczeństwo

2173

backend-security-coder

autor: sickn33

Bezpieczny kod backendowy – walidacja, autentykacja i ochrona API

Bezpieczeństwo

1133

typescript-review

autor: metabase

Automatyczna kontrola kodu TypeScript i JavaScript zgodnie ze standardami projektu

Bezpieczeństwo

17133

manim

autor: davila7

Twórz animacje matematyczne w Pythonie – framework do edukacyjnych filmów z równaniami i wykresami

Bezpieczeństwo

1588

senior-security

autor: davila7

Kompleksny zestaw narzędzi do testowania bezpieczeństwa, modelowania zagrożeń i audytów zgodności

Bezpieczeństwo

2482