Toolverse
Wszystkie skille

data-extractor

autor: openclaw

Wyciągaj strukturalne dane z dowolnego formatu dokumentu automatycznie

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Umiejętność do ekstrakcji danych ze wszystkich popularnych formatów dokumentów — PDF, Word, Excel, email, HTML i obrazów. Używa biblioteki unstructured do ujednoliconego przetwarzania, niezależnie od typu pliku otrzymujesz spójnie sformatowane, strukturalne dane z metadanymi. Idealna do automatyzacji pracy z dokumentami, parsowania tabel, wyodrębniania tekstu i konwersji mieszanych formatów.

Jak używać

  1. Przygotuj dokument do przetworzenia — obsługiwane są PDF, dokumenty Word, arkusze Excel, emaile, strony HTML, obrazy i wiele innych formatów.

  2. Przekaż dokument umiejętności wraz z opcjonalnym opisem, co chcesz wyciągnąć. Na przykład: "Wyciągnij wszystkie tabele z tego PDF-a", "Sparsuj tego emaila i zwróć treść oraz załączniki" lub "Przekonwertuj tę stronę HTML na strukturalne elementy".

  3. Umiejętność automatycznie wykryje format dokumentu i zastosuje odpowiednią funkcję przetwarzania z biblioteki unstructured.

  4. Otrzymasz wyodrębnionych elementy z metadanymi — każdy element zawiera typ, tekst i informacje o pochodzeniu. Dane są już ustrukturyzowane i gotowe do dalszego użytku.

  5. Możesz przetwarzać wiele dokumentów naraz, mieszając różne formaty w jednym żądaniu — umiejętność obsługuje je jednakowo.

Podobne skille