pdf-extraction

Name: pdf-extraction
Author: openclaw

autor: openclaw

Wyciągaj tekst, tabele i metadane z PDF-ów za pomocą pdfplumber

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: Bezpieczeństwo

Repozytorium GitHub

O skillu

Umiejętność precyzyjnego ekstrakcji danych z dokumentów PDF. Używając biblioteki pdfplumber, możesz wydobywać tekst, tabele, obrazy i metadane z dowolnego pliku PDF. W przeciwieństwie do podstawowych czytników, pdfplumber oferuje dokładne pozycjonowanie znaków, niezawodne wykrywanie tabel i narzędzia do debugowania. Idealne do automatyzacji pracy z raportami finansowymi, fakturami, umowami i innymi dokumentami strukturyzowanymi.

Jak używać

Przygotuj plik PDF, z którego chcesz wydobyć dane. Może to być raport, faktura, umowa lub dowolny inny dokument.
Określ, co chcesz wyekstrahować: tekst ze wszystkich stron, konkretne strony, tabele, obrazy lub metadane (tytuł, autora, datę utworzenia).
Poproś umiejętność o wykonanie zadania, używając naturalnego języka. Przykłady: "Wyciągnij wszystkie tabele z tego raportu finansowego", "Pobierz tekst ze stron 5-10", "Znajdź i wyekstrahuj sumę z tej faktury", "Przekonwertuj tę tabelę PDF na CSV".
Umiejętność wygeneruje kod pdfplumber i automatycznie go wykonuje, przetwarzając Twój dokument.
Otrzymasz wyekstrahowane dane w żądanym formacie – tekst, tabelę, listę metadanych lub plik CSV/Excel.
Możesz poprosić o dodatkowe przetwarzanie, takie jak filtrowanie danych, zmianę formatu lub wyekstrahowanie konkretnych sekcji z wyników.

Podobne skille

reverse-engineering-tools

autor: gmh5225

Przewodnik po narzędziach inżynierii wstecznej dla badań bezpieczeństwa gier

Bezpieczeństwo

3168

reviewing-code

autor: CaptainCrouton89

Systematyczna ocena zmian w kodzie pod kątem bezpieczeństwa, poprawności i zgodności ze specyfikacją

Bezpieczeństwo

1493

feishu-docs

autor: openclaw

Zarządzaj dokumentami Feishu przez API — twórz, edytuj, usuwaj i udostępniaj zawartość programowo.

Bezpieczeństwo

1574

better-auth-best-practices

autor: novuhq

Integruj Better Auth – framework uwierzytelniania TypeScript z obsługą OAuth, magic linków i passkeys

Bezpieczeństwo

1148

academic-researcher

autor: Shubhamsaboo

Asystent do analiz naukowych, przeglądów literatury i pisania prac badawczych

Bezpieczeństwo

1260

payload

autor: payloadcms

Asystent Claude do projektów Payload CMS — debugowanie, konfiguracja i optymalizacja API

Bezpieczeństwo

50171