Przetwarzaj, wyodrębniaj i generuj pliki PDF programowo – od formularzy po scalanie dokumentów
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Kompleksowy zestaw narzędzi do pracy z plikami PDF. Wyodrębniaj tekst i tabele, twórz nowe dokumenty, łącz i dziel pliki, wypełniaj formularze. Idealne do automatyzacji przetwarzania dokumentów na dużą skalę – Claude obsługuje wszystkie operacje od czytania metadanych po rotację stron i ekstrakcję danych z tabel.
Jak używać
Zainstaluj bibliotekę pypdf, która stanowi podstawę tego zestawu narzędzi:
pip install pypdf. Biblioteka ta obsługuje wszystkie podstawowe operacje na plikach PDF.Aby wyodrębnić tekst z dokumentu, wczytaj plik za pomocą PdfReader, przejdź przez wszystkie strony i zbierz tekst: dla każdej strony użyj metody extract_text(), a wyniki połącz w jeden ciąg znaków.
Do scalenia kilku plików PDF utwórz nowy PdfWriter, wczytaj każdy dokument źródłowy za pomocą PdfReader, dodaj wszystkie strony z każdego pliku do writera, a następnie zapisz wynik w nowym pliku.
Aby podzielić dokument na osobne pliki, wczytaj PDF, iteruj po każdej stronie, utwórz dla niej nowy PdfWriter, dodaj stronę i zapisz jako oddzielny plik (np. page_1.pdf, page_2.pdf).
Jeśli potrzebujesz wypełnić formularz PDF, zapoznaj się z dokumentacją forms.md dostępną w repozytorium – zawiera ona szczegółowe instrukcje i przykłady dla tej zaawansowanej operacji.
Do bardziej złożonych zadań, takich jak ekstrakcja tabel lub zaawansowana analiza, rozważ użycie biblioteki pdfplumber – dokumentacja reference.md zawiera przykłady i porównanie dostępnych bibliotek.
Podobne skille
claude-automation-recommender
autor: anthropics
codex
autor: Lucklyric
nano-banana-pro
autor: garg-aayush
data-storytelling
autor: wshobson
deep-research
autor: davidorex
pdf-processing
autor: Ming-Kai-LC