pdf

Name: pdf
Author: anthropics

autor: anthropics

Przetwarzaj, wyodrębniaj i generuj pliki PDF programowo – od formularzy po scalanie dokumentów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: anthropics
Kategoria: Data Science
Wyświetlenia: 144

Repozytorium GitHub

O skillu

Kompleksowy zestaw narzędzi do pracy z plikami PDF. Wyodrębniaj tekst i tabele, twórz nowe dokumenty, łącz i dziel pliki, wypełniaj formularze. Idealne do automatyzacji przetwarzania dokumentów na dużą skalę – Claude obsługuje wszystkie operacje od czytania metadanych po rotację stron i ekstrakcję danych z tabel.

Jak używać

Zainstaluj bibliotekę pypdf, która stanowi podstawę tego zestawu narzędzi: pip install pypdf. Biblioteka ta obsługuje wszystkie podstawowe operacje na plikach PDF.
Aby wyodrębnić tekst z dokumentu, wczytaj plik za pomocą PdfReader, przejdź przez wszystkie strony i zbierz tekst: dla każdej strony użyj metody extract_text(), a wyniki połącz w jeden ciąg znaków.
Do scalenia kilku plików PDF utwórz nowy PdfWriter, wczytaj każdy dokument źródłowy za pomocą PdfReader, dodaj wszystkie strony z każdego pliku do writera, a następnie zapisz wynik w nowym pliku.
Aby podzielić dokument na osobne pliki, wczytaj PDF, iteruj po każdej stronie, utwórz dla niej nowy PdfWriter, dodaj stronę i zapisz jako oddzielny plik (np. page_1.pdf, page_2.pdf).
Jeśli potrzebujesz wypełnić formularz PDF, zapoznaj się z dokumentacją forms.md dostępną w repozytorium – zawiera ona szczegółowe instrukcje i przykłady dla tej zaawansowanej operacji.
Do bardziej złożonych zadań, takich jak ekstrakcja tabel lub zaawansowana analiza, rozważ użycie biblioteki pdfplumber – dokumentacja reference.md zawiera przykłady i porównanie dostępnych bibliotek.

Podobne skille

claude-automation-recommender

autor: anthropics

Analizuj kod i odkryj, jakie automatyzacje Claude Code będą dla Ciebie najlepsze

Data Science

1787

codex

autor: Lucklyric

Zaawansowane rozumowanie AI do skomplikowanych zadań kodowania i architektury

Data Science

16163

nano-banana-pro

autor: garg-aayush

Generuj i edytuj obrazy za pomocą API Gemini 3 Pro – od tekstowych opisów do modyfikacji istniejących plików

Data Science

535772

data-storytelling

autor: wshobson

Zamień dane w przekonujące opowieści dla decydentów i inwestorów

Data Science

26105

deep-research

autor: davidorex

Automatyczne badanie złożonych problemów w VCV Rack — od szybkiej analizy do głębokich poszukiwań

Data Science

16151

pdf-processing

autor: Ming-Kai-LC

Przetwarzaj duże pliki PDF bez limitów Claude'a – dzielenie, ekstrakcja tekstu i OCR

Data Science

23134