pdf-processing-pro

Name: pdf-processing-pro
Author: davila7

autor: davila7

Przetwarzaj PDFy w produkcji: formularze, tabele, OCR i walidacja

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Backend
Wyświetlenia: 103

Repozytorium GitHub

O skillu

Zestaw narzędzi do profesjonalnego przetwarzania plików PDF z gotowymi skryptami, obsługą błędów i wsparciem dla złożonych przepływów pracy. Ekstrahuj tekst, analizuj formularze, wyodrębniaj tabele i przetwarzaj duże ilości dokumentów. Każdy skrypt zawiera walidację danych, szczegółowe logowanie, podpowiedzi typów dla edytorów kodu oraz interfejs CLI. Idealne do automatyzacji pracy z formularzami PDF, raportami zawierającymi tabele, zeskanowanymi dokumentami oraz operacjami wsadowymi w środowisku produkcyjnym.

Jak używać

Zainstaluj zależności wymagane przez narzędzie, w tym bibliotekę pdfplumber i inne moduły Python wymienione w dokumentacji projektu.
Pobierz skrypty z repozytorium, zwłaszcza analyze_form.py, fill_form.py i extract_tables.py, które znajdują się w katalogu scripts.
Aby przeanalizować formularz PDF i uzyskać listę wszystkich pól, uruchom skrypt analyze_form.py wskazując plik wejściowy i opcję --output do zapisania wyniku w formacie JSON.
Przygotuj plik JSON z danymi do wypełnienia formularza, zgodnie ze strukturą pól zwróconą w kroku 3.
Uruchom skrypt fill_form.py z plikiem PDF, plikiem danych JSON i ścieżką do pliku wyjściowego; skrypt automatycznie zwaliduje wszystkie pola przed wypełnieniem i zgłosi błędy.
Dla dokumentów zawierających tabele użyj skryptu extract_tables.py, który automatycznie wykryje i wyodrębni tabele do pliku CSV z prawidłowo zidentyfikowanymi kolumnami.

Podobne skille

postgresql-psql

autor: timelessco

Interaktywny terminal do PostgreSQL – wykonuj zapytania, zarządzaj bazami i automatyzuj administrację

Backend

34173

stripe-integration

autor: wshobson

Integracja płatności Stripe z pełną obsługą subskrypcji i webhooków

Backend

40147

humanizer

autor: davila7

Usuń ślady AI z tekstu i przywróć mu naturalny, ludzki ton

Backend

2873

literature-review

autor: K-Dense-AI

Systematyczne przeglądy literatury naukowej z weryfikacją cytacji i formatowaniem PDF

Backend

238507

gog

autor: openclaw

Zarządzaj Gmailem, Kalendarzem i Dyskiem Google z linii poleceń

Backend

34126

youtube-transcribe-skill

autor: feiskyer

Pobierz napisy z YouTube'a i zapisz je lokalnie w kilka sekund

Backend

24178