pdf-ocr-extraction
Wyciągaj tekst ze skanów i zdjęć PDF-ów za pomocą rozpoznawania znaków
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do ekstrakcji tekstu z dokumentów skanowanych i PDF-ów opartych na obrazach przy użyciu technologii OCR. Umożliwia digitalizację papierowych dokumentów, tworzenie przeszukiwalnych plików PDF oraz przetwarzanie tekstu drukowanego i ręcznie pisanego. Obsługuje przetwarzanie wsadowe wielu dokumentów jednocześnie. Najlepsze wyniki uzyskujesz z dokumentami maszynopisu (95%+ dokładność), dobrze radzi sobie też z książkami drukowanymi, formularzami i tabelami. Tekst ręcznie pisany wymaga większej ostrożności, szczególnie pismo kursywne.
Jak używać
Zainstaluj skill PDF OCR Extraction w swoim środowisku Claude'a, wybierając wersję claude-sonnet-4 lub claude-opus-4 jako model bazowy. Skill wymaga dostępu do narzędzi operacji na plikach i komputera.
Przygotuj dokument do przetworzenia — może to być skan PDF, zdjęcie dokumentu lub plik PDF oparty na obrazach. Upewnij się, że dokument jest czytelny i dobrze oświetlony, aby uzyskać najlepsze wyniki rozpoznawania.
Użyj podstawowego polecenia OCR, na przykład: "Wyciągnij tekst z tego skanowanego PDF" lub "Uczyń ten dokument przeszukiwalnym". Skill automatycznie wykryje język i przeliczy całą zawartość.
Jeśli chcesz przetwarzać tylko wybrane strony lub potrzebujesz określonego formatu wyjścia, dodaj opcje do polecenia, takie jak: "Wyciągnij tekst ze stron 1-10" lub "Wyciągnij i zwróć jako dane strukturalne".
Przejrzyj wynik ekstrakcji — skill zwraca tekst z informacją o liczbie przetworzonych stron, wykrytym języku i poziomie pewności. W przypadku tekstu ręcznie pisanego lub złożonych tabel sprawdź wynik i dokonaj ewentualnych poprawek ręcznych.
Dla przetwarzania wielu dokumentów powtórz proces dla każdego pliku lub użyj funkcji przetwarzania wsadowego, jeśli przetwarzasz większą liczbę dokumentów naraz.