Toolverse
Wszystkie skille

pdf-ocr-extraction

autor: openclaw

Wyciągaj tekst ze skanów i zdjęć PDF-ów za pomocą rozpoznawania znaków

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Wyświetlenia
24

O skillu

Skill do ekstrakcji tekstu z dokumentów skanowanych i PDF-ów opartych na obrazach przy użyciu technologii OCR. Umożliwia digitalizację papierowych dokumentów, tworzenie przeszukiwalnych plików PDF oraz przetwarzanie tekstu drukowanego i ręcznie pisanego. Obsługuje przetwarzanie wsadowe wielu dokumentów jednocześnie. Najlepsze wyniki uzyskujesz z dokumentami maszynopisu (95%+ dokładność), dobrze radzi sobie też z książkami drukowanymi, formularzami i tabelami. Tekst ręcznie pisany wymaga większej ostrożności, szczególnie pismo kursywne.

Jak używać

  1. Zainstaluj skill PDF OCR Extraction w swoim środowisku Claude'a, wybierając wersję claude-sonnet-4 lub claude-opus-4 jako model bazowy. Skill wymaga dostępu do narzędzi operacji na plikach i komputera.

  2. Przygotuj dokument do przetworzenia — może to być skan PDF, zdjęcie dokumentu lub plik PDF oparty na obrazach. Upewnij się, że dokument jest czytelny i dobrze oświetlony, aby uzyskać najlepsze wyniki rozpoznawania.

  3. Użyj podstawowego polecenia OCR, na przykład: "Wyciągnij tekst z tego skanowanego PDF" lub "Uczyń ten dokument przeszukiwalnym". Skill automatycznie wykryje język i przeliczy całą zawartość.

  4. Jeśli chcesz przetwarzać tylko wybrane strony lub potrzebujesz określonego formatu wyjścia, dodaj opcje do polecenia, takie jak: "Wyciągnij tekst ze stron 1-10" lub "Wyciągnij i zwróć jako dane strukturalne".

  5. Przejrzyj wynik ekstrakcji — skill zwraca tekst z informacją o liczbie przetworzonych stron, wykrytym języku i poziomie pewności. W przypadku tekstu ręcznie pisanego lub złożonych tabel sprawdź wynik i dokonaj ewentualnych poprawek ręcznych.

  6. Dla przetwarzania wielu dokumentów powtórz proces dla każdego pliku lub użyj funkcji przetwarzania wsadowego, jeśli przetwarzasz większą liczbę dokumentów naraz.

Podobne skille