pdf-ocr-extraction

Name: pdf-ocr-extraction
Author: openclaw

autor: openclaw

Wyciągaj tekst ze skanów i zdjęć PDF-ów za pomocą rozpoznawania znaków

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: Bezpieczeństwo
Wyświetlenia: 24

Repozytorium GitHub

O skillu

Skill do ekstrakcji tekstu z dokumentów skanowanych i PDF-ów opartych na obrazach przy użyciu technologii OCR. Umożliwia digitalizację papierowych dokumentów, tworzenie przeszukiwalnych plików PDF oraz przetwarzanie tekstu drukowanego i ręcznie pisanego. Obsługuje przetwarzanie wsadowe wielu dokumentów jednocześnie. Najlepsze wyniki uzyskujesz z dokumentami maszynopisu (95%+ dokładność), dobrze radzi sobie też z książkami drukowanymi, formularzami i tabelami. Tekst ręcznie pisany wymaga większej ostrożności, szczególnie pismo kursywne.

Jak używać

Zainstaluj skill PDF OCR Extraction w swoim środowisku Claude'a, wybierając wersję claude-sonnet-4 lub claude-opus-4 jako model bazowy. Skill wymaga dostępu do narzędzi operacji na plikach i komputera.
Przygotuj dokument do przetworzenia — może to być skan PDF, zdjęcie dokumentu lub plik PDF oparty na obrazach. Upewnij się, że dokument jest czytelny i dobrze oświetlony, aby uzyskać najlepsze wyniki rozpoznawania.
Użyj podstawowego polecenia OCR, na przykład: "Wyciągnij tekst z tego skanowanego PDF" lub "Uczyń ten dokument przeszukiwalnym". Skill automatycznie wykryje język i przeliczy całą zawartość.
Jeśli chcesz przetwarzać tylko wybrane strony lub potrzebujesz określonego formatu wyjścia, dodaj opcje do polecenia, takie jak: "Wyciągnij tekst ze stron 1-10" lub "Wyciągnij i zwróć jako dane strukturalne".
Przejrzyj wynik ekstrakcji — skill zwraca tekst z informacją o liczbie przetworzonych stron, wykrytym języku i poziomie pewności. W przypadku tekstu ręcznie pisanego lub złożonych tabel sprawdź wynik i dokonaj ewentualnych poprawek ręcznych.
Dla przetwarzania wielu dokumentów powtórz proces dla każdego pliku lub użyj funkcji przetwarzania wsadowego, jeśli przetwarzasz większą liczbę dokumentów naraz.

Podobne skille

qmd

autor: tobi

Przeszukuj swoje notatki i dokumenty markdown za pomocą hybrydowego silnika wyszukiwania z AI

Bezpieczeństwo

1951

obsidian

autor: gapmiss

Kompletny przewodnik tworzenia wtyczek Obsidian z regułami ESLint i best practices

Bezpieczeństwo

14111

reviewing-code

autor: CaptainCrouton89

Systematyczna ocena zmian w kodzie pod kątem bezpieczeństwa, poprawności i zgodności ze specyfikacją

Bezpieczeństwo

1493

manim

autor: davila7

Twórz animacje matematyczne w Pythonie – framework do edukacyjnych filmów z równaniami i wykresami

Bezpieczeństwo

1588

ui-audit

autor: openclaw

Automatyczna ocena interfejsów według sprawdzonych zasad UX — szybko i świadomie.

Bezpieczeństwo

1223

typescript-review

autor: metabase

Automatyczna kontrola kodu TypeScript i JavaScript zgodnie ze standardami projektu

Bezpieczeństwo

17133