Toolverse
Wszystkie skille

ocr

autor: trpc-group

Wyciągaj tekst z obrazów w ponad 100 językach za pomocą Tesseract OCR

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
44

O skillu

Umiejętność do automatycznego rozpoznawania i ekstrakcji tekstu z plików graficznych. Obsługuje ponad 100 języków, w tym angielski, chiński, japoński, koreański i wiele innych. Możesz przetwarzać obrazy lokalne lub pobierane z URL-i, a wynik otrzymać w postaci zwykłego tekstu lub JSON-a z wynikami pewności rozpoznania. Opcjonalne wstępne przetwarzanie obrazu (konwersja do skali szarości, progowanie) poprawia dokładność ekstrakcji, szczególnie w przypadku słabej jakości skanów.

Jak używać

  1. Zainstaluj wymagane zależności: Python 3.8 lub nowszy, bibliotekę pytesseract, Pillow (PIL) oraz tesseract-ocr dla systemu operacyjnego. Na większości systemów Linux wystarczy zainstalować pakiet tesseract-ocr przez menedżer pakietów, na macOS użyj Homebrew, a na Windows pobierz instalator z oficjalnej strony projektu Tesseract.

  2. Przygotuj obraz do przetworzenia. Umiejętność obsługuje formaty PNG, JPG, JPEG, GIF, BMP, TIFF i WEBP. Możesz pracować z plikami lokalnymi lub podać URL do obrazu w internecie.

  3. Uruchom skrypt OCR z podstawowymi parametrami: python3 scripts/ocr.py ścieżka_do_obrazu.png plik_wyjściowy.txt. Domyślnie rozpoznawanie odbywa się w języku angielskim, a wynik zapisywany jest jako zwykły tekst.

  4. Jeśli obraz zawiera tekst w innym języku, dodaj parametr --lang z kodem języka, na przykład --lang chi_sim dla chińskiego uproszczonego lub --lang jpn dla japońskiego. Możesz również połączyć wiele kodów języków znakiem plus: --lang eng+chi_sim.

  5. Aby poprawić dokładność rozpoznawania słabej jakości obrazów, dodaj flagę --preprocess, która automatycznie zastosuje przetwarzanie wstępne takie jak konwersja do skali szarości i progowanie.

  6. Jeśli potrzebujesz wyniku w formacie JSON z wynikami pewności dla każdego słowa, dodaj parametr --format json. Dla obrazów z URL-i użyj skryptu ocr_url.py zamiast ocr.py i podaj pełny adres URL jako pierwszy parametr.

Podobne skille