ocr

Name: ocr
Author: trpc-group

autor: trpc-group

Wyciągaj tekst z obrazów w ponad 100 językach za pomocą Tesseract OCR

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: trpc-group
Kategoria: Data Science
Wyświetlenia: 44

Repozytorium GitHub

O skillu

Umiejętność do automatycznego rozpoznawania i ekstrakcji tekstu z plików graficznych. Obsługuje ponad 100 języków, w tym angielski, chiński, japoński, koreański i wiele innych. Możesz przetwarzać obrazy lokalne lub pobierane z URL-i, a wynik otrzymać w postaci zwykłego tekstu lub JSON-a z wynikami pewności rozpoznania. Opcjonalne wstępne przetwarzanie obrazu (konwersja do skali szarości, progowanie) poprawia dokładność ekstrakcji, szczególnie w przypadku słabej jakości skanów.

Jak używać

Zainstaluj wymagane zależności: Python 3.8 lub nowszy, bibliotekę pytesseract, Pillow (PIL) oraz tesseract-ocr dla systemu operacyjnego. Na większości systemów Linux wystarczy zainstalować pakiet tesseract-ocr przez menedżer pakietów, na macOS użyj Homebrew, a na Windows pobierz instalator z oficjalnej strony projektu Tesseract.
Przygotuj obraz do przetworzenia. Umiejętność obsługuje formaty PNG, JPG, JPEG, GIF, BMP, TIFF i WEBP. Możesz pracować z plikami lokalnymi lub podać URL do obrazu w internecie.
Uruchom skrypt OCR z podstawowymi parametrami: python3 scripts/ocr.py ścieżka_do_obrazu.png plik_wyjściowy.txt. Domyślnie rozpoznawanie odbywa się w języku angielskim, a wynik zapisywany jest jako zwykły tekst.
Jeśli obraz zawiera tekst w innym języku, dodaj parametr --lang z kodem języka, na przykład --lang chi_sim dla chińskiego uproszczonego lub --lang jpn dla japońskiego. Możesz również połączyć wiele kodów języków znakiem plus: --lang eng+chi_sim.
Aby poprawić dokładność rozpoznawania słabej jakości obrazów, dodaj flagę --preprocess, która automatycznie zastosuje przetwarzanie wstępne takie jak konwersja do skali szarości i progowanie.
Jeśli potrzebujesz wyniku w formacie JSON z wynikami pewności dla każdego słowa, dodaj parametr --format json. Dla obrazów z URL-i użyj skryptu ocr_url.py zamiast ocr.py i podaj pełny adres URL jako pierwszy parametr.

Podobne skille

xlsx

autor: anthropics

Twórz, edytuj i analizuj arkusze kalkulacyjne z formułami i wykresami

Data Science

40128

pptx

autor: anthropics

Twórz, edytuj i analizuj prezentacje PowerPoint bezpośrednio w Claude'u

Data Science

134310

deepwiki-rs

autor: sopaco

Generuj dokumentację architektury i analizuj kod za pomocą AI — bez ręcznego pisania

Data Science

18144

nano-banana-pro

autor: garg-aayush

Generuj i edytuj obrazy za pomocą API Gemini 3 Pro – od tekstowych opisów do modyfikacji istniejących plików

Data Science

535772

claude-automation-recommender

autor: anthropics

Analizuj kod i odkryj, jakie automatyzacje Claude Code będą dla Ciebie najlepsze

Data Science

1787

threejs

autor: mrgoonie

Twórz interaktywne aplikacje 3D w przeglądarce z Three.js i WebGL

Data Science

1743