smart-ocr

Name: smart-ocr
Author: openclaw

autor: openclaw

Wyodrębniaj tekst z obrazów i skanów w ponad 100 językach za pomocą PaddleOCR

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: Bezpieczeństwo

Repozytorium GitHub

O skillu

Umiejętność inteligentnego rozpoznawania tekstu z obrazów, zrzutów ekranu, skanów PDF i dokumentów ręcznie pisanych. Korzysta z silnika PaddleOCR obsługującego ponad 100 języków, zwracając tekst wraz z danymi pozycji i pewnością rozpoznania. Idealna do automatyzacji ekstrakcji danych z dokumentów, wizytówek, tabel i wszelkich materiałów zawierających tekst w postaci graficznej.

Jak używać

Przygotuj obraz lub dokument skanowany, z którego chcesz wyodrębnić tekst. Może to być zrzut ekranu, fotografia, skan PDF lub dokument ręcznie pisany.
Przekaż plik umiejętności, podając obraz lub dokument jako dane wejściowe. Możesz opcjonalnie określić język lub języki, które mają być rozpoznawane (np. angielski, chiński, japoński).
Umiejętność przetworzy obraz za pomocą silnika PaddleOCR i zwróci wyodrębniony tekst wraz z informacjami o położeniu każdego fragmentu tekstu na obrazie oraz wskaźnikiem pewności rozpoznania.
Wykorzystaj zwrócone dane do dalszego przetwarzania — możesz skopiować tekst, zapisać go do pliku, przeanalizować zawartość lub zintegrować z innymi narzędziami.
W przypadku dokumentów wielojęzycznych umiejętność automatycznie rozpoznaje i wyodrębnia tekst ze wszystkich obsługiwanych języków jednocześnie, bez konieczności ręcznego ustawiania parametrów dla każdego języka.

Podobne skille

accessibility-compliance

autor: wshobson

Twoje interfejsy będą dostępne dla wszystkich — WCAG 2.2, czytniki ekranu, klawiatura

Bezpieczeństwo

2173

manim

autor: davila7

Twórz animacje matematyczne w Pythonie – framework do edukacyjnych filmów z równaniami i wykresami

Bezpieczeństwo

1588

skill-writer

autor: pytorch

Twórz umiejętności agenta Claude z przewodnikiem po strukturze i najlepszych praktykach

Bezpieczeństwo

15116

google-analytics

autor: davila7

Analizuj dane Google Analytics i odkrywaj możliwości wzrostu Twojej strony

Bezpieczeństwo

1260

architect-review

autor: sickn33

Recenzje architektury oprogramowania przez doświadczonego architekta

Bezpieczeństwo

2773

llama-cpp

autor: zechenzhangAGI

Uruchamiaj modele językowe na CPU i Mac'ach bez karty NVIDIA

Bezpieczeństwo

11252