smart-ocr
Wyodrębniaj tekst z obrazów i skanów w ponad 100 językach za pomocą PaddleOCR
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność inteligentnego rozpoznawania tekstu z obrazów, zrzutów ekranu, skanów PDF i dokumentów ręcznie pisanych. Korzysta z silnika PaddleOCR obsługującego ponad 100 języków, zwracając tekst wraz z danymi pozycji i pewnością rozpoznania. Idealna do automatyzacji ekstrakcji danych z dokumentów, wizytówek, tabel i wszelkich materiałów zawierających tekst w postaci graficznej.
Jak używać
Przygotuj obraz lub dokument skanowany, z którego chcesz wyodrębnić tekst. Może to być zrzut ekranu, fotografia, skan PDF lub dokument ręcznie pisany.
Przekaż plik umiejętności, podając obraz lub dokument jako dane wejściowe. Możesz opcjonalnie określić język lub języki, które mają być rozpoznawane (np. angielski, chiński, japoński).
Umiejętność przetworzy obraz za pomocą silnika PaddleOCR i zwróci wyodrębniony tekst wraz z informacjami o położeniu każdego fragmentu tekstu na obrazie oraz wskaźnikiem pewności rozpoznania.
Wykorzystaj zwrócone dane do dalszego przetwarzania — możesz skopiować tekst, zapisać go do pliku, przeanalizować zawartość lub zintegrować z innymi narzędziami.
W przypadku dokumentów wielojęzycznych umiejętność automatycznie rozpoznaje i wyodrębnia tekst ze wszystkich obsługiwanych języków jednocześnie, bez konieczności ręcznego ustawiania parametrów dla każdego języka.