L
layout-analyzer
Analizuj strukturę dokumentów i wykrywaj bloki tekstu, tabele oraz kolejność czytania
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do analizy layoutu dokumentów oparty na bibliotece surya. Automatycznie wykrywa elementy strukturalne: bloki tekstu, tabele, nagłówki, figury i określa kolejność czytania. Idealne do przetwarzania złożonych dokumentów, gdzie musisz zrozumieć ich organizację i hierarchię. Obsługuje obrazy i pliki PDF, zwracając precyzyjne informacje o położeniu i typie każdego elementu na stronie.
Jak używać
- Przygotuj dokument — przesyłając obraz strony (PNG, JPG) lub plik PDF, który chcesz przeanalizować.
- Określ, co chcesz wykryć — poproś o analizę konkretnych elementów (tabele, nagłówki, akapity) lub pełną strukturę dokumentu.
- Wyślij polecenie do skilla — użyj naturalnego opisu, np. "Przeanalizuj layout tej strony", "Znajdź wszystkie tabele i bloki tekstu" lub "Określ kolejność czytania tego dokumentu".
- Skill przetworzy dokument — biblioteka surya automatycznie zidentyfikuje elementy strukturalne, ich typy (tekst, tytuł, nagłówek sekcji, lista, tabela, figura, podpis, przypis, formuła, nagłówek strony, stopka) i ich położenie.
- Otrzymasz wyniki — skill zwróci informacje o wykrytych elementach, ich lokalizacji na stronie i ustalonej kolejności czytania, którą możesz wykorzystać do dalszego przetwarzania lub eksportu.
Podobne skille
Y
youtube-watcher
autor: openclaw
Bezpieczeństwo
2231
R
reverse-engineering-tools
autor: gmh5225
Bezpieczeństwo
3168
A
accessibility-compliance
autor: wshobson
Bezpieczeństwo
2173
1
1password
autor: openclaw
Bezpieczeństwo
1174
S
skill-writer
autor: pytorch
Bezpieczeństwo
15116
O
openapi-spec-generation
autor: wshobson
Bezpieczeństwo
18109