Toolverse
Wszystkie skille

layout-analyzer

autor: openclaw

Analizuj strukturę dokumentów i wykrywaj bloki tekstu, tabele oraz kolejność czytania

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Wyświetlenia
3

O skillu

Skill do analizy layoutu dokumentów oparty na bibliotece surya. Automatycznie wykrywa elementy strukturalne: bloki tekstu, tabele, nagłówki, figury i określa kolejność czytania. Idealne do przetwarzania złożonych dokumentów, gdzie musisz zrozumieć ich organizację i hierarchię. Obsługuje obrazy i pliki PDF, zwracając precyzyjne informacje o położeniu i typie każdego elementu na stronie.

Jak używać

  1. Przygotuj dokument — przesyłając obraz strony (PNG, JPG) lub plik PDF, który chcesz przeanalizować.
  2. Określ, co chcesz wykryć — poproś o analizę konkretnych elementów (tabele, nagłówki, akapity) lub pełną strukturę dokumentu.
  3. Wyślij polecenie do skilla — użyj naturalnego opisu, np. "Przeanalizuj layout tej strony", "Znajdź wszystkie tabele i bloki tekstu" lub "Określ kolejność czytania tego dokumentu".
  4. Skill przetworzy dokument — biblioteka surya automatycznie zidentyfikuje elementy strukturalne, ich typy (tekst, tytuł, nagłówek sekcji, lista, tabela, figura, podpis, przypis, formuła, nagłówek strony, stopka) i ich położenie.
  5. Otrzymasz wyniki — skill zwróci informacje o wykrytych elementach, ich lokalizacji na stronie i ustalonej kolejności czytania, którą możesz wykorzystać do dalszego przetwarzania lub eksportu.

Podobne skille