table-extractor

Name: table-extractor
Author: openclaw

autor: openclaw

Wyciągaj tabele z PDF-ów z precyzją – obsługuje złożone struktury i tabele bez obramowania

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: Bezpieczeństwo
Wyświetlenia: 25

Repozytorium GitHub

O skillu

Umiejętność do ekstrakcji tabel z dokumentów PDF przy użyciu biblioteki camelot. Obsługuje zarówno tabele z widocznymi obramowaniami, jak i tabele bezobramowe, tabele ze scalonymi komórkami oraz wielostronicowe layouty. Wyniki otrzymujesz jako ramki danych pandas, gotowe do dalszej obróbki lub eksportu do Excela. Obsługuje dwie metody detekcji: lattice dla tabel z liniami oraz stream dla tabel bez obramowania.

Jak używać

Przygotuj plik PDF zawierający tabele, które chcesz wyekstrahować. Możesz pracować z pojedynczymi stronami lub całymi dokumentami wielostronicowymi.
Przekaż plik do umiejętności, podając podstawową instrukcję, np. "Wyciągnij wszystkie tabele z tego PDF" lub "Pobierz tabelę ze strony 5 tego raportu".
Jeśli dokument zawiera tabele z widocznymi obramowaniami (linie, ramki), umiejętność automatycznie użyje metody lattice, która wykrywa tabele na podstawie linii i granic.
Dla tabel bez obramowania lub z tekstem pozycjonowanym w kolumnach, możesz poprosić o użycie metody stream, która analizuje rozmieszczenie tekstu. Przykład: "Wyciągnij tabele bezobramowe z tego dokumentu".
Wskaż konkretne strony, jeśli chcesz ograniczyć ekstrakcję – możesz podać pojedynczą stronę ("strona 1"), wiele stron ("strony 1, 3, 5") lub zakres ("strony 1-5").
Otrzymasz wyniki jako strukturyzowane dane (pandas DataFrames), które możesz następnie eksportować do formatu Excel, CSV lub innego wybranego formatu.

Podobne skille

software-security

autor: project-codeguard

Bezpieczny kod od początku — umiejętność dla agentów AI integrująca się z Project CodeGuard

Bezpieczeństwo

1678

ui-audit

autor: openclaw

Automatyczna ocena interfejsów według sprawdzonych zasad UX — szybko i świadomie.

Bezpieczeństwo

1223

obsidian

autor: gapmiss

Kompletny przewodnik tworzenia wtyczek Obsidian z regułami ESLint i best practices

Bezpieczeństwo

14111

windows-ui-automation

autor: martinholovsky

Automatyzuj aplikacje Windows z bezpiecznym dostępem do UI Automation i Win32 API

Bezpieczeństwo

10115

accessibility-compliance

autor: wshobson

Twoje interfejsy będą dostępne dla wszystkich — WCAG 2.2, czytniki ekranu, klawiatura

Bezpieczeństwo

2173

youtube-watcher

autor: openclaw

Pobierz transkrypcje filmów YouTube i wyciągaj z nich informacje

Bezpieczeństwo

2231