Toolverse
Wszystkie skille

data-exploration

autor: anthropics

Zrozum strukturę i jakość swoich danych przed analizą

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
34

O skillu

Skill do systematycznego profilowania zbiorów danych. Odkrywaj rozkład kolumn, identyfikuj braki i anomalie, oceniaj jakość danych. Przydatny gdy spotykasz nowy dataset — sprawdzisz jego kształt, unikalność kluczy, zakresy wartości i wzorce. Klasyfikuje kolumny na identyfikatory, wymiary, metryki i pola czasowe, a następnie oblicza statystyki dla każdego typu: liczby wartości null, kardynalność, percentyle dla liczb, długości dla tekstów, zakresy dat.

Jak używać

  1. Zainstaluj skill data-exploration w swoim środowisku Claude lub Copilot, dodając go do dostępnych narzędzi analitycznych.

  2. Załaduj lub wskaż dataset, który chcesz zbadać — może to być tabela SQL, plik CSV lub inny format strukturalny.

  3. Uruchom fazę strukturalnego zrozumienia: policz wiersze i kolumny, zidentyfikuj klucz główny, sprawdź datę ostatniej aktualizacji i zasięg czasowy danych.

  4. Sklasyfikuj każdą kolumnę jako identyfikator, wymiar, metrykę, pole czasowe, tekst, flagę logiczną lub strukturę zagnieżdżoną.

  5. Dla każdej kolumny oblicz profil: liczę wartości null i ich odsetek, liczbę wartości unikatowych, top 5–10 wartości najczęstszych. Dla kolumn liczbowych dodaj min, max, średnią, medianę i percentyle (p1, p5, p25, p75, p95, p99). Dla tekstowych zmierz długości i sprawdź spójność wielkości liter.

  6. Przejrzyj raport profilowania, aby podjąć decyzję o wymiarach do analizy, wykryć anomalie i ocenić przydatność danych do dalszych prac.

Podobne skille