Toolverse
Wszystkie skille

hugging-face-datasets

autor: patchy631

Twórz i zarządzaj zbiorami danych na Hugging Face Hub za pomocą SQL i automatycznych aktualizacji.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
2

O skillu

Skill do tworzenia, konfiguracji i edycji zbiorów danych na platformie Hugging Face Hub. Umożliwia inicjalizację nowych repozytoriów, definiowanie konfiguracji i promptów systemowych, dodawanie wierszy bez pobierania całego zbioru oraz wykonywanie zaawansowanych zapytań SQL do transformacji i analizy danych. Pracuje razem z serwerem MCP Hugging Face, uzupełniając go o możliwości edycji i manipulacji danymi.

Jak używać

  1. Zainstaluj wymagane zależności: huggingface_hub, duckdb oraz datasets. Skill wymaga również bibliotek wbudowanych json i time, które są dostępne domyślnie.

  2. Zainicjuj nowy zbiór danych na Hub, podając nazwę repozytorium i strukturę katalogów. Skill automatycznie utworzy odpowiednią strukturę projektu i przygotuje repozytorium do pracy.

  3. Skonfiguruj zbiór danych, definiując metadane, system prompty i inne parametry konfiguracyjne. Zapisane ustawienia będą dostępne dla wszystkich przyszłych operacji na tym zbiorze.

  4. Dodawaj nowe wiersze danych za pomocą funkcji streamingu, która pozwala na efektywne aktualizacje bez konieczności pobierania i przesyłania całego zbioru danych.

  5. Wykonuj zapytania SQL na zbiorach danych za pośrednictwem menedżera SQL (scripts/sql_manager.py). Możesz odkrywać schemat, pobierać próbki, wykonywać agregacje, filtrować i transformować dane, a następnie zapisywać wyniki lokalnie lub wysyłać je do nowych repozytoriów na Hub.

  6. Dla złożonych przepływów pracy używaj tego skilla do edycji i transformacji danych, a serwer MCP Hugging Face do wyszukiwania i pobierania metadanych zbiorów.

Podobne skille