hugging-face-datasets
Twórz i zarządzaj zbiorami danych na Hugging Face Hub za pomocą SQL i automatycznych aktualizacji.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do tworzenia, konfiguracji i edycji zbiorów danych na platformie Hugging Face Hub. Umożliwia inicjalizację nowych repozytoriów, definiowanie konfiguracji i promptów systemowych, dodawanie wierszy bez pobierania całego zbioru oraz wykonywanie zaawansowanych zapytań SQL do transformacji i analizy danych. Pracuje razem z serwerem MCP Hugging Face, uzupełniając go o możliwości edycji i manipulacji danymi.
Jak używać
Zainstaluj wymagane zależności: huggingface_hub, duckdb oraz datasets. Skill wymaga również bibliotek wbudowanych json i time, które są dostępne domyślnie.
Zainicjuj nowy zbiór danych na Hub, podając nazwę repozytorium i strukturę katalogów. Skill automatycznie utworzy odpowiednią strukturę projektu i przygotuje repozytorium do pracy.
Skonfiguruj zbiór danych, definiując metadane, system prompty i inne parametry konfiguracyjne. Zapisane ustawienia będą dostępne dla wszystkich przyszłych operacji na tym zbiorze.
Dodawaj nowe wiersze danych za pomocą funkcji streamingu, która pozwala na efektywne aktualizacje bez konieczności pobierania i przesyłania całego zbioru danych.
Wykonuj zapytania SQL na zbiorach danych za pośrednictwem menedżera SQL (scripts/sql_manager.py). Możesz odkrywać schemat, pobierać próbki, wykonywać agregacje, filtrować i transformować dane, a następnie zapisywać wyniki lokalnie lub wysyłać je do nowych repozytoriów na Hub.
Dla złożonych przepływów pracy używaj tego skilla do edycji i transformacji danych, a serwer MCP Hugging Face do wyszukiwania i pobierania metadanych zbiorów.