data-transform

Name: data-transform
Author: Starlitnightly

autor: Starlitnightly

Czyszczenie i transformacja danych z pandas i numpy — działa z każdym dostawcą LLM

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: Starlitnightly
Kategoria: DevOps

Repozytorium GitHub

O skillu

Skill do kompleksowej transformacji danych: czyszczenia, normalizacji, zmiany formatu i inżynierii cech. Używa standardowych bibliotek Pythona (pandas, numpy, sklearn) i wykonuje się lokalnie w Twoim środowisku, bez zależności od konkretnego dostawcy LLM. Obsługuje usuwanie duplikatów, obsługę brakujących wartości, skalowanie cech, kodowanie kategorii, łączenie zbiorów danych i wiele innych operacji przygotowawczych.

Jak używać

Zainstaluj wymagane biblioteki: pandas, numpy i scikit-learn. Możesz to zrobić za pomocą pip install pandas numpy scikit-learn.
Załaduj swoje dane do ramki danych pandas za pomocą pd.read_csv() lub innej odpowiedniej metody wczytywania (Excel, JSON, SQL itp.).
Sprawdź jakość danych: wyświetl liczbę brakujących wartości za pomocą df.isnull().sum(), zidentyfikuj duplikaty i anomalie. To pomoże Ci zdecydować, które kroki czyszczenia są potrzebne.
Wyczyść dane poprzez usunięcie duplikatów (drop_duplicates()), obsługę brakujących wartości (fillna() lub dropna()) oraz usunięcie wartości odstających metodą IQR lub inną wybraną techniką.
Normalizuj lub skaluj cechy numeryczne za pomocą StandardScaler, MinMaxScaler lub RobustScaler z sklearn, w zależności od charakteru Twoich danych i algorytmu, który zamierzasz zastosować.
Przekształć dane kategoryczne: użyj LabelEncoder do kodowania porządkowego lub OneHotEncoder do kodowania nominalnego. Zmień format danych między formatem szerokim (wide) a długim (long) za pomocą pivot() lub melt() jeśli jest to konieczne.

Podobne skille

pmbok-project-management

autor: jgtolentino

Kompleksne metodologie zarządzania projektami zgodnie ze standardami PMBOK i PMP

DevOps

21133

cloudflare-manager

autor: qdhenry

Zarządzaj Workers, KV Storage, R2 i DNS na Cloudflare bezpośrednio z Claude

DevOps

20122

lambda

autor: itsmostafa

Zarządzaj funkcjami AWS Lambda bez serwera – twórz, debuguj i optymalizuj kod event-driven.

DevOps

127

macos-cleaner

autor: daymade

Analizuj i odbierz miejsce na dysku macOS dzięki inteligentnym rekomendacjom czyszczenia

DevOps

1331

context7

autor: mikha08-rgb

Przeszukuj GitHub w poszukiwaniu rozwiązań, błędów i przykładów kodu dla swoich projektów.

DevOps

51166

turborepo

autor: vercel

Zoptymalizuj budowanie monorepo – równoległa kompilacja z inteligentnym cache'owaniem

DevOps

1066