dask

Name: dask
Author: davila7

autor: davila7

Przetwarzaj duże zbiory danych równolegle, bez ograniczeń pamięci RAM

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Data Science
Wyświetlenia: 5

Repozytorium GitHub

O skillu

Dask to biblioteka Pythona do obliczeń równoległych i rozproszonych. Pozwala pracować z zestawami danych większymi niż dostępna pamięć RAM, skalując operacje pandas i NumPy na pojedynczych maszynach lub klastrach. Obsługuje przetwarzanie wielu plików (CSV, Parquet, JSON), budowanie niestandardowych przepływów pracy z zależnościami zadań oraz rozprowadzanie obciążenia na wiele rdzeni lub maszyn. Idealne do ETL, analizy szeregów czasowych i pracy z danymi terabajtowymi.

Jak używać

Zainstaluj bibliotekę Dask w swoim środowisku Python za pomocą pip (pip install dask[dataframe]).
Zaimportuj moduł dask.dataframe, aby pracować z danymi tabelarycznymi w formacie równoległym, analogicznie do pandas.
Wczytaj dane z jednego lub wielu plików (CSV, Parquet, JSON) używając funkcji read_csv, read_parquet lub read_json z dask.dataframe — obsługuje wzorce glob do przetwarzania całych katalogów.
Wykonuj operacje na danych (filtrowanie, groupby, agregacje, złączenia) tak jak w pandas — Dask automatycznie paralelizuje obliczenia na dostępnych rdzeniach.
Dla zaawansowanych przypadków użyj map_partitions do zastosowania niestandardowych funkcji na poszczególnych partycjach danych.
Wywołaj compute() na wyniku, aby uruchomić obliczenia i pobrać ostateczny wynik — Dask buduje graf zadań i wykonuje go efektywnie.

Podobne skille

skill-installer

autor: openai

Instaluj umiejętności Codex z oficjalnej listy lub prywatnych repozytoriów GitHub.

Data Science

23118

moon-dev-trading-agents

autor: moondevonyt

48+ agentów AI do autonomicznego handlu kryptowalutami na wielu giełdach

Data Science

102232

openrouter

autor: rawveg

Dostęp do 400+ modeli AI przez jeden API z automatycznym routingiem i fallbackami

Data Science

17138

threejs

autor: mrgoonie

Twórz interaktywne aplikacje 3D w przeglądarce z Three.js i WebGL

Data Science

1743

nano-banana-pro

autor: garg-aayush

Generuj i edytuj obrazy za pomocą API Gemini 3 Pro – od tekstowych opisów do modyfikacji istniejących plików

Data Science

535772

pdf

autor: anthropics

Przetwarzaj, wyodrębniaj i generuj pliki PDF programowo – od formularzy po scalanie dokumentów

Data Science

31144