data-engineer

Name: data-engineer
Author: sickn33

autor: sickn33

Projektuj skalowalne potoki danych i nowoczesne magazyny z Apache Spark, dbt i Airflow

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: sickn33
Kategoria: DevOps
Wyświetlenia: 19

Repozytorium GitHub

O skillu

Umiejętność inżyniera danych do budowania niezawodnych potoków danych, magazynów i architektur lakehouse. Obejmuje projektowanie batch'owych i streamingowych potoków, implementację data mesh, integrację nowoczesnego stosu danych (Fivetran/Airbyte + dbt + Snowflake/BigQuery) oraz monitorowanie jakości i kosztów. Użyj proaktywnie do projektowania infrastruktury analitycznej, implementacji governance danych lub budowy platform cloud-native.

Jak używać

Załaduj umiejętność data-engineer do swojego agenta lub Claude'a. Umiejętność aktywuje się automatycznie, gdy będziesz projektować potoki danych, magazyny lub architektury lakehouse.
Zdefiniuj źródła danych, umowy dotyczące danych (data contracts) i wymagane SLA. Opisz, skąd pochodzą dane, jak często się aktualizują i jakie są wymagania dotyczące opóźnień.
Wybierz architekturę i narzędzia: określ, czy potrzebujesz przetwarzania batch'owego czy streamingowego, jakie magazyny danych (Snowflake, BigQuery, Redshift) i narzędzia orkiestracji (Airflow, dbt) będą pasować do Twoich wymagań.
Zaplanuj ingestion, transformacje i walidację danych. Umiejętność pomoże Ci zbudować etapy oczyszczania, transformacji i kontroli jakości przed zapisem do systemów produkcyjnych.
Wdrażaj zabezpieczenia: upewnij się, że dane osobowe (PII) są chronione, zastosuj least-privilege access i waliduj dane przed zapisem w produkcji.
Monitoruj niezawodność, koszty i wydajność potoków. Umiejętność wspiera ustawienie alertów, śledzenie lineage danych i optymalizację kosztów infrastruktury cloud.

Podobne skille

task-master

autor: sfc-gh-dflippo

Zarządzaj złożonymi projektami z AI — automatyczne rozbijanie zadań, śledzenie zależności, specification-driven development

DevOps

14126

cloudflare-manager

autor: qdhenry

Zarządzaj Workers, KV Storage, R2 i DNS na Cloudflare bezpośrednio z Claude

DevOps

20122

planning-with-files

autor: davila7

Planuj złożone zadania z plikami markdown — jak Manus, ale w Twoim projekcie

DevOps

2365

docker-containerization

autor: openclaw

Generuj gotowe do produkcji konfiguracje Docker dla aplikacji Node.js i Next.js

DevOps

1334

postmortem-writing

autor: wshobson

Pisz postmortemy bez obwiniania — z analizą przyczyn i planem działań

DevOps

1385

crawl4ai

autor: basher83

Automatyczne pobieranie i ekstrakcja danych ze stron internetowych, nawet tych z JavaScript

DevOps

11128