Toolverse
Wszystkie skille

senior-data-engineer

autor: davila7

Umiejętność seniora inżyniera danych – projektuj skalowalne potoki danych i infrastrukturę

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
davila7
Kategoria
DevOps
Wyświetlenia
68

O skillu

Zaawansowana umiejętność do budowania produkcyjnych systemów przetwarzania danych. Obejmuje projektowanie architektur danych, orchestrację potoków ETL/ELT, walidację jakości danych i praktyki DataOps. Wspiera pracę z Python, SQL, Spark, Airflow, dbt i Kafka. Użyj jej do optymalizacji przepływów danych, implementacji governance oraz skalowania infrastruktury analitycznej.

Jak używać

  1. Sklonuj repozytorium z umiejętnością ze ścieżki cli-tool/components/skills/development/senior-data-engineer i zintegruuj ją ze swoim projektem Claude/Copilot.

  2. Przygotuj katalog z danymi wejściowymi oraz plik konfiguracyjny (config.yaml) zawierający parametry Twojego potoku danych – schemat bazy, źródła danych, cele transformacji.

  3. Uruchom orchestrator potoków poleceniem python scripts/pipeline_orchestrator.py --input data/ --output results/, aby zdefiniować i zaplanować sekwencję zadań ETL/ELT.

  4. Waliduj jakość danych za pomocą python scripts/data_quality_validator.py --target project/ --analyze, aby sprawdzić poprawność transformacji i zidentyfikować anomalie.

  5. Optymalizuj wydajność potoków poleceniem python scripts/etl_performance_optimizer.py --config config.yaml --deploy, aby wdrożyć zoptymalizowaną konfigurację w środowisku produkcyjnym.

  6. Konsultuj umiejętność w kwestiach projektowania architektur danych, wyboru narzędzi z modern data stack (Spark, Airflow, dbt, Kafka) oraz implementacji praktyk DataOps i governance.

Podobne skille