Toolverse
Wszystkie skille

databricks-migration-deep-dive

autor: jeremylongshore

Automatyzuj migrację danych do Databricks z systemów legacy, Hadoopa i magazynów danych.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Wyświetlenia
2

O skillu

Skill do kompleksowych migracji platformowych na Databricks z systemów lokalnych, chmur konkurencyjnych lub starszych magazynów danych. Obsługuje migracje z Hadoopa, Snowflake'a, Redshift'a, Synapse'a i Oracle'a. Zawiera strategie discovery, konwersji schematów, walidacji danych z batching'iem, konwersji ETL i planowanie cutover'u z procedurami rollback'u. Skraca czas migracji z 12-18 miesięcy do kilku miesięcy w zależności od źródła.

Jak używać

  1. Zainstaluj skill w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Write, Edit i Bash z uprawnieniami databricks:*.

  2. Przygotuj warunki wstępne: uzyskaj dostęp do systemów źródłowych i docelowych, włącz Unity Catalog w workspace'ie Databricks oraz udokumentuj bieżącą architekturę danych i zależności.

  3. Uruchom skill frazą wyzwalającą taką jak "migrate to databricks", "hadoop migration", "snowflake to databricks" lub "legacy migration", aby zainicjować proces.

  4. Wykonaj krok discovery and assessment — skill zinwentaryzuje wszystkie tabele źródłowe z metadanymi niezbędnymi do planowania migracji.

  5. Wybierz wzorzec migracji odpowiedni dla Twojego źródła: dla Hive Metastore użyj SYNC/CTAS/DEEP CLONE (dni), dla Hadoopa lift-and-shift (6-12 miesięcy), dla Snowflake'a parallel run (3-6 miesięcy), dla Redshift'a unload do S3 (3-6 miesięcy), dla starszych systemów full rebuild (12-18 miesięcy).

  6. Skill przeprowadzi konwersję schematów, migrację danych z walidacją, konwersję pipeline'ów ETL i zaplanuje cutover z procedurami rollback'u na wypadek problemów.

Podobne skille