databricks-migration-deep-dive
Automatyzuj migrację danych do Databricks z systemów legacy, Hadoopa i magazynów danych.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do kompleksowych migracji platformowych na Databricks z systemów lokalnych, chmur konkurencyjnych lub starszych magazynów danych. Obsługuje migracje z Hadoopa, Snowflake'a, Redshift'a, Synapse'a i Oracle'a. Zawiera strategie discovery, konwersji schematów, walidacji danych z batching'iem, konwersji ETL i planowanie cutover'u z procedurami rollback'u. Skraca czas migracji z 12-18 miesięcy do kilku miesięcy w zależności od źródła.
Jak używać
Zainstaluj skill w swoim środowisku Claude Code, Codex lub OpenClaw, upewniając się, że masz dostęp do narzędzi Read, Write, Edit i Bash z uprawnieniami databricks:*.
Przygotuj warunki wstępne: uzyskaj dostęp do systemów źródłowych i docelowych, włącz Unity Catalog w workspace'ie Databricks oraz udokumentuj bieżącą architekturę danych i zależności.
Uruchom skill frazą wyzwalającą taką jak "migrate to databricks", "hadoop migration", "snowflake to databricks" lub "legacy migration", aby zainicjować proces.
Wykonaj krok discovery and assessment — skill zinwentaryzuje wszystkie tabele źródłowe z metadanymi niezbędnymi do planowania migracji.
Wybierz wzorzec migracji odpowiedni dla Twojego źródła: dla Hive Metastore użyj SYNC/CTAS/DEEP CLONE (dni), dla Hadoopa lift-and-shift (6-12 miesięcy), dla Snowflake'a parallel run (3-6 miesięcy), dla Redshift'a unload do S3 (3-6 miesięcy), dla starszych systemów full rebuild (12-18 miesięcy).
Skill przeprowadzi konwersję schematów, migrację danych z walidacją, konwersję pipeline'ów ETL i zaplanuje cutover z procedurami rollback'u na wypadek problemów.