Toolverse
Wszystkie skille

vastai-prod-checklist

autor: jeremylongshore

Checklist do wdrażania zadań GPU na Vast.ai – zabezpieczenie, monitoring i kontrola kosztów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Umożliwia ci systematyczne przygotowanie i uruchomienie obciążeń GPU w środowisku produkcyjnym na platformie Vast.ai. Skill zawiera pełną listę kontrolną obejmującą konfigurację konta, wybór instancji, bezpieczeństwo danych, ochronę przed przerwaniami spot oraz monitorowanie. Użyj go przed wdrożeniem pipeline'u treningowego, audytem gotowości do produkcji lub uruchomieniem dużych zadań GPU.

Jak używać

  1. Zainstaluj skill w swoim środowisku Claude Code lub Codex, upewniając się, że masz dostęp do narzędzi Bash (vastai:, curl:), Read i Grep.

  2. Przygotuj wymagane warunki wstępne: aktywne konto Vast.ai z wystarczającymi kredytami, przetestowane i opublikowane obrazy Docker w rejestrze oraz pipeline treningowy oparty na checkpointach.

  3. Wyzwól skill frazami takimi jak "vastai production", "deploy vastai", "vastai go-live" lub "vastai launch checklist" w kontekście wdrażania.

  4. Przejdź przez sekcje checklist'y: (a) weryfikacja klucza API w menedżerze sekretów, dedykowana para kluczy SSH i saldo konta; (b) walidacja typu GPU, ustawienie filtrów niezawodności (≥0.98) i prędkości internetu (≥200 Mbps), przydział dysku z 20% buforem; (c) szyfrowanie danych treningowych, zapisywanie checkpointów co N kroków, przesyłanie do S3/GCS, usuwanie danych przed zniszczeniem instancji.

  5. Skonfiguruj ochronę przed przerwaniami spot, ustawienia monitorowania i alerty kosztów, aby zapobiec nieoczekiwanym wydatkom i utracie postępu treningu.

  6. Uruchom skill w trybie audytu przed faktycznym wdrożeniem, aby upewnić się, że wszystkie punkty checklist'y zostały spełnione i twoje środowisko produkcyjne jest gotowe.

Podobne skille