Toolverse
Wszystkie skille

mlops-prototyping

autor: fmind

Strukturyzowane notebooki Jupyter dla MLOps – powtarzalne prototypy bez technicznych długów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
fmind
Kategoria
DevOps

O skillu

Skill do tworzenia produkcyjnych prototypów w Jupyter poprzez egzekwowanie standardowej struktury: importy, konfiguracja, ładowanie danych, analiza, modelowanie i ewaluacja. Zapobiega wycieków danych i technicznych długów poprzez wymuszenie pipeline'ów scikit-learn, zarządzania zmiennością oraz walidacji podziałów treningowo-testowych. Idealne dla zespołów pracujących nad eksperymentami ML, które muszą być powtarzalne i gotowe do produkcji.

Jak używać

  1. Upewnij się, że projekt jest zarządzany przez uv i masz aktywne środowisko wirtualne (.venv). Skill działa w kontekście pliku .ipynb lub podczas konwersji do niego.

  2. Utwórz nowy notebook i zacznij od sekcji tytułu z opisem celu eksperymentu. Następnie dodaj sekcję importów, grupując biblioteki standardowe, zewnętrzne i specyficzne dla zadania.

  3. W sekcji konfiguracji zdefiniuj wszystkie parametry na górze notebooka: RANDOM_STATE = 42, ścieżki danych za pomocą pathlib.Path, hiperparametry modelu (np. N_ESTIMATORS, MAX_DEPTH) oraz flagi dla operacji wymagających zasobów (np. USE_GPU, RUN_GRID_SEARCH).

  4. Załaduj i zwaliduj dane w dedykowanej sekcji, następnie podziel je na zbiory treningowy i testowy, zawsze używając RANDOM_STATE dla powtarzalności.

  5. Przeprowadź eksploracyjną analizę danych (EDA) w osobnej sekcji – sprawdź rozkłady zmiennej docelowej i korelacje między cechami.

  6. Definiuj modele jako obiekty sklearn.pipeline.Pipeline w sekcji modelowania, trenuj je na danych treningowych i ewaluuj metryki na zbiorze testowym, nigdy nie mieszając danych treningowych z testowymi.

Podobne skille