mlops-prototyping
Strukturyzowane notebooki Jupyter dla MLOps – powtarzalne prototypy bez technicznych długów
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do tworzenia produkcyjnych prototypów w Jupyter poprzez egzekwowanie standardowej struktury: importy, konfiguracja, ładowanie danych, analiza, modelowanie i ewaluacja. Zapobiega wycieków danych i technicznych długów poprzez wymuszenie pipeline'ów scikit-learn, zarządzania zmiennością oraz walidacji podziałów treningowo-testowych. Idealne dla zespołów pracujących nad eksperymentami ML, które muszą być powtarzalne i gotowe do produkcji.
Jak używać
Upewnij się, że projekt jest zarządzany przez
uvi masz aktywne środowisko wirtualne (.venv). Skill działa w kontekście pliku.ipynblub podczas konwersji do niego.Utwórz nowy notebook i zacznij od sekcji tytułu z opisem celu eksperymentu. Następnie dodaj sekcję importów, grupując biblioteki standardowe, zewnętrzne i specyficzne dla zadania.
W sekcji konfiguracji zdefiniuj wszystkie parametry na górze notebooka:
RANDOM_STATE = 42, ścieżki danych za pomocąpathlib.Path, hiperparametry modelu (np.N_ESTIMATORS,MAX_DEPTH) oraz flagi dla operacji wymagających zasobów (np.USE_GPU,RUN_GRID_SEARCH).Załaduj i zwaliduj dane w dedykowanej sekcji, następnie podziel je na zbiory treningowy i testowy, zawsze używając
RANDOM_STATEdla powtarzalności.Przeprowadź eksploracyjną analizę danych (EDA) w osobnej sekcji – sprawdź rozkłady zmiennej docelowej i korelacje między cechami.
Definiuj modele jako obiekty
sklearn.pipeline.Pipelinew sekcji modelowania, trenuj je na danych treningowych i ewaluuj metryki na zbiorze testowym, nigdy nie mieszając danych treningowych z testowymi.