lamindb
Zarządzaj danymi biologicznymi z pełną śledowalością i powtarzalnością
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
LaminDB to otwartoźródłowy framework do zarządzania danymi biologicznymi, który czyni je przeszukiwalne, śledowalne i zgodne ze standardami FAIR. Narzędzie integruje lakehouse, śledzenie lineażu, ontologie biologiczne oraz możliwości LIMS i ELN w jednym interfejsie Python. Obsługuje sekwencjonowanie RNA, cytometrię przepływową, dane przestrzenne i inne formaty biologiczne. Automatycznie śledzi przepływy pracy, waliduje schematy danych i integruje się z menedżerami workflow (Nextflow, Snakemake) oraz platformami MLOps (Weights & Biases, MLflow).
Jak używać
Zainstaluj LaminDB za pomocą pip w swoim środowisku Python — narzędzie wymaga Python 3.8 lub nowszego. Upewnij się, że masz dostęp do repozytorium GitHub K-Dense-AI, gdzie znajduje się ta umiejętność.
Zaimportuj LaminDB w swoim skrypcie lub notebooku Jupyter i zainicjuj instancję bazy danych, wskazując ścieżkę do lokalnego lub zdalnego magazynu danych. Możesz pracować z istniejącą bazą lub utworzyć nową.
Załaduj swoje dane biologiczne (scRNA-seq, spatial transcriptomics, flow cytometry itp.) używając wbudowanych funkcji importu. LaminDB automatycznie rejestruje źródło danych i tworzy metadane.
Zastosuj schematy walidacji i adnotacje ontologiczne — użyj standardowych ontologii biologicznych (geny, typy komórek, choroby, tkanki) aby opisać swoje dane. To zapewnia zgodność ze standardami FAIR i ułatwia wyszukiwanie.
Śledź lineaż danych poprzez całą analizę — każde przekształcenie, skrypt lub notebook są automatycznie rejestrowane. Możesz w każdej chwili odtworzyć wyniki lub przejrzeć historię zmian.
Integruj z istniejącymi workflow — połącz LaminDB z Nextflow, Snakemake lub platformami MLOps takimi jak Weights & Biases, aby automatycznie zarządzać danymi w całym pipeline'u badawczym.