Toolverse
Wszystkie skille

lamindb

autor: K-Dense-AI

Zarządzaj danymi biologicznymi z pełną śledowalością i powtarzalnością

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
1

O skillu

LaminDB to otwartoźródłowy framework do zarządzania danymi biologicznymi, który czyni je przeszukiwalne, śledowalne i zgodne ze standardami FAIR. Narzędzie integruje lakehouse, śledzenie lineażu, ontologie biologiczne oraz możliwości LIMS i ELN w jednym interfejsie Python. Obsługuje sekwencjonowanie RNA, cytometrię przepływową, dane przestrzenne i inne formaty biologiczne. Automatycznie śledzi przepływy pracy, waliduje schematy danych i integruje się z menedżerami workflow (Nextflow, Snakemake) oraz platformami MLOps (Weights & Biases, MLflow).

Jak używać

  1. Zainstaluj LaminDB za pomocą pip w swoim środowisku Python — narzędzie wymaga Python 3.8 lub nowszego. Upewnij się, że masz dostęp do repozytorium GitHub K-Dense-AI, gdzie znajduje się ta umiejętność.

  2. Zaimportuj LaminDB w swoim skrypcie lub notebooku Jupyter i zainicjuj instancję bazy danych, wskazując ścieżkę do lokalnego lub zdalnego magazynu danych. Możesz pracować z istniejącą bazą lub utworzyć nową.

  3. Załaduj swoje dane biologiczne (scRNA-seq, spatial transcriptomics, flow cytometry itp.) używając wbudowanych funkcji importu. LaminDB automatycznie rejestruje źródło danych i tworzy metadane.

  4. Zastosuj schematy walidacji i adnotacje ontologiczne — użyj standardowych ontologii biologicznych (geny, typy komórek, choroby, tkanki) aby opisać swoje dane. To zapewnia zgodność ze standardami FAIR i ułatwia wyszukiwanie.

  5. Śledź lineaż danych poprzez całą analizę — każde przekształcenie, skrypt lub notebook są automatycznie rejestrowane. Możesz w każdej chwili odtworzyć wyniki lub przejrzeć historię zmian.

  6. Integruj z istniejącymi workflow — połącz LaminDB z Nextflow, Snakemake lub platformami MLOps takimi jak Weights & Biases, aby automatycznie zarządzać danymi w całym pipeline'u badawczym.

Podobne skille