nextflow-development
Uruchamiaj zaawansowane analizy sekwencjonowania DNA i RNA bez specjalistycznej wiedzy bioinformatycznej
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia uruchomienie profesjonalnych pipelinów bioinformatycznych nf-core (rnaseq, sarek, atacseq) na danych sekwencjonowania. Obsługuje zarówno lokalne pliki FASTQ, jak i publiczne zbiory danych z GEO i SRA. Automatycznie wykrywa analizy RNA-seq, wariantów genetycznych, ekspresji genów i dostępności chromatyny. Przeznaczony dla naukowców pracowniczych i badaczy bez specjalistycznego przygotowania bioinformatycznego, którzy potrzebują przeprowadzić analizy omics na dużą skalę.
Jak używać
Przygotuj dane wejściowe. Jeśli masz lokalne pliki FASTQ, przejdź do kroku 2. Jeśli chcesz analizować publiczny zbiór danych z GEO lub SRA, użyj skryptu sra_geo_fetch.py: najpierw pobierz informacje o studium (python scripts/sra_geo_fetch.py info GSE110004), następnie pobierz pliki FASTQ w trybie interaktywnym (python scripts/sra_geo_fetch.py download GSE110004 -o ./fastq -i), wreszcie wygeneruj plik samplesheet (python scripts/sra_geo_fetch.py samplesheet GSE110004 --fastq-dir ./fastq -o samplesheet.csv). Po każdym pobraniu potwierdź z systemem wybór podzbioru próbek i sugerowany genom.
Sprawdź środowisko. Uruchom python scripts/check_environment.py i upewnij się, że wszystkie krytyczne kontrole przeszły pomyślnie. Pipeline nie będzie działać bez tego kroku.
Wybierz pipeline. Zdecyduj, którą analizę chcesz uruchomić: rnaseq do analizy ekspresji genów, sarek do wariantów genetycznych (WGS/WES), lub atacseq do dostępności chromatyny. Potwierdź wybór.
Uruchom profil testowy. Wykonaj test pipeline na małym podzbiorze danych, aby sprawdzić konfigurację. Test musi przejść pomyślnie przed przejściem do pełnej analizy.
Utwórz plik samplesheet. Przygotuj plik CSV opisujący Twoje próbki i ich ścieżki do plików FASTQ. Potwierdź genom referencyjny, który będzie użyty w analizie.
Uruchom pełną analizę. Wykonaj pipeline z konfiguracją dla całego zbioru danych i zweryfikuj pliki wyjściowe po zakończeniu.