P
pysam
Pysam — Python toolkit do pracy z plikami genomicznymi w bioinformatyce
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Pysam to moduł Pythona do czytania, edycji i zapisywania danych genomicznych. Pracuj z plikami wyrównań (SAM/BAM/CRAM), wariantów (VCF/BCF) i sekwencji (FASTA/FASTQ) za pomocą interfejsu Pythona do biblioteki htslib. Ekstrahuj regiony genomowe, obliczaj pokrycie odczytów, analizuj warianty genetyczne i buduj potoki bioinformatyczne. Idealne do przetwarzania danych sekwencjonowania NGS, kontroli jakości i anotacji wariantów.
Jak używać
- Zainstaluj pysam za pomocą menedżera pakietów: uruchom polecenie
uv pip install pysamw terminalu. 2. Przygotuj plik genomiczny do analizy — może to być plik wyrównania (BAM), wariantów (VCF) lub sekwencji referencyjnej (FASTA). 3. Aby odczytać plik wyrównania, zaimportuj moduł pysam, otwórz plik za pomocąAlignmentFile(), a następnie iteruj po odczytach w wybranym regionie genomowym używając metodyfetch()— na przykładfetch("chr1", 1000, 2000)pobierze wszystkie odczyty z chromosomu 1 między pozycjami 1000 a 2000. 4. Do pracy z wariantami genetycznymi otwórz plik VCF za pomocąVariantFile()i iteruj po wariantach — każdy wariant zawiera informacje o chromosomie, pozycji, allelu referencyjnym i allelu alternatywnym. 5. Aby wyekstrahować sekwencję z pliku FASTA, użyjFastaFile()i metodyfetch()z podaniem chromosomu i zakresu pozycji — zwróci to sekwencję DNA dla tego regionu. 6. Po zakończeniu analizy zamknij pliki za pomocą metodyclose(), aby zwolnić zasoby.