Toolverse
Wszystkie skille

gget

autor: davila7

Szybkie zapytania do 20+ baz danych bioinformatycznych z linii poleceń

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
davila7
Kategoria
Mobile
Wyświetlenia
25

O skillu

gget to narzędzie CLI i pakiet Pythona do szybkich zapytań bioinformatycznych. Uzyskaj dostęp do ponad 20 baz danych: informacji o genach (Ensembl, UniProt), struktur białek (AlphaFold), danych ekspresji (ARCHS4), adnotacji (Enrichr, OpenTargets), mutacji (COSMIC) oraz pobrań genomów. Idealne do szybkich wyszukiwań BLAST i analiz sekwencji. Wszystkie moduły działają zarówno z linii poleceń, jak i jako funkcje Pythona, zwracając wyniki w formacie JSON, CSV lub DataFrame.

Jak używać

  1. Zainstaluj gget w czystym środowisku wirtualnym, aby uniknąć konfliktów zależności. Użyj polecenia uv pip install gget (rekomendowane) lub pip install --upgrade gget. W Pythonie lub Jupyter zaimportuj pakiet: import gget.

  2. Poznaj podstawową składnię. Z linii poleceń używaj gget <moduł> [argumenty] [opcje]. W Pythonie wywołaj funkcję: gget.moduł(argumenty, opcje). Wyniki domyślnie zwracane są jako JSON (CLI) lub DataFrame/słownik (Python).

  3. Pobierz genom referencyjny za pomocą modułu ref. Przykład: gget ref homo_sapiens zwróci linki do pobrania i metadane genomu człowieka. Użyj flagi -w aby wybrać konkretne typy plików (gtf, dna, pep itp.).

  4. Wykonaj wyszukiwanie BLAST dla szybkiego porównania sekwencji. Moduł blast jest preferowany do szybkich zapytań; dla zaawansowanego przetwarzania wsadowego rozważ biopython.

  5. Zapytaj o informacje o genach, strukturach białek lub danych ekspresji, wybierając odpowiedni moduł (np. gene info, AlphaFold, ARCHS4). Wszystkie moduły obsługują flagi -o (zapis do pliku) i -csv (format CSV w CLI).

  6. Pamiętaj, że bazy danych są regularnie aktualizowane. gget jest testowany co dwa tygodnie i aktualizowany, aby dopasować się do nowych struktur baz danych.

Podobne skille