pytdc

Name: pytdc
Author: davila7

autor: davila7

Gotowe datasety do odkrywania leków i predykcji farmakologicznych z benchmarkami ML

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: DevOps
Wyświetlenia: 18

Repozytorium GitHub

O skillu

PyTDC to platforma open-science z kuratowanymi, gotowymi do pracy z AI datasetami dla odkrywania leków i rozwoju terapii. Dostęp do zbiorów danych obejmujących całą linię produkcyjną terapii: predykcję właściwości molekularnych (ADME, toksyczność), interakcje lek-cel, interakcje lek-lek oraz generowanie nowych molekuł. Każdy dataset zawiera standaryzowane metryki ewaluacji, prawidłowe podziały train/test (scaffold, cold-split) i molekularne orakle do optymalizacji właściwości.

Jak używać

Zainstaluj PyTDC za pomocą pip: uruchom polecenie uv pip install PyTDC w terminalu. Jeśli chcesz zaktualizować do najnowszej wersji, użyj uv pip install PyTDC --upgrade. Wszystkie wymagane zależności (numpy, pandas, scikit-learn i inne) zainstalują się automatycznie.
Zaimportuj odpowiednią kategorię problemu do swojego skryptu Pythona. Wybierz jedną z trzech kategorii: single_pred dla predykcji właściwości molekularnych, multi_pred dla interakcji lek-cel lub lek-lek, albo generation dla generowania nowych molekuł.
Załaduj dataset, tworząc instancję zadania i podając nazwę datasetu. Na przykład: data = Task(name='nazwa_datasetu'), gdzie Task pochodzi z wybranej kategorii problemu.
Podziel dane na zbiory treningowy, walidacyjny i testowy za pomocą metody get_split(). Określ metodę podziału (np. scaffold dla podziału na podstawie szkieletów molekularnych), seed dla powtarzalności i frakcje podziału: split = data.get_split(method='scaffold', seed=1, frac=[0.7, 0.1, 0.2]).
Pobierz dane w preferowanym formacie (DataFrame Pandas lub inny) używając get_data(format='df'). Teraz masz gotowy dataset z prawidłowymi podziałami do trenowania i ewaluacji modelu.
Trenuj swój model uczenia maszynowego na zbiorze treningowym i ewaluuj na zbiorze testowym, korzystając ze standaryzowanych metryk dostępnych w PyTDC dla danego zadania farmakologicznego.

Podobne skille

task-master

autor: sfc-gh-dflippo

Zarządzaj złożonymi projektami z AI — automatyczne rozbijanie zadań, śledzenie zależności, specification-driven development

DevOps

14126

drawio-diagrams-enhanced

autor: jgtolentino

Twórz profesjonalne diagramy draw.io z metodologią PMP i bibliotekami ikon

DevOps

918943

clawhub

autor: openclaw

Zarządzaj umiejętnościami agentów: szukaj, instaluj, aktualizuj i publikuj za pomocą ClawHub CLI

DevOps

14106

senior-computer-vision

autor: davila7

Zaawansowana umiejętność widzenia komputerowego do budowy produkcyjnych systemów AI z detekcją obiektów i segmentacją.

DevOps

1044

turborepo

autor: vercel

Zoptymalizuj budowanie monorepo – równoległa kompilacja z inteligentnym cache'owaniem

DevOps

1066

grafana-dashboards

autor: wshobson

Twórz dashboardy Grafany do monitorowania metryk systemowych i aplikacyjnych w czasie rzeczywistym

DevOps

92262