pyvene-interventions
Testuj hipotezy przyczynowe w modelach neuronowych za pomocą interwencji kauzalnych
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia przeprowadzanie interwencji przyczynowych na modelach PyTorch przy użyciu deklaratywnego frameworka pyvene. Narzędzie wspiera śledzenie przyczynowe, patching aktywacji, trening interwencji wymiennych oraz testowanie hipotez o zachowaniu komponentów modelu. Idealne dla badaczy zajmujących się interpretowalnością sieci neuronowych, którzy chcą dzielić się i odtwarzać eksperymenty interwencyjne.
Jak używać
Zainstaluj pyvene za pomocą pip install pyvene. Upewnij się, że masz zainstalowane zależności: PyTorch w wersji 2.0.0 lub wyższej, transformers w wersji 4.30.0 lub wyższej oraz pyvene w wersji 0.1.8 lub wyższej.
Zaimportuj bibliotekę w swoim skrypcie: import pyvene as pv. Przygotuj model PyTorch, który chcesz analizować — pyvene obsługuje dowolną architekturę, nie tylko transformery.
Opakuj swój model w klasę IntervenableModel, która dodaje możliwości interwencji. Zdefiniuj punkty interwencji, wskazując warstwy i komponenty, na których chcesz przeprowadzić eksperymenty.
Wybierz typ interwencji odpowiedni dla Twojego badania: śledzenie przyczynowe do lokalizacji wpływu komponentów (styl ROME), patching aktywacji do zamiany aktywacji między przebiegami, lub trening interwencji wymiennych (IIT) do bardziej zaawansowanych eksperymentów.
Uruchom eksperyment interwencyjny, przekazując dane wejściowe do modelu i obserwując, jak zmienia się jego zachowanie. Pyvene zwraca wyniki w formacie słownikowym, ułatwiającym analizę i reprodukcję.
Udostępnij swoje eksperymenty przez HuggingFace lub GitHub, korzystając z deklaratywnego formatu pyvene — inni badacze będą mogli łatwo odtworzyć Twoje wyniki.