data-stats-analysis
Testy statystyczne i analiza korelacji dla każdego dostawcy LLM — bez chmury, lokalnie
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia przeprowadzenie testów statystycznych, analizy hipotez, badania korelacji i korekt dla testów wielokrotnych przy użyciu bibliotek scipy i statsmodels. Działa z dowolnym dostawcą LLM — GPT, Gemini, Claude, DeepSeek czy Qwen. Wykonuje się lokalnie w Twoim środowisku, bez konieczności korzystania z rozwiązań opartych na chmurze. Obsługuje testy t, ANOVA, testy nieparametryczne, obliczanie przedziałów ufności i testowanie normalności rozkładu.
Jak używać
Zainstaluj wymagane biblioteki: numpy, pandas, scipy i statsmodels. Umieść skill w katalogu .claude/skills/ swojego projektu lub zarejestruj go u dostawcy LLM zgodnie z jego dokumentacją.
Zaimportuj niezbędne moduły w swoim skrypcie: numpy, pandas, scipy.stats (w tym ttest_ind, mannwhitneyu, pearsonr, spearmanr, f_oneway, kruskal, chi2_contingency) oraz statsmodels.stats.multitest (multipletests). Dodaj suppresswarnings, aby wyciszyć ostrzeżenia.
Przygotuj dane — wczytaj je do tablic numpy lub ramek danych pandas. Upewnij się, że dane są w formacie numerycznym i podzielone na grupy lub zmienne, które chcesz porównać.
Wybierz odpowiedni test na podstawie Twojego pytania badawczego: użyj ttest_ind do porównania średnich dwóch grup, f_oneway lub kruskal do porównania trzech lub więcej grup, pearsonr lub spearmanr do badania korelacji między zmiennymi, chi2_contingency do testów niezależności dla danych kategorycznych.
Wykonaj test, przekazując dane do wybranej funkcji. Otrzymasz statystykę testową i wartość p. Zinterpretuj wynik: jeśli p < 0,05, różnica lub korelacja jest istotna statystycznie.
Jeśli przeprowadzasz wiele testów jednocześnie, zastosuj korektę dla testów wielokrotnych za pomocą multipletests z statsmodels, aby kontrolować wskaźnik fałszywych odkryć (FDR) lub metodę Bonferroniego.