trulens-dataset-curation

Name: trulens-dataset-curation
Author: truera

autor: truera

Twórz zestawy ewaluacyjne z danymi referencyjnymi do testowania aplikacji LLM

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: truera
Kategoria: Data Science

Repozytorium GitHub

O skillu

Umożliwia budowanie i organizowanie zbiorów danych do oceny wydajności aplikacji opartych na modelach językowych. Przygotuj zestawy zawierające zapytania, oczekiwane odpowiedzi i fragmenty kontekstu, aby porównywać rzeczywiste wyniki modelu z danymi referencyjnymi. Dzięki temu możesz śledzić jakość aplikacji na różnych wersjach i udostępniać wyniki ewaluacji zespołowi. Narzędzie integruje się z TruLens i wspiera pracę z danymi w formacie pandas.

Jak używać

Zainstaluj wymagane biblioteki poleceniem pip install trulens pandas. 2. Zaimportuj TruSession z modułu trulens.core i zainicjuj sesję: session = TruSession(). 3. Przygotuj dane w formacie pandas DataFrame z kolumnami: query (wymagana — pytanie lub zapytanie), query_id (opcjonalna — unikalny identyfikator), expected_response (opcjonalna — oczekiwana odpowiedź) oraz expected_chunks (opcjonalna — oczekiwane fragmenty kontekstu pobrane z bazy). 4. Strukturyzuj dane tak, aby każdy wiersz reprezentował jedno pytanie testowe z odpowiadającymi mu danymi referencyjnymi. 5. Przekaż przygotowany DataFrame do TruLens w celu porównania rzeczywistych wyników aplikacji z wartościami referencyjnymi. 6. Wykorzystaj wyniki ewaluacji do śledzenia zmian wydajności między wersjami aplikacji i współpracy z zespołem nad poprawą jakości.

Podobne skille

market-research-reports

autor: davila7

Raporty badań rynku na poziomie firm konsultingowych w kilka minut

Data Science

16115

arxiv-search

autor: langchain-ai

Przeszukuj arXiv i znajdź najnowsze prace badawcze z fizyki, matematyki i informatyki

Data Science

76172

skill-creator

autor: anthropics

Twórz umiejętności dla Claude'a – rozszerz jego możliwości o specjalistyczną wiedzę i przepływy pracy

Data Science

59147

data-storytelling

autor: wshobson

Zamień dane w przekonujące opowieści dla decydentów i inwestorów

Data Science

26105

nano-banana-pro

autor: garg-aayush

Generuj i edytuj obrazy za pomocą API Gemini 3 Pro – od tekstowych opisów do modyfikacji istniejących plików

Data Science

535772

threejs

autor: mrgoonie

Twórz interaktywne aplikacje 3D w przeglądarce z Three.js i WebGL

Data Science

1743