arize-phoenix
Obserwuj, debuguj i optymalizuj aplikacje AI z pełną widocznością LLM
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Phoenix to otwarta platforma obserwacyjna dla aplikacji opartych na modelach językowych. Śledź wykonanie kodu AI, mierz jakość odpowiedzi za pomocą ewaluatorów, iteruj prompty na podstawie rzeczywistych danych produkcyjnych i porównuj wersje aplikacji. Zintegrowana z OpenTelemetry, pozwala monitorować koszty, opóźnienia i błędy, budować datasety do fine-tuningu oraz optymalizować systemy RAG i agentów.
Jak używać
Zainstaluj Phoenix jako skill w swoim środowisku agenta. Narzędzie wymaga integracji z OpenTelemetry, więc upewnij się, że Twoja aplikacja AI wysyła traces do platformy.
Skonfiguruj tracing dla Twoich LLM calls, tool executions i operacji retrieval. Phoenix automatycznie zbiera szczegółowe informacje o każdym kroku wykonania aplikacji — od promptów po odpowiedzi modelu.
Zdefiniuj ewaluatory do pomiaru jakości outputów. Możesz użyć wbudowanych ewaluatorów opartych na LLM-as-a-judge lub napisać własną logikę oceny w kodzie, aby mierzyć metryki istotne dla Twojego przypadku użycia.
Iteruj nad promptami, korzystając z rzeczywistych przykładów z produkcji. Phoenix umożliwia testowanie wariantów promptów i porównywanie ich wydajności na tych samych danych.
Uruchamiaj eksperymenty porównujące różne wersje aplikacji — zmieniane modele, architektury lub strategie. Platforma wspiera analizę wyników i identyfikację najlepszych konfiguracji.
Monitoruj metryki produkcyjne takie jak koszty tokenów, latencja i wskaźniki błędów. Buduj datasety z traces do dalszego fine-tuningu modeli lub ewaluacji.
Podobne skille
windows-ui-automation
autor: martinholovsky
openapi-spec-generation
autor: wshobson
1password
autor: openclaw
architect-review
autor: sickn33
backend-security-coder
autor: sickn33
software-security
autor: project-codeguard