azure-ai-evaluation-py

Name: azure-ai-evaluation-py
Author: openclaw

autor: openclaw

Oceniaj jakość i bezpieczeństwo aplikacji AI za pomocą wbudowanych i niestandardowych ewaluatorów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: openclaw
Kategoria: DevOps
Wyświetlenia: 5

Repozytorium GitHub

O skillu

Azure AI Evaluation SDK to narzędzie do Python, które pozwala systematycznie oceniać wydajność generatywnych aplikacji AI. Dysponujesz wbudowanymi ewaluatorami jakości (takie jak GroundednessEvaluator, RelevanceEvaluator, CoherenceEvaluator), ewaluatorami bezpieczeństwa (Violence, Sexual, SelfHarm, HateUnfairness) oraz metrykach NLP (F1Score, ROUGE, BLEU). Możesz również tworzyć własne ewaluatory dostosowane do Twoich potrzeb. SDK integruje się z Azure OpenAI do oceny wspomaganej AI i wspiera zdalne ewaluacje.

Jak używać

Zainstaluj pakiet Azure AI Evaluation za pomocą pip install azure-ai-evaluation. Jeśli planujesz używać zdalnych ewaluacji, dodaj opcję [remote]: pip install azure-ai-evaluation[remote].
Skonfiguruj zmienne środowiskowe dla Azure OpenAI: ustaw AZURE_OPENAI_ENDPOINT, AZURE_OPENAI_API_KEY i AZURE_OPENAI_DEPLOYMENT (np. gpt-4o-mini). Jeśli integrujesz się z Foundry, dodaj AIPROJECT_CONNECTION_STRING.
Zaimportuj wybrany ewaluator z azure.ai.evaluation. Dla oceny jakości wspomaganej AI wybierz GroundednessEvaluator, RelevanceEvaluator, CoherenceEvaluator, FluencyEvaluator, SimilarityEvaluator lub RetrievalEvaluator. Dla metryk NLP użyj F1ScoreEvaluator, RougeScoreEvaluator, BleuScoreEvaluator lub innych.
Utwórz konfigurację modelu zawierającą dane dostępu do Azure OpenAI (azure_endpoint, api_key, azure_deployment).
Zainicjalizuj wybrany ewaluator, przekazując konfigurację modelu: groundedness = GroundednessEvaluator(model_config).
Uruchom ewaluację na Twoich danych, przekazując odpowiednie dane wejściowe do metody ewaluatora, aby otrzymać metryki jakości i bezpieczeństwa aplikacji.

Podobne skille

drawio-diagrams-enhanced

autor: jgtolentino

Twórz profesjonalne diagramy draw.io z metodologią PMP i bibliotekami ikon

DevOps

918943

lambda

autor: itsmostafa

Zarządzaj funkcjami AWS Lambda bez serwera – twórz, debuguj i optymalizuj kod event-driven.

DevOps

127

unity-developer

autor: sickn33

Ekspert Unity do tworzenia gier z optymalizacją wydajności i wdrażaniem na wiele platform

DevOps

66164

context7

autor: mikha08-rgb

Przeszukuj GitHub w poszukiwaniu rozwiązań, błędów i przykładów kodu dla swoich projektów.

DevOps

51166

macos-cleaner

autor: daymade

Analizuj i odbierz miejsce na dysku macOS dzięki inteligentnym rekomendacjom czyszczenia

DevOps

1331

cloudflare-manager

autor: qdhenry

Zarządzaj Workers, KV Storage, R2 i DNS na Cloudflare bezpośrednio z Claude

DevOps

20122