nemo-guardrails
Zabezpiecz swoje aplikacje AI przed atakami i błędami modeli w czasie rzeczywistym
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
NeMo Guardrails to framework bezpieczeństwa od NVIDIA, który chroni aplikacje oparte na modelach językowych. Wykrywa próby obejścia instrukcji, waliduje wejście i wyjście, filtruje dane osobowe, detektuje halucynacje i toksyczne treści. Konfiguruje się za pomocą języka Colang 2.0, gotowy do produkcji i działa na GPU T4.
Jak używać
Zainstaluj pakiet NeMo Guardrails poleceniem pip install nemoguardrails w swoim środowisku Python.
Zdefiniuj konfigurację bezpieczeństwa za pomocą Colang 2.0 DSL — opisz wzorce niebezpiecznych pytań użytkownika (np. "How do I hack") i odpowiedzi bota, które powinny być blokowane (np. "I cannot help with illegal activities").
Utwórz obiekt RailsConfig z zawartością swojej konfiguracji, używając metody from_content() i przekazując tekst definicji przepływów.
Inicjalizuj LLMRails, przekazując skonfigurowany obiekt RailsConfig — to opakowuje Twój model i dodaje walidację w czasie rzeczywistym.
Zamiast wywoływać model bezpośrednio, użyj metody generate() na obiekcie rails, przekazując wiadomości użytkownika — framework automatycznie sprawdzi je względem zdefiniowanych reguł i zablokuje niebezpieczne zapytania lub odpowiedzi.
Podobne skille
academic-researcher
autor: Shubhamsaboo
qmd
autor: tobi
security-compliance
autor: davila7
typescript-review
autor: metabase
llama-cpp
autor: zechenzhangAGI
openapi-spec-generation
autor: wshobson