langfuse-cost-tuning

Name: langfuse-cost-tuning
Author: jeremylongshore

autor: jeremylongshore

Monitoruj i optymalizuj koszty LLM za pomocą analityki Langfuse

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: jeremylongshore
Kategoria: Bezpieczeństwo

Repozytorium GitHub

O skillu

Skill do śledzenia, analizy i redukcji wydatków na modele językowe. Wykorzystaj wbudowane narzędzia Langfuse do monitorowania użycia tokenów, identyfikowania anomalii kosztowych i wdrażania kontroli budżetu dla aplikacji AI. Idealny dla zespołów zarządzających dużymi wolumenami zapytań do LLM, gdzie każdy token się liczy. Obsługuje modele OpenAI, Anthropic i Google z automatycznym obliczaniem kosztów.

Jak używać

Upewnij się, że w projekcie masz zainstalowany Langfuse z włączonym śledzeniem tokenów. Jeśli używasz OpenAI, zainstaluj wrapper observeOpenAI z pakietu @langfuse/openai — automatycznie będzie rejestrować tokeny, model i koszty każdego wywołania.
Jeśli śledzisz modele niestandardowe, skonfiguruj ich ceny w panelu Langfuse: przejdź do Settings > Model Definitions i dodaj definicje kosztów dla swoich modeli.
Uruchom skill, wyzwalając go frazami takimi jak "langfuse costs", "LLM spending", "track AI costs" lub "optimize LLM budget". Skill będzie analizować zebrane dane o użyciu tokenów.
Przejrzyj dashboardy Langfuse, aby zobaczyć całkowite wydatki, koszt na obserwację i trendy w czasie. Identyfikuj wywołania, które pochłaniają największą część budżetu.
Użyj Metrics API (wymaga @langfuse/client) do programowego dostępu do danych kosztowych — możesz zbudować własne alerty lub raporty na bazie tych metryk.
Wdrażaj optymalizacje: zmień routing modeli na tańsze warianty, zmniejsz długość promptów lub ustaw automatyczne alerty budżetowe w Langfuse, aby być powiadamiany o anomaliach.

Podobne skille

skill-writer

autor: pytorch

Twórz umiejętności agenta Claude z przewodnikiem po strukturze i najlepszych praktykach

Bezpieczeństwo

15116

openapi-spec-generation

autor: wshobson

Generuj specyfikacje OpenAPI 3.1 z kodu i projektów API — dokumentacja zawsze zsynchronizowana

Bezpieczeństwo

18109

youtube-watcher

autor: openclaw

Pobierz transkrypcje filmów YouTube i wyciągaj z nich informacje

Bezpieczeństwo

2231

solidity-security

autor: wshobson

Zabezpiecz swoje smart kontrakty przed atakami i lukami w kodzie Solidity

Bezpieczeństwo

10105

obsidian

autor: gapmiss

Kompletny przewodnik tworzenia wtyczek Obsidian z regułami ESLint i best practices

Bezpieczeństwo

14111

1password

autor: openclaw

Zarządzaj hasłami i sekretami przez CLI 1Password bezpośrednio z agentów AI

Bezpieczeństwo

1174