langfuse-cost-tuning
Monitoruj i optymalizuj koszty LLM za pomocą analityki Langfuse
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do śledzenia, analizy i redukcji wydatków na modele językowe. Wykorzystaj wbudowane narzędzia Langfuse do monitorowania użycia tokenów, identyfikowania anomalii kosztowych i wdrażania kontroli budżetu dla aplikacji AI. Idealny dla zespołów zarządzających dużymi wolumenami zapytań do LLM, gdzie każdy token się liczy. Obsługuje modele OpenAI, Anthropic i Google z automatycznym obliczaniem kosztów.
Jak używać
Upewnij się, że w projekcie masz zainstalowany Langfuse z włączonym śledzeniem tokenów. Jeśli używasz OpenAI, zainstaluj wrapper
observeOpenAIz pakietu@langfuse/openai— automatycznie będzie rejestrować tokeny, model i koszty każdego wywołania.Jeśli śledzisz modele niestandardowe, skonfiguruj ich ceny w panelu Langfuse: przejdź do Settings > Model Definitions i dodaj definicje kosztów dla swoich modeli.
Uruchom skill, wyzwalając go frazami takimi jak "langfuse costs", "LLM spending", "track AI costs" lub "optimize LLM budget". Skill będzie analizować zebrane dane o użyciu tokenów.
Przejrzyj dashboardy Langfuse, aby zobaczyć całkowite wydatki, koszt na obserwację i trendy w czasie. Identyfikuj wywołania, które pochłaniają największą część budżetu.
Użyj Metrics API (wymaga
@langfuse/client) do programowego dostępu do danych kosztowych — możesz zbudować własne alerty lub raporty na bazie tych metryk.Wdrażaj optymalizacje: zmień routing modeli na tańsze warianty, zmniejsz długość promptów lub ustaw automatyczne alerty budżetowe w Langfuse, aby być powiadamiany o anomaliach.