Toolverse
Wszystkie skille

context-compression

autor: muratcankoylan

Zmniejsz zużycie tokenów w długich sesjach agenta bez utraty kluczowych informacji

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Backend
Wyświetlenia
28

O skillu

Skill do kompresji kontekstu w sesjach agenta, które przekraczają limit okna kontekstowego. Oferuje trzy strategie: strukturalną kompresję przyrostową (zachowującą intencję sesji i modyfikacje plików), kompresję nieprzejrzystą (maksymalna redukcja tokenów) oraz pełne podsumowania regeneracyjne. Wybierz podejście zależnie od tego, czy priorytetem jest interpretowalnośćczy maksymalna oszczędność tokenów.

Jak używać

  1. Zainstaluj skill context-compression w swoim środowisku agenta (np. Claude, Copilot lub innym wspieranym systemie). Skill aktywuje się automatycznie lub na żądanie, gdy sesja zbliża się do limitów kontekstu.

  2. Zidentyfikuj sygnały aktywacji: sesja przekracza limit okna kontekstowego, baza kodu zajmuje 5M+ tokenów, agent zaczyna "zapominać" poprzednie modyfikacje plików, lub chcesz zoptymalizować zużycie tokenów w długotrwałych zadaniach.

  3. Wybierz strategię kompresji dostosowaną do Twoich potrzeb. Dla sesji wymagających pełnej przejrzystości (np. debugowanie zmian w kodzie) użyj Anchored Iterative Summarization, która utrzymuje strukturalne podsumowania z sekcjami dla intencji, modyfikacji i decyzji. Dla maksymalnej redukcji tokenów wybierz Opaque Compression, choć straci się interpretowalnośćwyjścia.

  4. Skonfiguruj parametry kompresji: określ, które informacje są krytyczne (np. historia zmian plików, decyzje projektowe), aby skill zachował je w podsumowaniu zamiast je tracić.

  5. Monitoruj jakość kompresji w kolejnych iteracjach. Jeśli agent zaczyna tracić ważne detale, przełącz się na bardziej konserwatywną strategię lub zwiększ częstotliwość przyrostowych podsumowań zamiast pełnej regeneracji.

  6. Mierz efektywność: porównaj całkowite tokeny zużyte na zadanie (łącznie z kosztami ponownego pobierania utraconej informacji) zamiast patrzeć tylko na tokeny na żądanie.

Podobne skille