conversation-memory
Pamiętaj rozmowy z AI na długo — system pamięci dla chatbotów i asystentów
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do budowania trwałych systemów pamięci dla rozmów z modelami językowymi. Obsługuje trzy warstwy: pamięć krótkoterminową (bieżąca sesja), długoterminową (historia użytkownika) i pamięć encji (fakty o osobach, obiektach). Rozwiązuje problem kontekstu — AI nie musi pamiętać wszystkiego naraz, ale potrafi wyszukać istotne wspomnienia, gdy ich potrzebuje. Chroni prywatność: każdy użytkownik ma dostęp tylko do swoich danych.
Jak używać
Zainstaluj skill conversation-memory z repozytorium davila7. Skill zawiera komponenty do zarządzania trzema typami pamięci: krótkoterminową (aktualna rozmowa), długoterminową (historia z poprzednich sesji) i encyjną (informacje o konkretnych osobach lub obiektach).
Skonfiguruj magazyn pamięci dla swojego systemu. Wybierz, gdzie będą przechowywane dane (baza danych, plik, cache) i ustaw politykę czyszczenia, aby pamięć nie rosła bez ograniczeń. Pamiętaj o zagrożeniu bezpieczeństwa: każdy użytkownik musi mieć dostęp tylko do swoich wspomnień.
Wdrożyć wyszukiwanie pamięci — system musi wiedzieć, które wspomnienia są istotne dla bieżącego pytania. Nie dodawaj wszystkich przechowywanych danych do promptu, bo przepełnisz kontekst modelu. Zamiast tego użyj inteligentnego wyszukiwania, które wybiera tylko pasujące wspomnienia.
Integruj pamięć z promptami wysyłanymi do modelu. Przed każdą odpowiedzią AI wyszukaj i dołącz istotne wspomnienia z pamięci długoterminowej i encyjnej. Pamiętaj, że pamięć krótkoterminowa (historia bieżącej rozmowy) jest już w kontekście.
Testuj system pod kątem błędów: czy wspomnienia są rzeczywiście istotne, czy AI nie zapomina ważnych informacji, czy dane użytkownika nie wyciekają między sesje. Skill wskazuje trzy krytyczne problemy — nieograniczony wzrost pamięci, nieistotne wyszukiwania i brak izolacji użytkowników.
Rozważ integrację z innymi skillami: context-window-management (optymalizacja rozmiaru kontekstu), rag-implementation (zaawansowane wyszukiwanie), prompt-caching (przyspieszenie) lub llm-npc-dialogue (rozmowy z postaciami).