Toolverse
Wszystkie skille

lmstudio-subagents

autor: openclaw

Obniż koszty tokenów, przenosząc zadania na lokalne modele LM Studio

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Backend
Wyświetlenia
14

O skillu

Umiejętność integracji z LM Studio pozwala Ci zmniejszyć wydatki na płatne API, przenosząc powtarzalne zadania na lokalne modele. Idealnie sprawdza się do streszczania, ekstrakcji danych, klasyfikacji, przepisywania i pierwszej oceny treści — gdy jakość lokalnego modelu wystarczy. Nie wymaga dodatkowej konfiguracji: pracuje z istniejącą instalacją LM Studio przez REST API. Obsługuje również pracę offline i wrażliwe na prywatność scenariusze bez wysyłania danych do zewnętrznych dostawców.

Jak używać

  1. Upewnij się, że masz zainstalowane LM Studio w wersji 0.4 lub nowszej z uruchomionym serwerem na porcie 1234 (domyślnie http://127.0.0.1:1234). Umiejętność komunikuje się z tym serwerem za pomocą REST API i nagłówka autoryzacji Bearer lmstudio.

  2. Pobierz listę dostępnych modeli, wysyłając żądanie GET do /api/v1/models. Każdy model ma unikalny klucz (key), który będziesz używać w poleceniach. Jeśli chcesz załadować model na żądanie, LM Studio obsługuje JIT loading — model zostanie załadowany automatycznie przy pierwszym użyciu.

  3. Wybierz zadanie do wykonania na lokalnym modelu: streszczanie, ekstrakcję informacji, klasyfikację tekstu, przepisywanie lub brainstorming. Pamiętaj, że lokalne modele mogą być szybsze, ale mniej dokładne niż płatne API — używaj ich dla zadań, gdzie jakość jest akceptowalna.

  4. Uruchom umiejętność, podając model i tekst zadania. Możesz sterować parametrami, takimi jak temperature (np. --temperature=0.5), aby wpłynąć na kreatywność odpowiedzi. Umiejętność zwraca response_id, który możesz użyć do kontynuacji rozmowy (jako previous_response_id).

  5. Jeśli chcesz zwolnić zasoby, możesz wyładować model za pomocą instance_id. Zwróć uwagę, że instance_id pochodzi z listy loaded_instances zwróconej przez API — może różnić się od klucza modelu, zwłaszcza jeśli masz wiele instancji tego samego modelu (np. key:2).

  6. Monitoruj oszczędności tokenów: każde zadanie wykonane lokalnie zamiast na płatnym API zmniejsza Twoje koszty. Kombinuj lokalne modele z płatnymi dla zadań wymagających wyższej jakości.

Podobne skille