computer-use
Pełna kontrola pulpitu Linux na serwerach bez monitora — automatyzuj aplikacje GUI przez SSH
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Uruchom i kontroluj aplikacje graficzne na headless serwerach VPS bez fizycznego monitora. Skill tworzy wirtualny pulpit XFCE z Xvfb, umożliwiając wykonanie 17 standardowych akcji: zrzuty ekranu, kliknięcia, wpisywanie tekstu, przewijanie, przeciąganie. Działa na poziomie X11, więc strony internetowe nie wykryją automatyzacji. Zawiera VNC do zdalnego podglądu na żywo. Kompatybilny z dowolnym LLM.
Jak używać
Uruchom skrypt konfiguracyjny
./scripts/setup-vnc.sh, który zainstaluje Xvfb (wirtualny wyświetlacz na:99), minimalny pulpit XFCE4, x11vnc oraz noVNC do dostępu przez przeglądarkę. Wszystkie usługi uruchomią się automatycznie przy starcie systemu.Zweryfikuj, że wirtualny wyświetlacz działa, wykonując zrzut ekranu za pomocą akcji
screenshot— powinna zwrócić obraz w formacie base64 PNG rozdzielczości 1024x768.Aby kontrolować mysz, użyj akcji
left_clickz współrzędnymi (x, y) — na przykładleft_click 512 384kliknie w środek ekranu. Dla bardziej złożonych interakcji dostępne sąright_click,double_click,triple_clickorazleft_click_dragdo przeciągania.Do wpisywania tekstu użyj akcji
type— skill automatycznie dzieli tekst na porcje 50 znaków z opóźnieniem 12ms między nimi, co zapobiega utracie danych. Dla klawiszy specjalnych (Enter, Tab, Ctrl+C) użyj akcjikeyz odpowiednią kombinacją.Aby zobaczyć na żywo, co robi LLM, otwórz noVNC w przeglądarce na porcie wskazanym przez skrypt — możesz obserwować i ręcznie interweniować w sesję.
Integruj skill z dowolnym LLM, przekazując mu dostępne akcje (screenshot, cursor_position, mouse_move, click, drag, type, key, scroll) — model będzie samodzielnie decydować, które akcje wykonać, aby osiągnąć cel.