screen-monitor
Udostępniaj ekran agentowi AI do analizy i automatyzacji — bez skomplikowanej konfiguracji
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Screen Monitor to umiejętność dla agentów AI, która daje im dostęp do Twojego ekranu. Wybierz między szybkim udostępnianiem przez WebRTC (idealne do szybkich kontroli) a pełną kontrolą przez rozszerzenie przeglądarki (do debugowania i automatyzacji kliknięć). Narzędzie działa z dowolnym modelem wizyjnym — Claude, Gemini, Qwen3-VL. Agent może zrobić zrzut ekranu i natychmiast go przeanalizować, albo klikać w elementy interfejsu na Twoje polecenie.
Jak używać
Zdecyduj, którą ścieżkę wybrać: szybkie udostępnianie WebRTC (Path A) do szybkich kontroli wizualnych, lub pełną kontrolę przez rozszerzenie przeglądarki (Path B) jeśli potrzebujesz automatyzacji kliknięć i wpisywania tekstu.
Dla Path A (WebRTC): uruchom polecenie bash z pliku get-share-url.sh, aby wygenerować lokalny link portalu udostępniania. Przekaż ten link agentowi.
Agent może teraz analizować Twój ekran — użyj narzędzia screen_analyze, które przechwytuje bieżącą ramkę z portalu i analizuje ją wizją.
Dla Path B (rozszerzenie przeglądarki): zainstaluj rozszerzenie poleceniem clawdbot browser extension install, a następnie załaduj rozpakowane pliki z ścieżki wskazanej przez clawdbot browser extension path.
Kliknij ikonę Clawdbot na pasku narzędzi Chrome i wybierz Attach, aby połączyć aktywną kartę z agentem.
Agent może teraz robić precyzyjne zrzuty ekranu (snapshot) i klikać w elementy interfejsu (click) — idealne do automatyzacji zadań w przeglądarce.