agent-browser

Name: agent-browser
Author: vercel-labs

autor: vercel-labs

Automatyzuj interakcje z webem dla agentów AI — nawigacja, formularze, klikanie, zrzuty ekranu.

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: vercel-labs
Kategoria: Frontend
Wyświetlenia: 56

Repozytorium GitHub

O skillu

Agent-browser to narzędzie automatyzacji przeglądarki dla agentów AI. Pozwala na programowe sterowanie stronami internetowymi: otwieranie adresów URL, wypełnianie formularzy, klikanie przycisków, robienie zrzutów ekranu, ekstrakcję danych i testowanie aplikacji webowych. Idealne, gdy agent musi wchodzić w interakcję z interfejsami webowymi — od logowania po automatyzację złożonych sekwencji działań w przeglądarce.

Jak używać

Zainstaluj skill agent-browser w swoim środowisku agenta AI (dostępny w repozytorium Vercel Labs). Upewnij się, że masz dostęp do poleceń bash poprzez narzędzie agent-browser.
Aby otworzyć stronę, użyj polecenia agent-browser open <URL> — na przykład agent-browser open https://example.com/form. To uruchomi przeglądarkę i przejdzie do podanego adresu.
Po załadowaniu strony wykonaj agent-browser snapshot -i, aby uzyskać interaktywne elementy ze zidentyfikowanymi referencjami (takimi jak @e1, @e2, @e3). Te referencje reprezentują pola wejściowe, przyciski i inne elementy, którymi możesz manipulować.
Wchodzić w interakcję z elementami za pomocą ich referencji: użyj agent-browser fill @e1 "tekst" do wypełnienia pola, agent-browser click @e3 do kliknięcia przycisku, lub agent-browser select @e1 "opcja" do wybrania opcji z listy rozwijanej.
Po każdej akcji, która zmienia zawartość strony (nawigacja, kliknięcie przycisku), czekaj na załadowanie za pomocą agent-browser wait --load networkidle, a następnie wykonaj nowy snapshot (agent-browser snapshot -i), aby pobrać zaktualizowane referencje elementów.
Powtarzaj kroki 4-5, aż osiągniesz cel — czy to wypełnienie formularza, zalogowanie się, czy ekstrakcję danych ze strony.

Podobne skille

frontend-slides

autor: sickn33

Twórz animowane prezentacje HTML bez kodu — z plików PowerPoint lub od zera

Frontend

65135

game-development

autor: davila7

Orchestrator do tworzenia gier — kieruje Cię do specjalistycznych narzędzi na podstawie platformy i typu projektu.

Frontend

36112

tailwind-design-system

autor: wshobson

Buduj skalowalne systemy designu z Tailwind CSS, tokenami i bibliotekami komponentów

Frontend

2676

better-icons

autor: better-auth

Szukaj i pobieraj ikony z 200+ bibliotek za pomocą CLI lub agenta AI

Frontend

2037

google-official-seo-guide

autor: littleben

Optymalizuj stronę w wyszukiwarce Google na podstawie oficjalnych wytycznych

Frontend

101196

frontend-ui-ux

autor: code-yeongyu

Umiejętności designera w kodzie — twórz piękne interfejsy bez potrzeby makiet

Frontend

1884