Toolverse
Wszystkie skille

baoyu-danger-gemini-web

autor: JimLiu

Generuj obrazy i tekst za pomocą API Gemini — z obsługą konwersacji i analiz wizualnych

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
JimLiu
Kategoria
Data Science
Wyświetlenia
4

O skillu

Umiejętność do generowania tekstu i obrazów poprzez odwrotnie inżynierowane API Gemini Web. Obsługuje generowanie tekstu na podstawie promptów, tworzenie obrazów z opisów, analizę obrazów referencyjnych oraz wieloturowe rozmowy. Idealna, gdy potrzebujesz backendu do generowania obrazów lub chcesz wykorzystać możliwości wizyjne Gemini w swoim agencie.

Jak używać

  1. Upewnij się, że masz zainstalowany Bun lub dostęp do npx. Jeśli nie masz Buna, zainstaluj go lub będziesz mógł użyć npx -y bun do uruchomienia skryptów.

  2. Przed pierwszym użyciem umiejętności sprawdź plik zgody (consent.json) w katalogu konfiguracyjnym systemu (na macOS: ~/Library/Application Support/baoyu-skills/gemini-web/, na Linuksie: ~/.local/share/baoyu-skills/gemini-web/, na Windows: %APPDATA%\baoyu-skills\gemini-web). Jeśli plik nie istnieje, umiejętność wyświetli zastrzeżenie i poprosi o potwierdzenie akceptacji użycia odwrotnie inżynierowanego API.

  3. Po zaakceptowaniu warrunków agent automatycznie utworzy plik zgody. Możesz teraz używać umiejętności do generowania tekstu i obrazów.

  4. Aby wygenerować obraz, poproś agenta o "wygenerowanie obrazu za pomocą Gemini" lub "generowanie obrazu z promptu". Umiejętność przetworzy Twój opis i zwróci wygenerowany obraz.

  5. Aby wygenerować tekst, użyj standardowych promptów tekstowych. Umiejętność obsługuje wieloturowe rozmowy, więc możesz kontynuować konwersację, a agent będzie pamiętać kontekst.

  6. Jeśli chcesz, aby Gemini przeanalizował obraz, dołącz obraz referencyjny do swojego żądania. Umiejętność wyśle obraz do API wizyjnego Gemini i zwróci analizę.

Podobne skille