Toolverse
Wszystkie skille

gemini-api

autor: MadAppGang

Generuj obrazy z tekstu za pomocą Google Gemini 3 Pro – edytuj, wybieraj proporcje i kontroluj styl

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

O skillu

Umiejętność integracji z API Google Gemini do generowania i edycji obrazów. Obsługuje konwersję tekstu na obraz, edycję istniejących zdjęć, obrazy referencyjne, różne proporcje (od 1:1 po 21:9) oraz zaawansowaną obsługę błędów. Pracuje z modelami gemini-3-pro-image-preview (do 4K) i gemini-2.5-flash-image (do 1K). Idealna dla programistów integrujących generowanie wizualne w aplikacjach Claude, Codex lub Copilot.

Jak używać

  1. Uzyskaj klucz API na stronie https://makersuite.google.com/app/apikey – zaloguj się na konto Google i utwórz nowy klucz dostępu.

  2. Ustaw zmienną środowiskową GEMINI_API_KEY w terminalu: export GEMINI_API_KEY="twój-klucz-api". Upewnij się, że klucz jest dostępny dla procesu, w którym uruchamiasz umiejętność.

  3. Uruchom podstawową generację obrazu poleceniem: uv run python main.py output.png "Twój opis obrazu". Zastąp opis konkretnym tekstem, np. "Minimalistyczna kostka 3D w stylu cyberpunk".

  4. Dostosuj proporcje obrazu flagą --aspect, wybierając z dostępnych opcji: 1:1 (media społecznościowe), 16:9 (YouTube), 9:16 (mobile), 4:3 (tradycyjne zdjęcia) lub inne. Przykład: uv run python main.py output.png "Twój opis" --aspect 16:9.

  5. Aby edytować istniejący obraz, użyj flagi --edit wraz ze ścieżką do pliku: uv run python main.py output.png "Zmień tło na niebieskie" --edit photo.jpg. Możesz też dodać obraz referencyjny flagą --ref style.png, aby utrzymać spójny styl.

  6. W razie błędów (brak klucza, limit żądań, błąd sieci) umiejętność automatycznie ponawia próby – możesz zwiększyć liczbę prób flagą --max-retries 5. Sprawdź logi, jeśli prompt zostanie zablokowany przez politykę treści.

Podobne skille