gemini-api
Generuj obrazy z tekstu za pomocą Google Gemini 3 Pro – edytuj, wybieraj proporcje i kontroluj styl
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność integracji z API Google Gemini do generowania i edycji obrazów. Obsługuje konwersję tekstu na obraz, edycję istniejących zdjęć, obrazy referencyjne, różne proporcje (od 1:1 po 21:9) oraz zaawansowaną obsługę błędów. Pracuje z modelami gemini-3-pro-image-preview (do 4K) i gemini-2.5-flash-image (do 1K). Idealna dla programistów integrujących generowanie wizualne w aplikacjach Claude, Codex lub Copilot.
Jak używać
Uzyskaj klucz API na stronie https://makersuite.google.com/app/apikey – zaloguj się na konto Google i utwórz nowy klucz dostępu.
Ustaw zmienną środowiskową GEMINI_API_KEY w terminalu: export GEMINI_API_KEY="twój-klucz-api". Upewnij się, że klucz jest dostępny dla procesu, w którym uruchamiasz umiejętność.
Uruchom podstawową generację obrazu poleceniem: uv run python main.py output.png "Twój opis obrazu". Zastąp opis konkretnym tekstem, np. "Minimalistyczna kostka 3D w stylu cyberpunk".
Dostosuj proporcje obrazu flagą --aspect, wybierając z dostępnych opcji: 1:1 (media społecznościowe), 16:9 (YouTube), 9:16 (mobile), 4:3 (tradycyjne zdjęcia) lub inne. Przykład: uv run python main.py output.png "Twój opis" --aspect 16:9.
Aby edytować istniejący obraz, użyj flagi --edit wraz ze ścieżką do pliku: uv run python main.py output.png "Zmień tło na niebieskie" --edit photo.jpg. Możesz też dodać obraz referencyjny flagą --ref style.png, aby utrzymać spójny styl.
W razie błędów (brak klucza, limit żądań, błąd sieci) umiejętność automatycznie ponawia próby – możesz zwiększyć liczbę prób flagą --max-retries 5. Sprawdź logi, jeśli prompt zostanie zablokowany przez politykę treści.