gemini-api

Name: gemini-api
Author: MadAppGang

autor: MadAppGang

Generuj obrazy z tekstu za pomocą Google Gemini 3 Pro – edytuj, wybieraj proporcje i kontroluj styl

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: MadAppGang
Kategoria: Data Science

Repozytorium GitHub

O skillu

Umiejętność integracji z API Google Gemini do generowania i edycji obrazów. Obsługuje konwersję tekstu na obraz, edycję istniejących zdjęć, obrazy referencyjne, różne proporcje (od 1:1 po 21:9) oraz zaawansowaną obsługę błędów. Pracuje z modelami gemini-3-pro-image-preview (do 4K) i gemini-2.5-flash-image (do 1K). Idealna dla programistów integrujących generowanie wizualne w aplikacjach Claude, Codex lub Copilot.

Jak używać

Uzyskaj klucz API na stronie https://makersuite.google.com/app/apikey – zaloguj się na konto Google i utwórz nowy klucz dostępu.
Ustaw zmienną środowiskową GEMINI_API_KEY w terminalu: export GEMINI_API_KEY="twój-klucz-api". Upewnij się, że klucz jest dostępny dla procesu, w którym uruchamiasz umiejętność.
Uruchom podstawową generację obrazu poleceniem: uv run python main.py output.png "Twój opis obrazu". Zastąp opis konkretnym tekstem, np. "Minimalistyczna kostka 3D w stylu cyberpunk".
Dostosuj proporcje obrazu flagą --aspect, wybierając z dostępnych opcji: 1:1 (media społecznościowe), 16:9 (YouTube), 9:16 (mobile), 4:3 (tradycyjne zdjęcia) lub inne. Przykład: uv run python main.py output.png "Twój opis" --aspect 16:9.
Aby edytować istniejący obraz, użyj flagi --edit wraz ze ścieżką do pliku: uv run python main.py output.png "Zmień tło na niebieskie" --edit photo.jpg. Możesz też dodać obraz referencyjny flagą --ref style.png, aby utrzymać spójny styl.
W razie błędów (brak klucza, limit żądań, błąd sieci) umiejętność automatycznie ponawia próby – możesz zwiększyć liczbę prób flagą --max-retries 5. Sprawdź logi, jeśli prompt zostanie zablokowany przez politykę treści.

Podobne skille

arxiv-search

autor: langchain-ai

Przeszukuj arXiv i znajdź najnowsze prace badawcze z fizyki, matematyki i informatyki

Data Science

76172

xlsx

autor: anthropics

Twórz, edytuj i analizuj arkusze kalkulacyjne z formułami i wykresami

Data Science

40128

ml-paper-writing

autor: davila7

Pisz artykuły naukowe gotowe do publikacji w top konferencjach AI z pomocą Claude'a

Data Science

2681

codex

autor: Lucklyric

Zaawansowane rozumowanie AI do skomplikowanych zadań kodowania i architektury

Data Science

16163

infographic-creation

autor: antvis

Przekształć tekst w piękne infografiki za pomocą szablonów i wizualizacji danych

Data Science

60199

prompt-optimizer

autor: solatis

Doskonał prompty dla agentów Claude – wzorce oparte na badaniach naukowych

Data Science

15109