Fähigkeiten gpt-image-2
📦

gpt-image-2

Niedriges Risiko ⚙️ Externe Befehle🌐 Netzwerkzugriff📁 Dateisystemzugriff

Bilder mit GPT Image 2 auf RunComfy generieren

Auch verfügbar von: doany-ai,agentspace-so

Erstellen und bearbeiten Sie Bilder mit OpenAI GPT Image 2 über die RunComfy-Cloudplattform. Diese Fähigkeit bietet Experten-Prompt-Muster, Größenbeschränkungen und Modell-Auswahl-Anleitung, damit Sie bei jeder Generierung die besten Ergebnisse erzielen.

Unterstützt: Claude Codex Code(CC)
🥉 72 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "gpt-image-2". Generieren Sie ein Produktfoto einer keramischen Wasserflasche auf warmem Leinen mit dem Text 'AQUA+' auf dem Etikett

Erwartetes Ergebnis:

Hochauflösendes Produktbild mit akkuratem Beschriftungstext AQUA+, weiches Fensterlicht, dezente Randlichter und neutralem E-Commerce-Hintergrund

Verwendung von "gpt-image-2". Bearbeiten Sie dieses Café-Foto: Machen Sie den Hintergrund zu einem hellen weißen Studio-Sweep und fügen Sie die Überschrift 'OPEN STUDIO' in Bold Sans-Serif, zentriert hinzu

Erwartetes Ergebnis:

Bearbeitetes Bild mit sauberem weiß-bis-weichgrauem Studio-Hintergrund, zentrierter fetter OPEN STUDIO-Überschrift, bewahrter Subjektidentität und Komposition

Verwendung von "gpt-image-2". Erstellen Sie eine Tokio-Café-Fassade bei Dämmerung mit dem Schild in japanischen Kana-Zeichen für Kaffee

Erwartetes Ergebnis:

Kinematisches Fassadebild mit warmem Innenlicht-Glühen, akkuratem japanischem Text auf Holzschild, geringer Schärfentiefe, Drittel-Regel-Komposition

Sicherheitsaudit

Niedriges Risiko
v1 • 5/28/2026

Static analysis flagged 77 patterns across SKILL.md (58 shell backticks, 10 hardcoded URLs, 5 filesystem paths, 3 weak-crypto indicators, 1 reconnaissance). All findings evaluated as false positives: backticks contain markdown CLI documentation examples, URLs are legitimate RunComfy service endpoints, filesystem references document CLI config paths (~/.config/runcomfy/token.json), and crypto/reconnaissance patterns are misidentified text ("Exit codes" heading, jq pipe examples). No executable code, no prompt injection, no data exfiltration detected. Minor concerns: user prompts transmitted to RunComfy's external API, third-party CLI dependency, local token file storage.

1
Gescannte Dateien
212
Analysierte Zeilen
6
befunde
1
Gesamtzahl Audits
Probleme mit niedrigem Risiko (3)
Third-Party Service Data Transmission
User prompts and image URLs are transmitted to RunComfy's model API (model-api.runcomfy.net) for processing. This is the intended function but users should be aware their data leaves the local environment.
Third-Party CLI Dependency
Skill requires installation of @runcomfy/cli via npm. This introduces a supply chain dependency on an external package not controlled by the skill author.
Local Token Storage
RunComfy CLI stores authentication token in ~/.config/runcomfy/token.json. Documented as using mode 0600 permissions which provides adequate local protection.

Erkannte Muster

Shell Backtick Execution (58 instances — All False Positives)Hardcoded URLs (10 instances — All False Positives)Filesystem Path Patterns (5 instances — All False Positives)
Auditiert von: claude

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
87
Inhalt
55
Community
84
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

E-Commerce-Produktfotografie

Generieren Sie Produktbilder mit akkuratem Beschriftungstext, markensicherer Beleuchtung und konsistentem Styling über Produktlinien hinweg mit der präzisen Textdarstellung von GPT Image 2.

Erstellung mehrsprachiger Markenassets

Erstellen Sie Schilder, Poster und Verpackungsmockups mit akkurater Textdarstellung in mehreren Sprachen aus einer einzelnen Quell-Datei mit dem Edit-Endpunkt.

Iterative Bildverfeinerung

Bearbeiten Sie Bilder Schritt für Schritt, ändern Sie jeweils ein Attribut und bewahren Sie dabei Komposition, Gesichter und Markenelemente über mehrere Generationen hinweg.

Probiere diese Prompts

Einfache Text-zu-Bild-Generierung
Generieren Sie ein Bild von [Subjekt beschreiben] in [Szene beschreiben] mit [Stimmung oder Beleuchtung beschreiben] mit GPT Image 2 auf RunComfy.
Produktbild mit eingebettetem Text
Erstellen Sie ein Produktfoto von [Produkt] auf [Oberfläche oder Hintergrund], das Etikett zeigt "[genauer Text]" in [Schriftstil], [Beleuchtungsbeschreibung], e-commerce-bereit, neutraler Hintergrund.
Bildbearbeitung mit Beibehaltung
Bearbeiten Sie dieses Bild mit GPT Image 2: [spezifische Änderung beschreiben]. Behalten Sie [zu bewahrende Elemente auflisten] unverändert. Verwenden Sie [Größe] für die Ausgabe.
Mehrfachreferenz-Bildkomposition
Erstellen Sie ein neues Bild mit GPT Image 2 Edit: Subjekt aus Bild 1 und Hintergrund aus Bild 2. Passen Sie die Beleuchtung von Bild 2 an. Behalten Sie die Pose und Gesichtsidentität von Bild 1 unverändert.

Bewährte Verfahren

  • Zitieren Sie eingebetteten Text genau so, wie er im generierten Bild erscheinen soll, für akkurate Textdarstellung
  • Ändern Sie pro Bearbeitungsiteration nur ein Attribut wie Beleuchtung, Hintergrund, Pose oder Text, um die Kompositionsstabilität zu erhalten
  • Verwenden Sie Kompositionshinweise wie Drittel-Regel, Nahaufnahme, Vogelperspektive oder geringe Schärfentiefe direkt in Ihren Prompts

Vermeiden

  • Kombinieren Sie keine widersprüchlichen Anweisungen wie das Anfordern von keinem Text bei gleichzeitiger Angabe von Text auf Produktetiketten
  • Vermeiden Sie das Stapeln mehrerer Kunststile wie Ukiyo-e plus Aquarell plus cinematisch in einem Prompt, was zu inkonsistenten Ergebnissen führt
  • Verwenden Sie keine extremen Seitenverhältnisse, da nur drei feste Größen unterstützt werden und nicht unterstützte Verhältnisse automatisch angepasst werden

Häufig gestellte Fragen

Was ist GPT Image 2 im Vergleich zu anderen Bildmodellen am besten?
GPT Image 2 zeichnet sich durch eingebetteten Text, Logos, mehrsprachige Typografie und präzises Befolgen von Anweisungen aus. Es ist ideal, wenn Genauigkeit wichtiger ist als künstlerische Stilisierung.
Brauche ich einen OpenAI API-Schlüssel, um diese Fähigkeit zu nutzen?
Nein. Diese Fähigkeit nutzt die gehostete Model API von RunComfy. Sie benötigen nur ein RunComfy-Konto und die lokale Installation der RunComfy CLI.
Welche Bildgrößen werden unterstützt?
Drei feste Größen werden unterstützt: 1024x1024 für Quadrat, 1024x1536 für Hochformat und 1536x1024 für Querformat. Der Edit-Endpunkt unterstützt auch auto zur Beibehaltung des Eingabe-Seitenverhältnisses.
Wie bewahrt der Edit-Endpunkt Elemente des Originalbildes?
Verwenden Sie keep-Anweisungen in Ihrem Prompt, z.B. behalte die Pose und Gesichtsidentität der Person unverändert. Das Modell hält die Komposition stabil, wenn Sie jeweils nur ein Attribut ändern.
Werden meine Prompt-Daten an externe Server gesendet?
Ja. Prompts werden über HTTPS an die Model API von RunComfy unter model-api.runcomfy.net gesendet. Die CLI expandiert Prompts nicht per Shell. Prüfen Sie die Datenschutzrichtlinie von RunComfy für Details zur Datenverarbeitung.
Wie kann ich eine laufende Bilderstellung abbrechen?
Drücken Sie Strg+C, während die CLI auf Ergebnisse pollt. Dies sendet eine Abbruchanfrage an die API, sodass Ihnen nicht berechnete GPU-Zeit in Rechnung gestellt wird.

Entwicklerdetails

Dateistruktur

📄 SKILL.md