wan-2-7
Text-zu-Video mit Wan 2.7 auf RunComfy generieren
Auch verfügbar von: agentspace-so,runcomfy-com
Die Erzeugung von Video in Sendequalität aus Text erfordert präzise Kontrolle über Bewegung, Audio und Seitenverhältnis. Wan 2.7 auf RunComfy bietet Multi-Referenz-Conditioning, audio-gesteuerte Lippensynchronisation und saubere Exit-Codes für Produktions-Workflows.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "wan-2-7". Prompt: 'Cinematic medium shot of a product on a marble surface, soft studio lighting, slow subtle camera push-in, shallow depth of field, premium commercial look, crisp 1080p detail'
Erwartetes Ergebnis:
Ein 5-Sekunden-1080p-16:9-Clip mit subtilem Kamera-Push-in und geringer Tiefenschärfe, gespeichert im konfigurierten --output-dir als MP4.
Verwendung von "wan-2-7". Prompt: 'Medium close-up of a confident spokesperson in a softly-lit recording booth, locked tripod, shallow depth of field, warm key light' with audio_url: 'https://.../voiceover.mp3', duration 12, aspect_ratio 9:16
Erwartetes Ergebnis:
Ein 12-Sekunden-9:16-Clip mit Lippensynchronisation, abgestimmt auf den bereitgestellten Audiotrack, heruntergeladen in das konfigurierte --output-dir.
Sicherheitsaudit
Niedriges RisikoSkill is pure Markdown documentation with no executable code. The 72 static findings are dominated by false positives: the 58 'Ruby/shell backtick' flags are all Markdown inline-code backticks (e.g. `audio_url`, `runcomfy run ...`), not Ruby execution. Hardcoded URLs are documentation links to runcomfy.com and the model API. The 'hidden file in home directory' flag at line 181 is the documented, expected token-storage path (mode 0600) called out in the skill's own Security & Privacy section. 'Weak cryptographic algorithm' flags at lines 4/112/162 are spurious keyword matches. Intent and context are benign: the skill wraps a single third-party CLI (`runcomfy`) for text-to-video and explicitly documents the security boundary (HTTPS-only endpoints, env-var token override, 2 GiB download cap, no telemetry).
Probleme mit niedrigem Risiko (4)
Risikofaktoren
⚙️ Externe Befehle (25)
🌐 Netzwerkzugriff (5)
📁 Dateisystemzugriff (2)
Erkannte Muster
Qualitätsbewertung
Was du bauen kannst
Markenbezogene Kurzvideowerbung mit individuellen Voiceovers erstellen
Marketing-Teams können über audio_url ihren eigenen Voice-Track bereitstellen und lippen-synchronisierte Sprecher-Clips in 9:16 für bezahlte Social-Media-Kampagnen erzeugen und anschließend am Seed für Varianten iterieren.
Vertikale, plattformnative Sprecher-Inhalte produzieren
Social-Media-Creator können mit den dokumentierten Prompt-Mustern 9:16 lippen-synchronisierte Clips mit fixiertem Stativ-Frame für TikTok, Reels und Shorts erzeugen.
Text-zu-Video in CI-Pipelines integrieren
Entwickler können die RunComfy-CLI mit der Umgebungsvariable RUNCOMFY_TOKEN in Containern oder CI aufrufen, interaktive Anmeldung vermeiden und auf dokumentierte Exit-Codes für Wiederholungen reagieren.
Probiere diese Prompts
Generate a 5-second 1080p 16:9 clip of a product on a marble surface with soft studio lighting, a slow subtle camera push-in, and a shallow depth of field.
Generate a 12-second 9:16 clip of a medium close-up of a confident spokesperson in a softly-lit recording booth, locked tripod, shallow depth of field, warm key light, with my voiceover audio_url.
Generate a cinematic 8-second 16:9 clip with enable_prompt_expansion set to false and a negative_prompt of 'no subtitles, no flicker, no distorted hands' to keep the model faithful to the exact wording.
Generate the same 10-second 16:9 prompt three times with different audio_url tracks for English, Spanish, and Japanese, reusing the same seed for visual consistency.
Bewährte Verfahren
- Setze Kamera- und Bewegungsanweisungen an den Anfang des Prompts (zum Beispiel 'slow dolly in', 'locked tripod, low angle') für stärkere Ergebnisse
- Verwende spezifische negative_prompt-Einträge wie 'no subtitles, no watermark, no flicker' anstelle vager Formulierungen wie 'no bad lighting'
- Stimme die Länge der audio_url auf die gewünschte Clip-Dauer ab und halte die 3–30 s, 15 MB, WAV- oder MP3-Grenzen ein, um Ablehnungen zu vermeiden
Vermeiden
- Häufe mehrere konkurrierende Aktionen in einem einzigen Prompt an; Wan 2.7 liefert bessere Ergebnisse mit einer Hauptaktion pro Clip
- Übergib Audio außerhalb der 3–30 s, 15 MB, WAV- oder MP3-Spezifikation; die API wird die Anfrage ablehnen
- Verwende Beschreibungen statischer Bilder ohne Kamera- oder Bewegungsangaben; das Modell erzeugt vage oder driftende Bewegung
Häufig gestellte Fragen
Wofür ist Wan 2.7 am besten geeignet?
Wie lang kann ein einzelner Clip sein?
Erzeugt Wan 2.7 Sprach-Audio?
Wie wird das API-Token gespeichert?
Welche Seitenverhältnisse werden unterstützt?
Kann ich denselben Seed für Varianten wiederverwenden?
Entwicklerdetails
Dateistruktur
📄 SKILL.md