Sprache wechseln
Design wechseln

Veo-3-Prompts schreiben: 5-Schritte-Formel + 10 Vorlagen für filmreife KI-Videos

Geben Sie „Ein Mädchen geht am Strand“ ein – und Veo 3 liefert unscharfe Bilder, steife Bewegungen, nichts von der romantischen Stimmung, die Sie sich vorstellen. Auf Social Media sehen andere Clips aus wie Filmszenen: flüssige Kameraführung, perfekt passender Sound.

Das liegt selten am Modell, sondern am Prompt. Veo-3-Prompts sind keine lose Beschreibung, sondern Anweisungen an einen Profi-Kameramann: Objektiv, Winkel, Licht, Handlung der Figur – und oft auch den Sound.

Dieser Artikel stellt ein erprobtes Prompt-System vor: 5 Kernelemente, 10 sofort nutzbare Vorlagen, typische Fehler und Fortgeschrittenen-Tipps. Danach können Sie Prompts schreiben, die filmreife Ergebnisse liefern.

Warum Ihre Veo-3-Videos oft enttäuschen

Bevor wir zur Methode kommen: Warum scheitern so viele Versuche? Viele denken, ein Prompt sei einfach eine natürliche Szenenbeschreibung. Tatsächlich ist er eher eine strukturierte Anweisungssprache.

Vergleich: Im Restaurant reicht „etwas Leckeres“ nicht. Sie nennen Küche, Schärfe, Beilage. Veo 3 braucht ebenso klare Vorgaben.

Laut Google steigern detaillierte Prompts die Qualität um über 60 %. „Detailliert“ heißt nicht „lang“, sondern vollständig.

Die 3 häufigsten Prompt-Fehler

Fehler 1: Zu knapp formuliert

Viele schreiben nur „Eine Person läuft“ oder „Eine Katze spielt“. Zu wenig Information – Veo 3 muss raten. Ergebnis: vielleicht ein Mann im Anzug auf dem Laufband, vielleicht ein Jogger im Park. Was Sie wollen, weiß das Modell nicht.

Vergleich:

❌ Schwacher Prompt: „Eine Person läuft“

✅ Starker Prompt: „Tracking-Aufnahme von der Seite, ein junger Mann in schwarzer Sportkleidung joggt morgens durch eine Stadtstraße, leichter, kräftiger Schritt, Sonnenlicht auf seiner Haut. Filmische Qualität, motivierende Stimmung, warme Farbtöne. SFX: Schritte beim Laufen, morgendliche Stadtgeräusche.“

Der gute Prompt nennt Kamera, Person, Handlung, Umgebung, Stil und Sound.

Fehler 2: Informationsüberflutung ohne Fokus

Die andere Extreme: alle Details stapeln – Veo 3 verliert den roten Faden. Wie dem Kameramann sagen: „Nahaufnahme, Weitwinkel, Tracking, Zeitlupe, Sonnenaufgang und Sonnenuntergang …“

Google Cloud empfiehlt 10–25 Wörter. Zu kurz = zu wenig Info, zu lang = Chaos. Die wichtigsten visuellen Elemente klar herausstellen.

Fehler 3: Audio ignorieren

Veo 3 kann Dialog, SFX und Umgebungsgeräusche mitgenerieren. Ohne Anweisung: stummes Video oder zufälliger, unpassender Sound.

Mit Audio-Anweisungen wirken Clips deutlich fertiger und stimmiger.

Die 5-Elemente-Formel für Veo-3-Prompts

Basierend auf Googles Leitfaden und eigener Praxis – eine Formel, die die Erfolgsquote spürbar erhöht:

Vollständige Formel:

[Kameratechnik] + [Subjektbeschreibung] + [Handlung] + [Umgebung] + [Stil und Stimmung]

Jedes Element hat Feinheiten. Schauen wir sie uns an.

Element 1: Kameratechnik (Camera Work)

Welches Objektiv, welcher Winkel, wie bewegt sich die Kamera?

Kameratypen:

  • Nahaufnahme (close-up): Details – Mimik, Hände
  • Halbtotal (medium shot): Oberkörper oder Ganzfigur
  • Weitwinkel / Totale (wide shot): große Szene, Umgebung
  • Vogelperspektive (aerial shot): Aufnahme von oben

Kamerabewegungen:

  • Dolly in/out: Kamera fährt vor oder zurück
  • Tracking shot: Kamera folgt dem Subjekt
  • Pan: Schwenk links/rechts oder hoch/runter
  • Crane shot: vertikale Kamerafahrt
  • Static shot: feste Kamera

Beispiele:

  • „Nahaufnahme, langsam vorfahrend“ → von Halbtotal zur Gesichtsnahaufnahme
  • „Tracking von der Seite“ → Kamera folgt lateral
  • „Luftaufnahme, langsam absteigend“ → von oben nach unten

Wichtig: Ohne Kamerabewegung liefert Veo 3 meist eine statische Einstellung. Für Dynamik explizit angeben.

Element 2: Subjektbeschreibung (Subject)

Das Subjekt ist der Fokus – Person, Tier oder Objekt. Je konkreter, desto konsistenter die Figur.

Bei Personen:

  • Alter und Geschlecht: „asiatische Frau, etwa 25 Jahre“
  • Kleidung: „beiger Trenchcoat, langes Haar im Wind“
  • Mimik: „lächelnd“, „sanfter Blick“
  • Körperhaltung: „schlanke Figur“, „elegante Haltung“

Beispiele:

  • ❌ Einfach: „Ein Mädchen“
  • ✅ Detailliert: „Eine asiatische Frau, etwa 30, weißes Hemd, langes offenes Haar, sanfter Blick, lächelnd“

Tipp: Für konsistente Figuren über mehrere Clips dieselbe Personenbeschreibung wiederverwenden. Ähnliche Prompts erzeugen ähnliche Charaktere.

Element 3: Handlung (Action)

Das Subjekt muss sich bewegen – konkret genug, dass man das Bild vor Augen hat.

Von allgemein zu konkret:

  • „gehen“ → „gemächlich spazieren“
  • „schauen“ → „den Blick in die Ferne heben“
  • „lächeln“ → „leicht lächeln, Augenwinkel nach oben“

Mit Tempo und Details:

  • „Sie dreht langsam den Kopf, der Wind hebt ihre Haare“
  • „Er winkt schnell zum Abschied und geht davon“
  • „Die Katze neigt den Kopf und springt auf das Spielzeug“

Je lebendiger die Handlung, desto lebendiger das Video.

Element 4: Umgebung (Environment)

Ort, Tageszeit, Wetter, Licht – sie prägen die Atmosphäre.

Vollständige Umgebungsbeschreibung:

  • Ort: Strand, Café, Stadtstraße, Wald …
  • Tageszeit: Sonnenaufgang, Mittag, Abenddämmerung, Nacht
  • Wetter: sonnig, bewölkt, Regen, Nebel
  • Licht: warmes Sonnenlicht, weiches Deckenlicht, dramatisches Seitenlicht
  • Details: Wellen, Blätter im Wind, Verkehr

Beispiel:
„Goldener Strand bei Sonnenuntergang, warmes oranges Licht auf dem Sand, sanfte Wellen, ein paar Möwen in der Ferne.“

Element 5: Stil und Stimmung (Style & Mood)

Gesamtlook und Emotion – filmisch, dokumentarisch oder animiert.

Visueller Stil:

  • Cinematic: filmische Bildqualität und Komposition
  • Documentary: natürlich, authentisch
  • Animated: Cartoon-Stil
  • Stop-motion: wie bei „Fantastic Mr. Fox“

Stimmung:

  • romantisch, ruhig, spannend, geheimnisvoll, motivierend, warm …

Bildqualität:

  • „4K“, „filmische Farbgebung“, „warme/kalte Töne“, „hoher Kontrast“, „geringe Schärfentiefe“

Vollständiges Beispiel:
„Filmische Qualität, romantische Stimmung, warme Töne, geringe Schärfentiefe, weiches Naturlicht.“

Die 5 Elemente kombinieren

[Nahaufnahme, langsam vorfahrend] + [25-jährige asiatische Frau, weißes Hemd, lächelnd] + [streicht sanft eine Haarsträhne beiseite, blickt in die Kamera] + [Café, Nachmittagssonne fällt durchs Fenster] + [filmische Qualität, geringe Schärfentiefe, warme Töne, romantische Stimmung]

Zusammengefügt:

„Nahaufnahme, langsam vorfahrend, eine 25-jährige asiatische Frau in weißem Hemd, sanfter Blick, lächelt und streicht eine Haarsträhne beiseite, blickt in die Kamera. Hintergrund: warmes Café-Licht, Nachmittagssonne durchs Fenster. Filmische Qualität, geringe Schärfentiefe, warme Töne, romantische Stimmung.“

Mit dieser Formel steigt die Qualität deutlich.

Drei Schlüsseltechniken für Audio-Prompts

Veo 3 unterscheidet sich durch native Audiogenerierung – vorausgesetzt, Sie weisen Audio im Prompt an.

Laut Google DeepMind gibt es drei Formen: Dialog, Soundeffekte, Umgebungsgeräusche.

Technik 1: Dialog (Anführungszeichen)

Figur soll sprechen? Dialog in Anführungszeichen setzen.

Standardformat:

Figur sagt: „Konkreter Dialog“

Beispiele:

  • Die Frau sagt: „Die Aussicht ist wunderschön“
  • Der Mann sagt: „Wir sollten gehen“
  • Sie flüstert: „Danke“

Wichtig: Dialog kurz halten – innerhalb von 8 Sekunden, etwa 20–30 Wörter. Zu lang → unnatürlich schnelles Sprechen.

Zu lang:
❌ „Das Wetter ist heute wirklich schön, die Sonne scheint, eine leichte Brise weht, die Stimmung ist herrlich, man möchte einfach ewig hier bleiben und diesen Moment genießen“

Kürzer:
✅ „Schönes Wetter heute – ich möchte einfach bleiben“

Technik 2: Soundeffekte (SFX)

SFX = Sound Effects – Geräusche im Bild.

Standardformat:

SFX: konkrete Geräuschbeschreibung

Beispiele:

  • SFX: Wellen am Ufer, entferntes Möwenschreien
  • SFX: Kaffeetasse wird leise auf den Tisch gestellt
  • SFX: Schritte auf knirschendem Laub
  • SFX: Motorstart, tiefer Brummton

Dimensionen:

  • Lautstärke: leise, laut
  • Entfernung: fern, nah
  • Charakter: klar, dumpf, scharf

Technik 3: Umgebungsgeräusche (Ambient)

Ambient = Hintergrund-Soundscape der gesamten Szene, nicht ein einzelnes Ereignis.

Standardformat:

Ambient: Hintergrundatmosphäre

Beispiele:

  • Ambient: ruhige Abendstimmung am Meer, leichte Brise
  • Ambient: leises Jazz und Gemurmel in einem Café
  • Ambient: Vogelgezwitscher und Wind in den Blättern, früher Morgen im Wald
  • Ambient: Stadtgeräusche, Verkehr und Fußgänger

Ambient verleiht Präsenz – probieren Sie es aus.

Alle drei Audio-Typen kombinieren

Nahaufnahme, junge Frau sitzt am Café-Fenster, hebt die Tasse und nippt, lächelt zum Fenster hinaus. Warmes Nachmittagslicht auf ihrem Gesicht. Filmische Qualität, geringe Schärfentiefe, gemütliche Stimmung.

Sie sagt: „So ein Nachmittag ist perfekt.“
SFX: Tasse wird leise auf den Tisch gestellt
Ambient: leise Musik und Gemurmel im Café

Bild, Dialog, SFX und Atmosphäre – hohe Gesamtqualität.

10 sofort nutzbare Prompt-Vorlagen

Jede Vorlage folgt der 5-Elemente-Struktur – Details nach Bedarf anpassen.

Vorlage 1: Emotionale Personennahaufnahme

Für Gefühl, Vlog-Intro, Interview-ähnliche Clips.

Nahaufnahme, langsam vorfahrend, 25-jährige asiatische Frau in weißem Hemd, sanfter Blick, lächelt in die Kamera, streicht eine Haarsträhne beiseite. Hintergrund: warmes Café-Licht, Nachmittagssonne durchs Fenster. Filmische Qualität, geringe Schärfentiefe, warme Töne, romantische Stimmung. Sie sagt: „Das ist meine liebste Zeit.“ Ambient: leises Jazz und Gemurmel im Café.

Anpassungen:

  • Person: Alter, Geschlecht, Kleidung
  • Ort: Café → Park, Buchhandlung, Zuhause
  • Dialog und Stimmung

Vorlage 2: Produktpräsentation

E-Commerce, Werbung, Unboxing.

360-Grad-Rotation, silberne Smartwatch auf schwarzem Samt-Podium, langsame Drehung, Display zeigt Uhrzeit und Herzfrequenz. Hintergrund: reines Schwarz mit Verlauf, Top-Licht für Premium-Look. 4K, Produktfotografie-Stil, hoher Kontrast, technische Atmosphäre. SFX: leises mechanisches Drehen, Display-Aktivierungs-Ton.

Anpassungen:

  • Produkt: Handy, Kosmetik, Schuhe …
  • Hintergrund und Licht
  • Rotationsart

Vorlage 3: Natur und Landschaft

Reise-Vlog, Dokumentation, Umgebungsclips.

Luftaufnahme, langsam absteigend, nebelverhangene Berggipfel, Morgenlicht durchbricht die Wolken ins Tal, Wasserfall in der Ferne, dichter Wald. Kamera von oben bis zur Berghälfte. Sanftes Licht um 6 Uhr morgens, leichter Nebel. Filmische Qualität, episch, kühle Töne, ruhige Stimmung. Ambient: Bergwind, entferntes Wasserfall-Rauschen, Vogelgezwitscher.

Anpassungen:

  • Landschaft: Strand, Wüste, Stadt, See
  • Tageszeit
  • Kamerabewegung

Vorlage 4: Sport und Bewegung

Fitness-Vlog, Markenwerbung, Motivationsclips.

Tracking von der Seite, Athlet joggt am Strand, in der Morgendämmerung wird die Silhouette klarer, leichter Schritt, gleichmäßige Atmung, Schweiß glänzt in der Sonne. Hintergrund: aufhellender Himmel, ruhiges Meer, Sonnenaufgang. Zeitlupe (0,5×), filmische Qualität, motivierend, warme Töne. SFX: Schritte im Sand, Wellen, Atem.

Anpassungen:

  • Sport: Radfahren, Schwimmen, Yoga, Basketball
  • Ort: Fitnessstudio, Park, Straße
  • Geschwindigkeit

Vorlage 5: Food und Küche

Food-Blogger, Restaurant, Kochtutorial.

Top-Down-Nahaufnahme, feste Kamera, Hände eines Kochs arrangieren Zutaten auf weißem Teller, präzise elegante Bewegungen, letzte Garnitur. Saubere Küchenarbeitsfläche, weiches Deckenlicht. Fokus auf Hände und Zutaten. Food-Fotografie-Stil, 4K, warme Töne, professionelle Atmosphäre. SFX: leises Klirren von Geschirr, feine Geräusche beim Anrichten.

Anpassungen:

  • Aktion: schneiden, braten, backen, mixen
  • Perspektive
  • Gericht

Vorlage 6: Stadt-Zeitraffer

Stadtfilm, Dokumentar-Intro, Übergänge.

Weitwinkel, feste Kamera, Zeitraffer: Skyline von Dämmerung bis Nacht, Gebäudebeleuchtung geht an, Lichtspuren im Verkehr, Himmel von Orange zu Tiefblau. Aufnahme von 19 bis 21 Uhr. Filmische Qualität, episch, hoher Kontrast, moderne Großstadt-Stimmung. Ambient: Tageslärm weicht nächtlicher Atmosphäre.

Anpassungen:

  • Tageszeit
  • Stadttyp
  • Wetter

Vorlage 7: Haustier-Moment

Pet-Content, tierische Themen, warme Kurzclips.

Augenhöhe, Nahaufnahme, Golden Retriever sitzt auf Wiese, neigt den Kopf, unschuldiger Blick, streckt die Zunge, wedelt mit dem Schwanz. Hintergrund: grüne Wiese, unscharfe Bäume, sonniger Nachmittag. Geringe Schärfentiefe, filmische Qualität, warm, helle Töne. SFX: Hecheln, Schwanz schlägt auf Gras.

Anpassungen:

  • Tier: Katze, Kaninchen, Vogel …
  • Aktion
  • Szene

Vorlage 8: Tech-UI-Demo

App-Werbung, Tech-Produkte, Zukunftsvision.

Bildschirm-Perspektive, holografische UI entfaltet sich auf dunklem Hintergrund, blaue Linien zeichnen Diagramme und 3D-Modelle, Finger wischen in der Luft, Daten fließen. Schwarzer Hintergrund, High-Tech-Hologramm. Futuristischer Stil, hoher Kontrast, kalte Blautöne, Sci-Fi-Stimmung. SFX: Interface-Sounds, Datenfluss.

Anpassungen:

  • UI-Typ: Karte, Dashboard, Visualisierung
  • Farbschema
  • Interaktion

Vorlage 9: Tanzperformance

Tanzvideo, Kunst, Musik-Clip.

Weitwinkel aus niedrigem Winkel, langsame Orbit-Fahrt, Tänzerin tanzt Modern Dance in leerem Industrie-Raum, fließende kräftige Bewegungen, schöne Linien, Schatten auf dem Boden. Seitenlicht, dramatisch, graue Betonwände. Filmische Qualität, künstlerisch, hoher Kontrast, Kraft und Ästhetik. Rhythmisches Musik-Backing, Schritte, Atem.

Anpassungen:

  • Tanzstil
  • Location
  • Licht und Stimmung

Vorlage 10: Emotionale Geschichte

Kurzfilm, Brand Story, Gefühl.

Schulter-Halbtotal, langsam vorfahrend, älteres Paar auf Parkbank, aneinander gelehnt, er nimmt sanft ihre Hand, beide schauen in den Sonnenuntergang. Bäume und orangefarbener Himmel, warmes Abendlicht. Geringe Schärfentiefe, filmische Qualität, nostalgisch-warm, warme Töne. Ambient: Vogelgezwitscher, Wind in den Blättern.

Anpassungen:

  • Beziehung: Freunde, Vater und Sohn …
  • Emotion
  • Ort und Zeit

Nutzungstipps

  1. Struktur behalten, Details tauschen – 5 Elemente unverändert lassen
  2. Länge anpassen – Veo 3: 4, 6 oder 8 Sekunden; komplexe Handlung → 8 s
  3. Audio optional – ohne Dialog nur SFX oder Ambient
  4. Mehrfach generieren – KI hat Zufall; beste Variante wählen

Fehler vermeiden: 5 Probleme und Lösungen

Fehler 1: Zu wenig Information

Symptom: „Eine Person läuft“ – Ergebnis weit entfernt von der Vorstellung.

Ursache: Veo 3 braucht genug Kontext, sonst rät es.

Lösung: 5-Elemente-Formel – mindestens Kameratyp + Subjekt + Handlung + Szene + Stil.

❌ Falsch:

Eine Person läuft

✅ Richtig:

Tracking von der Seite, junger Mann in schwarzer Sportkleidung joggt morgens durch die Stadt, kräftiger Schritt, Sonnenlicht auf der Haut. Filmische Qualität, motivierend, warme Töne. SFX: Schritte, morgendliche Stadtgeräusche.

Fehler 2: Zu viele Details ohne Fokus

Symptom: Dutzend visueller Elemente – alles ist drin, nichts sticht hervor.

Ursache: In 8 Sekunden ist Kapazität begrenzt.

Lösung: 3–5 zentrale Elemente, 20–40 Wörter; Google empfiehlt 10–25.

❌ Überladen:

Nahaufnahme, Weitwinkel, Luftaufnahme, junge Frau, rotes Kleid, Hut, Sonnenbrille, Kette, am Strand, Sand, Felsen, Pier, gehen, rennen, tanzen, drehen, Möwen, Wellen, Sonnenuntergang, Wolken, Sterne …

✅ Fokussiert:

Nahaufnahme, langsam vorfahrend, junge Frau im roten Kleid spaziert am Strand, Wind hebt ihr Haar. Abenddämmerung, warmes Licht. Filmische Qualität, romantisch. SFX: Wellen, Wind.

Fehler 3: Keine Kamera-Anweisung

Symptom: Statisches Bild ohne Dynamik.

Ursache: Ohne Angabe → Standard ist statische Kamera.

Lösung: Kameratyp und Bewegung immer nennen.

Häufige Bewegungen:

  • Vor/zurück: dolly in/out, slowly pushing forward
  • Tracking: tracking shot, following
  • Orbit: orbit around, circling
  • Absteigende Luftaufnahme: aerial shot descending
  • Statisch (explizit): static shot, fixed camera

Fehler 4: Fehlende oder unklare Audio-Anweisung

Symptom: Stumm oder Sound passt nicht zum Bild.

Lösung: Mindestens ein Audio-Element, Standardformate:

  • Dialog: Figur sagt: „Text“
  • SFX: SFX: konkretes Geräusch
  • Ambient: Ambient: Atmosphäre

Dialog: max. 8 Sekunden Sprechzeit.

Fehler 5: Dialog zu lang

Symptom: Figur spricht unnatürlich schnell.

Ursache: Maximal 8 Sekunden Video – langer Text wird komprimiert.

Lösung: Selbst testen – laut vorlesen, über 8 Sekunden = kürzen.

❌ Zu lang:

Sie sagt: „Das Wetter ist heute wirklich schön, die Sonne scheint, eine leichte Brise weht, die Stimmung ist herrlich, man möchte einfach ewig hier bleiben.“

✅ Kürzer:

Sie sagt: „Schönes Wetter – ich möchte bleiben.“

Oder in mehrere kurze Clips aufteilen.

Fortgeschritten: 3 Methoden für professionellere Clips

Methode 1: Negative Prompts

Sagen Sie Veo, was nicht erscheinen soll – durch positive Beschreibung des Gewünschten.

❌ Zu vage:

Wüstenlandschaft, no buildings

✅ Konkret:

Karge Wüste, endlose Dünen, keine Gebäude, keine Straßen, keine menschlichen Spuren, nur reine Natur.

Anwendungen:

  • Untertitel vermeiden: „No subtitles“
  • Elemente ausschließen: keine Personen, kein Text
  • Sauberer Hintergrund bei Produktfotos

Methode 2: Figurenkonsistenz

Für Serien: gleiche Figur über mehrere Clips.

  1. Charakterkarte nach erstem gelungenen Clip:
28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln, schlanke Figur
  1. Gleiche Beschreibung, nur Handlung und Szene ändern:

Erster Clip:

Nahaufnahme, 28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln, liest im Café …

Zweiter Clip:

Tracking, 28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln, spaziert im Park …

Methode 3: Zeitstempel für Multi-Shot (Fortgeschritten)

Mehrere Einstellungen in einem 8-Sekunden-Clip:

Format:

[00:00-00:02] Erste Einstellung
[00:02-00:05] Zweite Einstellung
[00:05-00:08] Dritte Einstellung

Beispiel:

[00:00-00:03] Weitwinkel, Stadtstraße, Verkehr und Fußgänger, Morgensonne
[00:03-00:06] Nahaufnahme vorfahrend, junge Frau geht die Straße entlang, lächelt
[00:06-00:08] Halbtotal, sie betritt ein Café, öffnet die Tür

Filmische Qualität, urbanes Leben, warme Töne
Ambient: Stadtgeräusche, Verkehr, Café-Türglocke

Hinweise:

  • Pro Einstellung 2–3 Sekunden
  • Gesamt max. 8 Sekunden
  • Erst Grundlagen beherrschen, dann testen

Fazit

Kernbotschaft: 5-Elemente-Formel – Kameratechnik + Subjekt + Handlung + Umgebung + Stil und Stimmung. Damit ist der Prompt schon zur Hälfte gelungen.

Audio nicht vergessen: Dialog in Anführungszeichen, SFX für Effekte, Ambient für Atmosphäre.

Die 10 Vorlagen sind sofort nutzbar – Struktur verstehen, Details anpassen.

Prompt-Schreiben braucht Übung. Mit Vorlagen finden Sie schnell Ihren Stil.

Scheitern gehört dazu – gleicher Prompt, verschiedene Varianten; die beste wählen, aus Fehlversuchen lernen.

Wählen Sie eine Vorlage, passen Sie Details an, generieren Sie Ihren ersten Veo-3-Clip. Filmreife Bilder motivieren.

Veo 3 entwickelt sich weiter – Google optimiert das Modell laufend. Offizielle Updates im Blick behalten.

Viel Erfolg – wir freuen uns auf Ihre Ergebnisse!

FAQ

Wie schreibt man Veo-3-Prompts für hochwertige Videos?
Nutzen Sie die 5-Elemente-Formel:
• Kameratechnik + Subjektbeschreibung + Handlung + Umgebung + Stil und Stimmung

Ergebnis:
• Detaillierte Prompts liefern über 60 % bessere Qualität als kurze
• Optimale Länge: 10–25 Wörter
• Fokus auf 3–5 zentrale visuelle Elemente
Wie steuert man Audio in Veo 3?
Drei Elemente für Audio-Anweisungen:

1) Dialog in Anführungszeichen:
• Format: ‚Figur sagt: „Dialogtext“‘
• Dialog innerhalb von 8 Sekunden (ca. 20–30 Wörter)

2) Soundeffekte mit SFX:
• Format: ‚SFX: konkrete Geräuschbeschreibung‘

3) Umgebungsgeräusche mit Ambient:
• Format: ‚Ambient: Hintergrundatmosphäre‘
Was passiert bei zu einfachen Prompts?
Zu kurze Prompts (z. B. ‚Eine Person läuft‘) lassen Veo 3 raten – das Ergebnis weicht stark von der Erwartung ab.

Vollständige Angaben nötig:
• Kameratyp
• Subjektbeschreibung
• Handlung
• Szene
• Stil

Ergänzen Sie mit der 5-Elemente-Formel – mindestens: Kameratyp + Subjekt + Handlung + Szene + Stil.
Was passiert bei zu langen Prompts?
Informationsüberflutung verwirrt Veo 3 – das Video wirkt unruhig und unstrukturiert.

Empfehlung:
• Google empfiehlt 10–25 Wörter
• Fokus auf 3–5 zentrale visuelle Elemente
• Keine Detail-Flut

Grund: Veo 3 kann in 8 Sekunden nur begrenzt viel zeigen.
Wie hält man Figuren über mehrere Videos konsistent?
Erstellen Sie eine ‚Charakterkarte‘:
1) Nach der ersten gelungenen Figur die Personenbeschreibung separat speichern
2) Bei jedem neuen Clip dieselbe Beschreibung nutzen, nur Handlung und Szene ändern

Beispiel: ‚Eine 28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln‘

Bei konsistenter Kernbeschreibung bleibt das Erscheinungsbild sehr ähnlich.
Warum hat mein Video keinen Ton?
Ohne Audio-Anweisung im Prompt weiß Veo 3 nicht, welche Geräusche erzeugt werden sollen.

Lösung:
• Mindestens ein Audio-Element (Dialog/SFX/Ambient)
• Standardformate: Dialog in Anführungszeichen, SFX für Effekte, Ambient für Atmosphäre

Merken: Dialog nicht länger als 8 Sekunden Sprechzeit (ca. 20–30 Wörter).

8 Min. Lesezeit · Veröffentlicht am: 4. Dez. 2025 · Aktualisiert am: 8. Juni 2026

Kommentare

Melde dich mit GitHub an, um einen Kommentar zu hinterlassen