Veo-3-Prompts schreiben: 5-Schritte-Formel + 10 Vorlagen für filmreife KI-Videos
Geben Sie „Ein Mädchen geht am Strand“ ein – und Veo 3 liefert unscharfe Bilder, steife Bewegungen, nichts von der romantischen Stimmung, die Sie sich vorstellen. Auf Social Media sehen andere Clips aus wie Filmszenen: flüssige Kameraführung, perfekt passender Sound.
Das liegt selten am Modell, sondern am Prompt. Veo-3-Prompts sind keine lose Beschreibung, sondern Anweisungen an einen Profi-Kameramann: Objektiv, Winkel, Licht, Handlung der Figur – und oft auch den Sound.
Dieser Artikel stellt ein erprobtes Prompt-System vor: 5 Kernelemente, 10 sofort nutzbare Vorlagen, typische Fehler und Fortgeschrittenen-Tipps. Danach können Sie Prompts schreiben, die filmreife Ergebnisse liefern.
Warum Ihre Veo-3-Videos oft enttäuschen
Bevor wir zur Methode kommen: Warum scheitern so viele Versuche? Viele denken, ein Prompt sei einfach eine natürliche Szenenbeschreibung. Tatsächlich ist er eher eine strukturierte Anweisungssprache.
Vergleich: Im Restaurant reicht „etwas Leckeres“ nicht. Sie nennen Küche, Schärfe, Beilage. Veo 3 braucht ebenso klare Vorgaben.
Laut Google steigern detaillierte Prompts die Qualität um über 60 %. „Detailliert“ heißt nicht „lang“, sondern vollständig.
Die 3 häufigsten Prompt-Fehler
Fehler 1: Zu knapp formuliert
Viele schreiben nur „Eine Person läuft“ oder „Eine Katze spielt“. Zu wenig Information – Veo 3 muss raten. Ergebnis: vielleicht ein Mann im Anzug auf dem Laufband, vielleicht ein Jogger im Park. Was Sie wollen, weiß das Modell nicht.
Vergleich:
❌ Schwacher Prompt: „Eine Person läuft“
✅ Starker Prompt: „Tracking-Aufnahme von der Seite, ein junger Mann in schwarzer Sportkleidung joggt morgens durch eine Stadtstraße, leichter, kräftiger Schritt, Sonnenlicht auf seiner Haut. Filmische Qualität, motivierende Stimmung, warme Farbtöne. SFX: Schritte beim Laufen, morgendliche Stadtgeräusche.“
Der gute Prompt nennt Kamera, Person, Handlung, Umgebung, Stil und Sound.
Fehler 2: Informationsüberflutung ohne Fokus
Die andere Extreme: alle Details stapeln – Veo 3 verliert den roten Faden. Wie dem Kameramann sagen: „Nahaufnahme, Weitwinkel, Tracking, Zeitlupe, Sonnenaufgang und Sonnenuntergang …“
Google Cloud empfiehlt 10–25 Wörter. Zu kurz = zu wenig Info, zu lang = Chaos. Die wichtigsten visuellen Elemente klar herausstellen.
Fehler 3: Audio ignorieren
Veo 3 kann Dialog, SFX und Umgebungsgeräusche mitgenerieren. Ohne Anweisung: stummes Video oder zufälliger, unpassender Sound.
Mit Audio-Anweisungen wirken Clips deutlich fertiger und stimmiger.
Die 5-Elemente-Formel für Veo-3-Prompts
Basierend auf Googles Leitfaden und eigener Praxis – eine Formel, die die Erfolgsquote spürbar erhöht:
Vollständige Formel:
[Kameratechnik] + [Subjektbeschreibung] + [Handlung] + [Umgebung] + [Stil und Stimmung]
Jedes Element hat Feinheiten. Schauen wir sie uns an.
Element 1: Kameratechnik (Camera Work)
Welches Objektiv, welcher Winkel, wie bewegt sich die Kamera?
Kameratypen:
- Nahaufnahme (close-up): Details – Mimik, Hände
- Halbtotal (medium shot): Oberkörper oder Ganzfigur
- Weitwinkel / Totale (wide shot): große Szene, Umgebung
- Vogelperspektive (aerial shot): Aufnahme von oben
Kamerabewegungen:
- Dolly in/out: Kamera fährt vor oder zurück
- Tracking shot: Kamera folgt dem Subjekt
- Pan: Schwenk links/rechts oder hoch/runter
- Crane shot: vertikale Kamerafahrt
- Static shot: feste Kamera
Beispiele:
- „Nahaufnahme, langsam vorfahrend“ → von Halbtotal zur Gesichtsnahaufnahme
- „Tracking von der Seite“ → Kamera folgt lateral
- „Luftaufnahme, langsam absteigend“ → von oben nach unten
Wichtig: Ohne Kamerabewegung liefert Veo 3 meist eine statische Einstellung. Für Dynamik explizit angeben.
Element 2: Subjektbeschreibung (Subject)
Das Subjekt ist der Fokus – Person, Tier oder Objekt. Je konkreter, desto konsistenter die Figur.
Bei Personen:
- Alter und Geschlecht: „asiatische Frau, etwa 25 Jahre“
- Kleidung: „beiger Trenchcoat, langes Haar im Wind“
- Mimik: „lächelnd“, „sanfter Blick“
- Körperhaltung: „schlanke Figur“, „elegante Haltung“
Beispiele:
- ❌ Einfach: „Ein Mädchen“
- ✅ Detailliert: „Eine asiatische Frau, etwa 30, weißes Hemd, langes offenes Haar, sanfter Blick, lächelnd“
Tipp: Für konsistente Figuren über mehrere Clips dieselbe Personenbeschreibung wiederverwenden. Ähnliche Prompts erzeugen ähnliche Charaktere.
Element 3: Handlung (Action)
Das Subjekt muss sich bewegen – konkret genug, dass man das Bild vor Augen hat.
Von allgemein zu konkret:
- „gehen“ → „gemächlich spazieren“
- „schauen“ → „den Blick in die Ferne heben“
- „lächeln“ → „leicht lächeln, Augenwinkel nach oben“
Mit Tempo und Details:
- „Sie dreht langsam den Kopf, der Wind hebt ihre Haare“
- „Er winkt schnell zum Abschied und geht davon“
- „Die Katze neigt den Kopf und springt auf das Spielzeug“
Je lebendiger die Handlung, desto lebendiger das Video.
Element 4: Umgebung (Environment)
Ort, Tageszeit, Wetter, Licht – sie prägen die Atmosphäre.
Vollständige Umgebungsbeschreibung:
- Ort: Strand, Café, Stadtstraße, Wald …
- Tageszeit: Sonnenaufgang, Mittag, Abenddämmerung, Nacht
- Wetter: sonnig, bewölkt, Regen, Nebel
- Licht: warmes Sonnenlicht, weiches Deckenlicht, dramatisches Seitenlicht
- Details: Wellen, Blätter im Wind, Verkehr
Beispiel:
„Goldener Strand bei Sonnenuntergang, warmes oranges Licht auf dem Sand, sanfte Wellen, ein paar Möwen in der Ferne.“
Element 5: Stil und Stimmung (Style & Mood)
Gesamtlook und Emotion – filmisch, dokumentarisch oder animiert.
Visueller Stil:
- Cinematic: filmische Bildqualität und Komposition
- Documentary: natürlich, authentisch
- Animated: Cartoon-Stil
- Stop-motion: wie bei „Fantastic Mr. Fox“
Stimmung:
- romantisch, ruhig, spannend, geheimnisvoll, motivierend, warm …
Bildqualität:
- „4K“, „filmische Farbgebung“, „warme/kalte Töne“, „hoher Kontrast“, „geringe Schärfentiefe“
Vollständiges Beispiel:
„Filmische Qualität, romantische Stimmung, warme Töne, geringe Schärfentiefe, weiches Naturlicht.“
Die 5 Elemente kombinieren
[Nahaufnahme, langsam vorfahrend] + [25-jährige asiatische Frau, weißes Hemd, lächelnd] + [streicht sanft eine Haarsträhne beiseite, blickt in die Kamera] + [Café, Nachmittagssonne fällt durchs Fenster] + [filmische Qualität, geringe Schärfentiefe, warme Töne, romantische Stimmung]
Zusammengefügt:
„Nahaufnahme, langsam vorfahrend, eine 25-jährige asiatische Frau in weißem Hemd, sanfter Blick, lächelt und streicht eine Haarsträhne beiseite, blickt in die Kamera. Hintergrund: warmes Café-Licht, Nachmittagssonne durchs Fenster. Filmische Qualität, geringe Schärfentiefe, warme Töne, romantische Stimmung.“
Mit dieser Formel steigt die Qualität deutlich.
Drei Schlüsseltechniken für Audio-Prompts
Veo 3 unterscheidet sich durch native Audiogenerierung – vorausgesetzt, Sie weisen Audio im Prompt an.
Laut Google DeepMind gibt es drei Formen: Dialog, Soundeffekte, Umgebungsgeräusche.
Technik 1: Dialog (Anführungszeichen)
Figur soll sprechen? Dialog in Anführungszeichen setzen.
Standardformat:
Figur sagt: „Konkreter Dialog“
Beispiele:
- Die Frau sagt: „Die Aussicht ist wunderschön“
- Der Mann sagt: „Wir sollten gehen“
- Sie flüstert: „Danke“
Wichtig: Dialog kurz halten – innerhalb von 8 Sekunden, etwa 20–30 Wörter. Zu lang → unnatürlich schnelles Sprechen.
Zu lang:
❌ „Das Wetter ist heute wirklich schön, die Sonne scheint, eine leichte Brise weht, die Stimmung ist herrlich, man möchte einfach ewig hier bleiben und diesen Moment genießen“
Kürzer:
✅ „Schönes Wetter heute – ich möchte einfach bleiben“
Technik 2: Soundeffekte (SFX)
SFX = Sound Effects – Geräusche im Bild.
Standardformat:
SFX: konkrete Geräuschbeschreibung
Beispiele:
- SFX: Wellen am Ufer, entferntes Möwenschreien
- SFX: Kaffeetasse wird leise auf den Tisch gestellt
- SFX: Schritte auf knirschendem Laub
- SFX: Motorstart, tiefer Brummton
Dimensionen:
- Lautstärke: leise, laut
- Entfernung: fern, nah
- Charakter: klar, dumpf, scharf
Technik 3: Umgebungsgeräusche (Ambient)
Ambient = Hintergrund-Soundscape der gesamten Szene, nicht ein einzelnes Ereignis.
Standardformat:
Ambient: Hintergrundatmosphäre
Beispiele:
- Ambient: ruhige Abendstimmung am Meer, leichte Brise
- Ambient: leises Jazz und Gemurmel in einem Café
- Ambient: Vogelgezwitscher und Wind in den Blättern, früher Morgen im Wald
- Ambient: Stadtgeräusche, Verkehr und Fußgänger
Ambient verleiht Präsenz – probieren Sie es aus.
Alle drei Audio-Typen kombinieren
Nahaufnahme, junge Frau sitzt am Café-Fenster, hebt die Tasse und nippt, lächelt zum Fenster hinaus. Warmes Nachmittagslicht auf ihrem Gesicht. Filmische Qualität, geringe Schärfentiefe, gemütliche Stimmung.
Sie sagt: „So ein Nachmittag ist perfekt.“
SFX: Tasse wird leise auf den Tisch gestellt
Ambient: leise Musik und Gemurmel im Café
Bild, Dialog, SFX und Atmosphäre – hohe Gesamtqualität.
10 sofort nutzbare Prompt-Vorlagen
Jede Vorlage folgt der 5-Elemente-Struktur – Details nach Bedarf anpassen.
Vorlage 1: Emotionale Personennahaufnahme
Für Gefühl, Vlog-Intro, Interview-ähnliche Clips.
Nahaufnahme, langsam vorfahrend, 25-jährige asiatische Frau in weißem Hemd, sanfter Blick, lächelt in die Kamera, streicht eine Haarsträhne beiseite. Hintergrund: warmes Café-Licht, Nachmittagssonne durchs Fenster. Filmische Qualität, geringe Schärfentiefe, warme Töne, romantische Stimmung. Sie sagt: „Das ist meine liebste Zeit.“ Ambient: leises Jazz und Gemurmel im Café.
Anpassungen:
- Person: Alter, Geschlecht, Kleidung
- Ort: Café → Park, Buchhandlung, Zuhause
- Dialog und Stimmung
Vorlage 2: Produktpräsentation
E-Commerce, Werbung, Unboxing.
360-Grad-Rotation, silberne Smartwatch auf schwarzem Samt-Podium, langsame Drehung, Display zeigt Uhrzeit und Herzfrequenz. Hintergrund: reines Schwarz mit Verlauf, Top-Licht für Premium-Look. 4K, Produktfotografie-Stil, hoher Kontrast, technische Atmosphäre. SFX: leises mechanisches Drehen, Display-Aktivierungs-Ton.
Anpassungen:
- Produkt: Handy, Kosmetik, Schuhe …
- Hintergrund und Licht
- Rotationsart
Vorlage 3: Natur und Landschaft
Reise-Vlog, Dokumentation, Umgebungsclips.
Luftaufnahme, langsam absteigend, nebelverhangene Berggipfel, Morgenlicht durchbricht die Wolken ins Tal, Wasserfall in der Ferne, dichter Wald. Kamera von oben bis zur Berghälfte. Sanftes Licht um 6 Uhr morgens, leichter Nebel. Filmische Qualität, episch, kühle Töne, ruhige Stimmung. Ambient: Bergwind, entferntes Wasserfall-Rauschen, Vogelgezwitscher.
Anpassungen:
- Landschaft: Strand, Wüste, Stadt, See
- Tageszeit
- Kamerabewegung
Vorlage 4: Sport und Bewegung
Fitness-Vlog, Markenwerbung, Motivationsclips.
Tracking von der Seite, Athlet joggt am Strand, in der Morgendämmerung wird die Silhouette klarer, leichter Schritt, gleichmäßige Atmung, Schweiß glänzt in der Sonne. Hintergrund: aufhellender Himmel, ruhiges Meer, Sonnenaufgang. Zeitlupe (0,5×), filmische Qualität, motivierend, warme Töne. SFX: Schritte im Sand, Wellen, Atem.
Anpassungen:
- Sport: Radfahren, Schwimmen, Yoga, Basketball
- Ort: Fitnessstudio, Park, Straße
- Geschwindigkeit
Vorlage 5: Food und Küche
Food-Blogger, Restaurant, Kochtutorial.
Top-Down-Nahaufnahme, feste Kamera, Hände eines Kochs arrangieren Zutaten auf weißem Teller, präzise elegante Bewegungen, letzte Garnitur. Saubere Küchenarbeitsfläche, weiches Deckenlicht. Fokus auf Hände und Zutaten. Food-Fotografie-Stil, 4K, warme Töne, professionelle Atmosphäre. SFX: leises Klirren von Geschirr, feine Geräusche beim Anrichten.
Anpassungen:
- Aktion: schneiden, braten, backen, mixen
- Perspektive
- Gericht
Vorlage 6: Stadt-Zeitraffer
Stadtfilm, Dokumentar-Intro, Übergänge.
Weitwinkel, feste Kamera, Zeitraffer: Skyline von Dämmerung bis Nacht, Gebäudebeleuchtung geht an, Lichtspuren im Verkehr, Himmel von Orange zu Tiefblau. Aufnahme von 19 bis 21 Uhr. Filmische Qualität, episch, hoher Kontrast, moderne Großstadt-Stimmung. Ambient: Tageslärm weicht nächtlicher Atmosphäre.
Anpassungen:
- Tageszeit
- Stadttyp
- Wetter
Vorlage 7: Haustier-Moment
Pet-Content, tierische Themen, warme Kurzclips.
Augenhöhe, Nahaufnahme, Golden Retriever sitzt auf Wiese, neigt den Kopf, unschuldiger Blick, streckt die Zunge, wedelt mit dem Schwanz. Hintergrund: grüne Wiese, unscharfe Bäume, sonniger Nachmittag. Geringe Schärfentiefe, filmische Qualität, warm, helle Töne. SFX: Hecheln, Schwanz schlägt auf Gras.
Anpassungen:
- Tier: Katze, Kaninchen, Vogel …
- Aktion
- Szene
Vorlage 8: Tech-UI-Demo
App-Werbung, Tech-Produkte, Zukunftsvision.
Bildschirm-Perspektive, holografische UI entfaltet sich auf dunklem Hintergrund, blaue Linien zeichnen Diagramme und 3D-Modelle, Finger wischen in der Luft, Daten fließen. Schwarzer Hintergrund, High-Tech-Hologramm. Futuristischer Stil, hoher Kontrast, kalte Blautöne, Sci-Fi-Stimmung. SFX: Interface-Sounds, Datenfluss.
Anpassungen:
- UI-Typ: Karte, Dashboard, Visualisierung
- Farbschema
- Interaktion
Vorlage 9: Tanzperformance
Tanzvideo, Kunst, Musik-Clip.
Weitwinkel aus niedrigem Winkel, langsame Orbit-Fahrt, Tänzerin tanzt Modern Dance in leerem Industrie-Raum, fließende kräftige Bewegungen, schöne Linien, Schatten auf dem Boden. Seitenlicht, dramatisch, graue Betonwände. Filmische Qualität, künstlerisch, hoher Kontrast, Kraft und Ästhetik. Rhythmisches Musik-Backing, Schritte, Atem.
Anpassungen:
- Tanzstil
- Location
- Licht und Stimmung
Vorlage 10: Emotionale Geschichte
Kurzfilm, Brand Story, Gefühl.
Schulter-Halbtotal, langsam vorfahrend, älteres Paar auf Parkbank, aneinander gelehnt, er nimmt sanft ihre Hand, beide schauen in den Sonnenuntergang. Bäume und orangefarbener Himmel, warmes Abendlicht. Geringe Schärfentiefe, filmische Qualität, nostalgisch-warm, warme Töne. Ambient: Vogelgezwitscher, Wind in den Blättern.
Anpassungen:
- Beziehung: Freunde, Vater und Sohn …
- Emotion
- Ort und Zeit
Nutzungstipps
- Struktur behalten, Details tauschen – 5 Elemente unverändert lassen
- Länge anpassen – Veo 3: 4, 6 oder 8 Sekunden; komplexe Handlung → 8 s
- Audio optional – ohne Dialog nur SFX oder Ambient
- Mehrfach generieren – KI hat Zufall; beste Variante wählen
Fehler vermeiden: 5 Probleme und Lösungen
Fehler 1: Zu wenig Information
Symptom: „Eine Person läuft“ – Ergebnis weit entfernt von der Vorstellung.
Ursache: Veo 3 braucht genug Kontext, sonst rät es.
Lösung: 5-Elemente-Formel – mindestens Kameratyp + Subjekt + Handlung + Szene + Stil.
❌ Falsch:
Eine Person läuft
✅ Richtig:
Tracking von der Seite, junger Mann in schwarzer Sportkleidung joggt morgens durch die Stadt, kräftiger Schritt, Sonnenlicht auf der Haut. Filmische Qualität, motivierend, warme Töne. SFX: Schritte, morgendliche Stadtgeräusche.
Fehler 2: Zu viele Details ohne Fokus
Symptom: Dutzend visueller Elemente – alles ist drin, nichts sticht hervor.
Ursache: In 8 Sekunden ist Kapazität begrenzt.
Lösung: 3–5 zentrale Elemente, 20–40 Wörter; Google empfiehlt 10–25.
❌ Überladen:
Nahaufnahme, Weitwinkel, Luftaufnahme, junge Frau, rotes Kleid, Hut, Sonnenbrille, Kette, am Strand, Sand, Felsen, Pier, gehen, rennen, tanzen, drehen, Möwen, Wellen, Sonnenuntergang, Wolken, Sterne …
✅ Fokussiert:
Nahaufnahme, langsam vorfahrend, junge Frau im roten Kleid spaziert am Strand, Wind hebt ihr Haar. Abenddämmerung, warmes Licht. Filmische Qualität, romantisch. SFX: Wellen, Wind.
Fehler 3: Keine Kamera-Anweisung
Symptom: Statisches Bild ohne Dynamik.
Ursache: Ohne Angabe → Standard ist statische Kamera.
Lösung: Kameratyp und Bewegung immer nennen.
Häufige Bewegungen:
- Vor/zurück: dolly in/out, slowly pushing forward
- Tracking: tracking shot, following
- Orbit: orbit around, circling
- Absteigende Luftaufnahme: aerial shot descending
- Statisch (explizit): static shot, fixed camera
Fehler 4: Fehlende oder unklare Audio-Anweisung
Symptom: Stumm oder Sound passt nicht zum Bild.
Lösung: Mindestens ein Audio-Element, Standardformate:
- Dialog:
Figur sagt: „Text“ - SFX:
SFX: konkretes Geräusch - Ambient:
Ambient: Atmosphäre
Dialog: max. 8 Sekunden Sprechzeit.
Fehler 5: Dialog zu lang
Symptom: Figur spricht unnatürlich schnell.
Ursache: Maximal 8 Sekunden Video – langer Text wird komprimiert.
Lösung: Selbst testen – laut vorlesen, über 8 Sekunden = kürzen.
❌ Zu lang:
Sie sagt: „Das Wetter ist heute wirklich schön, die Sonne scheint, eine leichte Brise weht, die Stimmung ist herrlich, man möchte einfach ewig hier bleiben.“
✅ Kürzer:
Sie sagt: „Schönes Wetter – ich möchte bleiben.“
Oder in mehrere kurze Clips aufteilen.
Fortgeschritten: 3 Methoden für professionellere Clips
Methode 1: Negative Prompts
Sagen Sie Veo, was nicht erscheinen soll – durch positive Beschreibung des Gewünschten.
❌ Zu vage:
Wüstenlandschaft, no buildings
✅ Konkret:
Karge Wüste, endlose Dünen, keine Gebäude, keine Straßen, keine menschlichen Spuren, nur reine Natur.
Anwendungen:
- Untertitel vermeiden: „No subtitles“
- Elemente ausschließen: keine Personen, kein Text
- Sauberer Hintergrund bei Produktfotos
Methode 2: Figurenkonsistenz
Für Serien: gleiche Figur über mehrere Clips.
- Charakterkarte nach erstem gelungenen Clip:
28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln, schlanke Figur
- Gleiche Beschreibung, nur Handlung und Szene ändern:
Erster Clip:
Nahaufnahme, 28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln, liest im Café …
Zweiter Clip:
Tracking, 28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln, spaziert im Park …
Methode 3: Zeitstempel für Multi-Shot (Fortgeschritten)
Mehrere Einstellungen in einem 8-Sekunden-Clip:
Format:
[00:00-00:02] Erste Einstellung
[00:02-00:05] Zweite Einstellung
[00:05-00:08] Dritte Einstellung
Beispiel:
[00:00-00:03] Weitwinkel, Stadtstraße, Verkehr und Fußgänger, Morgensonne
[00:03-00:06] Nahaufnahme vorfahrend, junge Frau geht die Straße entlang, lächelt
[00:06-00:08] Halbtotal, sie betritt ein Café, öffnet die Tür
Filmische Qualität, urbanes Leben, warme Töne
Ambient: Stadtgeräusche, Verkehr, Café-Türglocke
Hinweise:
- Pro Einstellung 2–3 Sekunden
- Gesamt max. 8 Sekunden
- Erst Grundlagen beherrschen, dann testen
Fazit
Kernbotschaft: 5-Elemente-Formel – Kameratechnik + Subjekt + Handlung + Umgebung + Stil und Stimmung. Damit ist der Prompt schon zur Hälfte gelungen.
Audio nicht vergessen: Dialog in Anführungszeichen, SFX für Effekte, Ambient für Atmosphäre.
Die 10 Vorlagen sind sofort nutzbar – Struktur verstehen, Details anpassen.
Prompt-Schreiben braucht Übung. Mit Vorlagen finden Sie schnell Ihren Stil.
Scheitern gehört dazu – gleicher Prompt, verschiedene Varianten; die beste wählen, aus Fehlversuchen lernen.
Wählen Sie eine Vorlage, passen Sie Details an, generieren Sie Ihren ersten Veo-3-Clip. Filmreife Bilder motivieren.
Veo 3 entwickelt sich weiter – Google optimiert das Modell laufend. Offizielle Updates im Blick behalten.
Viel Erfolg – wir freuen uns auf Ihre Ergebnisse!
FAQ
Wie schreibt man Veo-3-Prompts für hochwertige Videos?
• Kameratechnik + Subjektbeschreibung + Handlung + Umgebung + Stil und Stimmung
Ergebnis:
• Detaillierte Prompts liefern über 60 % bessere Qualität als kurze
• Optimale Länge: 10–25 Wörter
• Fokus auf 3–5 zentrale visuelle Elemente
Wie steuert man Audio in Veo 3?
1) Dialog in Anführungszeichen:
• Format: ‚Figur sagt: „Dialogtext“‘
• Dialog innerhalb von 8 Sekunden (ca. 20–30 Wörter)
2) Soundeffekte mit SFX:
• Format: ‚SFX: konkrete Geräuschbeschreibung‘
3) Umgebungsgeräusche mit Ambient:
• Format: ‚Ambient: Hintergrundatmosphäre‘
Was passiert bei zu einfachen Prompts?
Vollständige Angaben nötig:
• Kameratyp
• Subjektbeschreibung
• Handlung
• Szene
• Stil
Ergänzen Sie mit der 5-Elemente-Formel – mindestens: Kameratyp + Subjekt + Handlung + Szene + Stil.
Was passiert bei zu langen Prompts?
Empfehlung:
• Google empfiehlt 10–25 Wörter
• Fokus auf 3–5 zentrale visuelle Elemente
• Keine Detail-Flut
Grund: Veo 3 kann in 8 Sekunden nur begrenzt viel zeigen.
Wie hält man Figuren über mehrere Videos konsistent?
1) Nach der ersten gelungenen Figur die Personenbeschreibung separat speichern
2) Bei jedem neuen Clip dieselbe Beschreibung nutzen, nur Handlung und Szene ändern
Beispiel: ‚Eine 28-jährige asiatische Frau, langes offenes Haar, weißes Hemd und Jeans, warmes Lächeln‘
Bei konsistenter Kernbeschreibung bleibt das Erscheinungsbild sehr ähnlich.
Warum hat mein Video keinen Ton?
Lösung:
• Mindestens ein Audio-Element (Dialog/SFX/Ambient)
• Standardformate: Dialog in Anführungszeichen, SFX für Effekte, Ambient für Atmosphäre
Merken: Dialog nicht länger als 8 Sekunden Sprechzeit (ca. 20–30 Wörter).
8 Min. Lesezeit · Veröffentlicht am: 4. Dez. 2025 · Aktualisiert am: 8. Juni 2026
Veo3 Guide
Du liest den ersten Beitrag dieser Serie. Lies den nächsten Beitrag oder öffne die Serienübersicht, um den gesamten Pfad zu sehen.
Vorheriger
Du bist am Anfang dieser Serie.
Nächster
Wie viel kostet Veo 3 pro Monat? Pro vs. Ultra im Vergleich und Spartipps
Veo-3-Abo im Detail: Pro (19,99 $/Monat) vs. Ultra (249,99 $/Monat), Credit-Verbrauch, versteckte Kosten und Spartipps – inkl. Preisvergleich mit Runway, Pika und anderen KI-Video-Tools.
Teil 2 von 7
Ähnliche Beiträge
Veo 3 Kamerasteuerung: 7 Shot-Typen für sofort mehr Filmlook in KI-Videos
Veo 3 Kamerasteuerung: 7 Shot-Typen für sofort mehr Filmlook in KI-Videos
Veo 3 Audiogenerierung komplett: KI-Videos mit Dialog, SFX und Musik (Prompt-Vorlagen)
Veo 3 Audiogenerierung komplett: KI-Videos mit Dialog, SFX und Musik (Prompt-Vorlagen)
Veo 3 Charakterkonsistenz: Mit Scenebuilder kohärente Mehrfach-Szenen-Videos erstellen
Kommentare
Melde dich mit GitHub an, um einen Kommentar zu hinterlassen