Kreation über Medien hinweg: Mit Nano Banana 2 und Gemini 3 vom Skizzenentwurf zur vollautomatischen Präsentation
Am Mittwochnachmittag pingte der Chef in der Gruppe: „Morgen früh Investoren-Pitch, 20 Folien – Technikarchitektur und Marktperspektive unseres Produkts.“
Ich starrte auf die Nachricht und dachte nur: Das war’s.
20 hochwertige Folien brauchen Struktur, Inhalt, Bilder, Layout. Nach alter Schule hieß das: eine Nacht durch – Gliederung, Assets suchen, Farben, Textfelder, die nie wirklich passen.
An dem Abend machte ich etwas anderes.
Ich öffnete NotebookLM, lud Produktunterlagen hoch und sagte: „Erstelle auf Basis dieser Materialien eine Investoren-Gliederung mit Fokus auf Technikarchitektur und Markt.“ Zehn Minuten später lag die Gliederung vor.
Dann Gemini 3 mit Nano Banana 2: „Erzeuge für den Technikteil ein Schichtendiagramm, blauer Tech-Stil, 4K.“ Das Bild war da.
Zum Schluss band ich alles per Google Slides API zu einer vollständigen Präsentation. Von der Aufgabe bis fertig: unter zwei Stunden.
In dem Moment wurde klar: Kreativ-Workflows verändern sich grundlegend. Nicht mehr „der Mensch macht alles“, sondern „der Mensch setzt die Richtung, die KI führt über Medien hinweg aus“.
Dieser Text beschreibt genau diesen neuen Weg – vom Skizzenentwurf zur Folie, von Text zu Bild, und wie Nano Banana 2 und Gemini 3 den kreativen Prozess neu ordnen.
Nano Banana 2: Googles neuer Maßstab für Bildgenerierung
Zuerst das frisch veröffentlichte Nano Banana 2.
Am 26. Februar 2026 stellte Google Nano Banana 2 vor – nach dem Original von Mitte 2025 und der Pro-Version im November die jüngste Stufe. Technisch ist es Gemini 3.1 Flash Image, mit spürbaren Leistungsgewinnen.
Wichtige Eigenschaften:
Schneller: gegenüber Pro deutlich höhere Geschwindigkeit bei gleichbleibender Qualität – entscheidend, wenn Sie viele Visuals in Serie brauchen.
Flexible Auflösung: von 512 px bis 4K, viele Seitenverhältnisse. Folien-Cover im 16:9-Format? Kein Problem. Quadratisches Social-Media-Bild? Ebenfalls.
Charakterkonsistenz: Rettung für Serieninhalte – Figuren und Stil bleiben über mehrere Bilder hinweg gleich, ideal für Produktstorys oder Markenvisuals.
SynthID eingebaut: Googles KI-Kennzeichnung als unsichtbares Wasserzeichen für Erkennung und Herkunft.
Kurz: Nano Banana 2 ist kein Spielzeug, sondern ein Werkzeug für die Produktion.
Vom Text zum Bild: natürlichsprachliche Bildgenerierung
Wie lief klassisches Design?
Briefing verstehen → Referenzen → Skizze → Umsetzung am Rechner → Korrekturen → Freigabe. Ein Bild konnte Stunden oder Tage kosten.
Nano Banana 2 schließt die Lücke zwischen den ersten Schritten und der finalen Umsetzung. Sie beschreiben das gewünschte Bild in natürlicher Sprache.
Beispiel: Für eine Architekturfolie brauchte ich ein „Datenfluss“-Motiv. Früher: langer Abstimmungsweg mit Design. Jetzt in Gemini 3:
„Erzeuge ein abstraktes Technikarchitektur-Bild: Daten fließen von Edge-Geräten ins Cloud-Verarbeitungszentrum. Dunkelblau und elektrisches Blau als Verlauf, technische Linien und Knoten, 4K, 16:9. Stil wie moderne SaaS-Landingpages.“
30 Sekunden später: nutzbares Material. Vielleicht nicht perfekt – als Entwurf oder Proof of Concept reicht es.
Prompt-Tipps
- Stil konkret: nicht „schön“, sondern „flache Illustration“ oder „3D-Render“
- Zweck nennen: „PPT-Hintergrund“, „als Icon“, „als Cover“
- Farben steuern: z. B. „Markenblau #1E90FF mit Weiß“
- Referenzen: „wie Apple-Keynote“, „Illustration wie Notion“
Vom Skizzenentwurf zum Ergebnis: doppelte Automatisierung von Visuelles und Logik
Text-zu-Bild ist nur der Anfang. Interessanter ist der skizzengetriebene Workflow.
Szene: Auf dem Notizblock Kästen, Linien, Labels „User Layer“, „API Layer“, „Data Layer“. Foto hochladen, an Gemini 3: „Aus dieser Architektur-Skizze ein professionelles Produktarchitektur-Diagramm, Enterprise-SaaS-Stil, passende Icons und Dekoration.“
Gemini 3 versteht die Logik der Skizze, Nano Banana 2 liefert das passende Bild. Die Idee der Skizze bleibt, die Darstellung wird professionell.
Diese Kombination aus Visuelles + Logik nutzt Gemini 3s Multimodalität: nicht nur „Bild sehen“, sondern Beziehungen im Bild verstehen und mit Textanweisung neu visualisieren.
Typische Einsätze:
- Schnelle Prototypen: Idee mit Stift, KI macht professionelles Visual
- Teamarbeit: PM skizziert, Design verfeinert mit KI – Effizienz verdoppelt
- Iteration: Version erzeugen → markieren → neu erzeugen – nach wenigen Runden nutzbar
Automatisierte Folien: NotebookLM + Google Slides
Bilder sind da – als Nächstes die vollständige Präsentation.
Zwei Bausteine: NotebookLM und die Google Slides API.
NotebookLM ordnet verstreute Quellen (Dokumente, PDFs, Web) zu einer klaren Erzählung. Produkt-Specs, Whitepaper, Marktstudien reinwerfen, dann: „Investoren-Struktur mit Kernpunkten pro Folie.“
NotebookLM:
- extrahiert das Wesentliche
- baut eine logische Folienstruktur
- liefert Titel und Stichpunkte pro Seite
Mit der Google Slides API legen Sie Folien per Skript an:
from googleapiclient.discovery import build
from google.oauth2 import service_account
# Authentifizierung
service = build('slides', 'v1', credentials=creds)
# Präsentation anlegen
presentation = service.presentations().create(
body={'title': 'Produkt-Technikarchitektur'}
).execute()
presentation_id = presentation.get('presentationId')
# Folien stapelweise hinzufügen
for slide_content in notebooklm_outline:
service.presentations().batchUpdate(
presentationId=presentation_id,
body={'requests': [{
'createSlide': {
'slideLayoutReference': {
'predefinedLayout': 'TITLE_AND_BODY'
}
}
}]}
).execute()
# Nano-Banana-2-Bilder einfügen ...
Der Gesamt-Workflow:
- NotebookLM → Gliederung und Text
- Nano Banana 2 → Bildmaterial
- Google Slides API → Layout und Ausgabe
Was früher Designer, Copy und Stunden kostete, schafft eine Person in Minuten als Erstversion.
Zukunftstrend: Paradigmenwechsel in kreativer Arbeit
Was bedeutet das konkret?
Drei Ebenen:
Ebene 1: Effizienz
Am direktesten: Arbeit, die Tage brauchte, liefert in Stunden oder Minuten eine erste Version. Nicht, dass Menschen schneller tippen – sie delegieren Ausführung an die KI und konzentrieren sich auf Urteil und Feinschliff.
Ebene 2: niedrigere Schwelle
Nicht jeder ist Designer, aber fast jeder braucht Folien. Nano Banana 2 plus Gemini 3 liefern für Laien „gut genug“ visuelle Qualität. Design ist nicht mehr ein geschlossener Club.
Ebene 3: Paradigmenwechsel
Am tiefgreifendsten. Klassisch linear: erst Text, dann Bilder, dann Layout – jede Stufe wartet auf die vorherige.
Neu: parallel und iterativ. Erst Visuals zur Richtungsfindung, dann Text anpassen; mehrere Stile parallel vergleichen; viele Varianten von der KI, finale Auswahl durch den Menschen.
Der Kern der Kreativarbeit verschiebt sich von „Ausführen“ zu „Kuratieren“ – nicht jedes Pixel selbst setzen, sondern Richtung, Auswahl und Details.
Das heißt nicht, dass Designer überflüssig werden. Im Gegenteil: Top-Leute gewinnen an Wert – Ästhetik, Konzept, Marke als „Meta-Fähigkeiten“, die die KI steuern. Wiederholbare Ausführung übernimmt das Werkzeug.
Schluss
Zurück zum Mittwochnachmittag.
Nach alter Methode wäre die Nacht durchgearbeitet worden. Mit dem neuen Workflow war die Aufgabe rechtzeitig fertig – inklusive Probe und Q&A-Vorbereitung.
Am nächsten Tag lief der Pitch. Bei technischen Fragen konnte ich schnell zur passenden Architekturfolie springen. Keine Stock-Fotos, sondern auf unser Produkt zugeschnittene, logisch klare Visuals.
Nano Banana 2 und Gemini 3 sind mehr als Tools – sie sind neue Partner in der Kreation. Sie ersetzen Ihre Ideen nicht, aber sie bringen sie schneller und leichter in die Welt.
Wenn Sie den Workflow noch nicht probiert haben: starten Sie klein. Nächste Team-Folien – Gliederung mit NotebookLM, ein paar Bilder mit Nano Banana 2 – und schauen Sie, was passiert.
Es wird selten beim ersten Mal perfekt sein. Sie werden aber merken: Wenn die KI die Ausführung trägt, bleibt Energie für das Entscheidende – die Geschichte, die Botschaft, das Publikum.
Und das ist das Wesen von Kreation.
FAQ
Was ist Nano Banana 2, und worin unterscheidet es sich von früheren Bildgenerierungsmodellen?
Wichtige Upgrades:
• **Schneller**: deutlich höhere Generierungsgeschwindigkeit als die Pro-Version, geeignet für Massenproduktion
• **Flexible Auflösung**: 512 px bis 4K, diverse Seitenverhältnisse
• **Charakterkonsistenz**: Serienbilder mit gleichen Figuren und Stil
• **SynthID-Wasserzeichen**: eingebaute KI-Kennzeichnung für Erkennung und Nachverfolgung
Im Vergleich zu frühen Modellen ist Nano Banana 2 vom „Spielzeug“ zum produktionsreifen Werkzeug gereift – besser für kommerzielle Szenarien.
Wie schreibt man gute Prompts für Nano Banana 2?
**Stil konkret beschreiben**:
• Nicht „schön“, sondern „flaches Illustrationsdesign“ oder „3D-Render-Look“
• Kunststil benennen: „Cyberpunk“, „Minimalismus“, „Jugendstil“
**Einsatz klar machen**:
• „Als PPT-Hintergrund, mit Freiraum für Text“
• „Als App-Icon, schlicht und erkennbar“
**Farbpalette steuern**:
• Hauptfarbe direkt: „Markenblau #1E90FF mit Weiß“
• Stimmung: „warme Erdtöne“, „kühler Blau-Violett-Verlauf“
**Referenzen**:
• „Visuell wie eine Apple-Keynote“
• „Illustrationsqualität wie auf der Notion-Website“
Je präziser die Beschreibung, desto näher am Ziel das Ergebnis.
Wie funktioniert ein skizzengetriebener KI-Generierungs-Workflow?
1. **Skizze von Hand**: Struktur auf Papier (Kästen, Pfeile, Labels)
2. **Foto hochladen**: Handyfoto der Skizze an Gemini 3 senden
3. **Anforderung beschreiben**: gewünschter Stil und Zweck
4. **KI-Generierung**: Gemini versteht die Logik der Skizze, Nano Banana 2 liefert professionelle Visuals
5. **Iterieren**: Änderungen markieren, neu generieren
Vorteile:
• Die „Idee“ der Skizze bleibt, die „Darstellung“ wird aufgewertet
• Product Manager validieren Ideen schnell
• Designer starten mit Feinschliff statt bei Null
• Nach wenigen Runden oft ein nutzbares Ergebnis
Wie verbinden NotebookLM und die Google Slides API automatisierte Folien?
**NotebookLM-Phase**:
• Produktunterlagen, Whitepaper usw. hochladen
• Anweisung: „Investoren-Deck-Gliederung mit Fokus auf Technikarchitektur und Markt“
• Ausgabe: strukturierte Seitenübersicht und Kernpunkte pro Folie
**Nano-Banana-2-Phase**:
• passende Visuals pro Folie
• Stil je Seitentyp (Cover, Diagramm, Illustration)
**Google-Slides-API-Phase**:
• neue Präsentation anlegen
• Folien stapelweise hinzufügen
• Text aus NotebookLM einfügen
• Bilder aus Nano Banana 2 einfügen
• Layout und Format automatisch anwenden
Ergebnis: strukturierte, inhaltlich gefüllte, visuell professionelle Erstversion – Feinschliff durch Menschen.
Was bedeutet KI-Automatisierung für Kreative?
**Effizienz**: deutlich schnellere Ausführung – Routine an die KI, Menschen für Urteil und Feintuning
**Schwelle**: auch Nicht-Designer liefern „gut genug“ visuelle Inhalte – Design ist nicht mehr exklusiv
**Paradigma**: vom linearen zum parallelen, iterativen Workflow
• mehrere visuelle Richtungen gleichzeitig
• schnelle Schleife Generieren – Filtern – Optimieren
• Kreativkern verschiebt sich von „Ausführen“ zu „Kuratieren“
**Für Designer**:
• weniger Basis-Ausführung
• Ästhetik, Konzept, Markenverständnis als „Meta-Fähigkeiten“ wichtiger
• Top-Designer werden „Regisseure“ der KI statt „Handwerker“
Kern: KI ersetzt Kreativität nicht – sie lässt sie schneller Realität werden.
6 Min. Lesezeit · Veröffentlicht am: 28. Feb. 2026 · Aktualisiert am: 20. Juni 2026
Google AI Mastery
Wenn du über die Suche hier gelandet bist, kommst du am schnellsten weiter, indem du zum vorherigen oder nächsten Beitrag dieser Serie springst.
Vorheriger
Datenschutz und Sicherheit im Google-KI-Ökosystem: NotebookLM Enterprise und Antigravity
Für CTOs und Security-Experten: Datenrichtlinien von NotebookLM Enterprise, die lokale-Cloud-Sicherheitsarchitektur von Antigravity und VPC Service Controls auf Enterprise-Niveau.
Teil 6 von 7
Nächster
Dies ist bisher der neueste Beitrag dieser Serie.
Ähnliche Beiträge
Schritt für Schritt: Low-Latency Audio-Video-KI-Assistent mit Gemini Multimodal Live API
Schritt für Schritt: Low-Latency Audio-Video-KI-Assistent mit Gemini Multimodal Live API
Vektordatenbank ade? Gemini 2M Token Langkontext & Context Caching – Performance- und Kostenvergleich
Vektordatenbank ade? Gemini 2M Token Langkontext & Context Caching – Performance- und Kostenvergleich
NotebookLM in der Praxis: Wie Sie 400 Forschungsquellen in ein interaktives „Digitales Gehirn“ verwandeln
Kommentare
Melde dich mit GitHub an, um einen Kommentar zu hinterlassen