Kreation über Medien hinweg: Mit Nano Banana 2 und Gemini 3 vom Skizzenentwurf zur vollautomatischen Präsentation

Am Mittwochnachmittag pingte der Chef in der Gruppe: „Morgen früh Investoren-Pitch, 20 Folien – Technikarchitektur und Marktperspektive unseres Produkts.“

Ich starrte auf die Nachricht und dachte nur: Das war’s.

20 hochwertige Folien brauchen Struktur, Inhalt, Bilder, Layout. Nach alter Schule hieß das: eine Nacht durch – Gliederung, Assets suchen, Farben, Textfelder, die nie wirklich passen.

An dem Abend machte ich etwas anderes.

Ich öffnete NotebookLM, lud Produktunterlagen hoch und sagte: „Erstelle auf Basis dieser Materialien eine Investoren-Gliederung mit Fokus auf Technikarchitektur und Markt.“ Zehn Minuten später lag die Gliederung vor.

Dann Gemini 3 mit Nano Banana 2: „Erzeuge für den Technikteil ein Schichtendiagramm, blauer Tech-Stil, 4K.“ Das Bild war da.

Zum Schluss band ich alles per Google Slides API zu einer vollständigen Präsentation. Von der Aufgabe bis fertig: unter zwei Stunden.

In dem Moment wurde klar: Kreativ-Workflows verändern sich grundlegend. Nicht mehr „der Mensch macht alles“, sondern „der Mensch setzt die Richtung, die KI führt über Medien hinweg aus“.

Dieser Text beschreibt genau diesen neuen Weg – vom Skizzenentwurf zur Folie, von Text zu Bild, und wie Nano Banana 2 und Gemini 3 den kreativen Prozess neu ordnen.

Nano Banana 2: Googles neuer Maßstab für Bildgenerierung

Zuerst das frisch veröffentlichte Nano Banana 2.

Am 26. Februar 2026 stellte Google Nano Banana 2 vor – nach dem Original von Mitte 2025 und der Pro-Version im November die jüngste Stufe. Technisch ist es Gemini 3.1 Flash Image, mit spürbaren Leistungsgewinnen.

Wichtige Eigenschaften:

Schneller: gegenüber Pro deutlich höhere Geschwindigkeit bei gleichbleibender Qualität – entscheidend, wenn Sie viele Visuals in Serie brauchen.

Flexible Auflösung: von 512 px bis 4K, viele Seitenverhältnisse. Folien-Cover im 16:9-Format? Kein Problem. Quadratisches Social-Media-Bild? Ebenfalls.

Charakterkonsistenz: Rettung für Serieninhalte – Figuren und Stil bleiben über mehrere Bilder hinweg gleich, ideal für Produktstorys oder Markenvisuals.

SynthID eingebaut: Googles KI-Kennzeichnung als unsichtbares Wasserzeichen für Erkennung und Herkunft.

Kurz: Nano Banana 2 ist kein Spielzeug, sondern ein Werkzeug für die Produktion.

Vom Text zum Bild: natürlichsprachliche Bildgenerierung

Wie lief klassisches Design?

Briefing verstehen → Referenzen → Skizze → Umsetzung am Rechner → Korrekturen → Freigabe. Ein Bild konnte Stunden oder Tage kosten.

Nano Banana 2 schließt die Lücke zwischen den ersten Schritten und der finalen Umsetzung. Sie beschreiben das gewünschte Bild in natürlicher Sprache.

Beispiel: Für eine Architekturfolie brauchte ich ein „Datenfluss“-Motiv. Früher: langer Abstimmungsweg mit Design. Jetzt in Gemini 3:

„Erzeuge ein abstraktes Technikarchitektur-Bild: Daten fließen von Edge-Geräten ins Cloud-Verarbeitungszentrum. Dunkelblau und elektrisches Blau als Verlauf, technische Linien und Knoten, 4K, 16:9. Stil wie moderne SaaS-Landingpages.“

30 Sekunden später: nutzbares Material. Vielleicht nicht perfekt – als Entwurf oder Proof of Concept reicht es.

Prompt-Tipps

Stil konkret: nicht „schön“, sondern „flache Illustration“ oder „3D-Render“
Zweck nennen: „PPT-Hintergrund“, „als Icon“, „als Cover“
Farben steuern: z. B. „Markenblau #1E90FF mit Weiß“
Referenzen: „wie Apple-Keynote“, „Illustration wie Notion“

Vom Skizzenentwurf zum Ergebnis: doppelte Automatisierung von Visuelles und Logik

Text-zu-Bild ist nur der Anfang. Interessanter ist der skizzengetriebene Workflow.

Szene: Auf dem Notizblock Kästen, Linien, Labels „User Layer“, „API Layer“, „Data Layer“. Foto hochladen, an Gemini 3: „Aus dieser Architektur-Skizze ein professionelles Produktarchitektur-Diagramm, Enterprise-SaaS-Stil, passende Icons und Dekoration.“

Gemini 3 versteht die Logik der Skizze, Nano Banana 2 liefert das passende Bild. Die Idee der Skizze bleibt, die Darstellung wird professionell.

Diese Kombination aus Visuelles + Logik nutzt Gemini 3s Multimodalität: nicht nur „Bild sehen“, sondern Beziehungen im Bild verstehen und mit Textanweisung neu visualisieren.

Typische Einsätze:

Schnelle Prototypen: Idee mit Stift, KI macht professionelles Visual
Teamarbeit: PM skizziert, Design verfeinert mit KI – Effizienz verdoppelt
Iteration: Version erzeugen → markieren → neu erzeugen – nach wenigen Runden nutzbar

Automatisierte Folien: NotebookLM + Google Slides

Bilder sind da – als Nächstes die vollständige Präsentation.

Zwei Bausteine: NotebookLM und die Google Slides API.

NotebookLM ordnet verstreute Quellen (Dokumente, PDFs, Web) zu einer klaren Erzählung. Produkt-Specs, Whitepaper, Marktstudien reinwerfen, dann: „Investoren-Struktur mit Kernpunkten pro Folie.“

NotebookLM:

extrahiert das Wesentliche
baut eine logische Folienstruktur
liefert Titel und Stichpunkte pro Seite

Mit der Google Slides API legen Sie Folien per Skript an:

from googleapiclient.discovery import build
from google.oauth2 import service_account

# Authentifizierung
service = build('slides', 'v1', credentials=creds)

# Präsentation anlegen
presentation = service.presentations().create(
    body={'title': 'Produkt-Technikarchitektur'}
).execute()
presentation_id = presentation.get('presentationId')

# Folien stapelweise hinzufügen
for slide_content in notebooklm_outline:
    service.presentations().batchUpdate(
        presentationId=presentation_id,
        body={'requests': [{
            'createSlide': {
                'slideLayoutReference': {
                    'predefinedLayout': 'TITLE_AND_BODY'
                }
            }
        }]}
    ).execute()
    # Nano-Banana-2-Bilder einfügen ...

Der Gesamt-Workflow:

NotebookLM → Gliederung und Text
Nano Banana 2 → Bildmaterial
Google Slides API → Layout und Ausgabe

Was früher Designer, Copy und Stunden kostete, schafft eine Person in Minuten als Erstversion.

Zukunftstrend: Paradigmenwechsel in kreativer Arbeit

Was bedeutet das konkret?

Drei Ebenen:

Ebene 1: Effizienz

Am direktesten: Arbeit, die Tage brauchte, liefert in Stunden oder Minuten eine erste Version. Nicht, dass Menschen schneller tippen – sie delegieren Ausführung an die KI und konzentrieren sich auf Urteil und Feinschliff.

Ebene 2: niedrigere Schwelle

Nicht jeder ist Designer, aber fast jeder braucht Folien. Nano Banana 2 plus Gemini 3 liefern für Laien „gut genug“ visuelle Qualität. Design ist nicht mehr ein geschlossener Club.

Ebene 3: Paradigmenwechsel

Am tiefgreifendsten. Klassisch linear: erst Text, dann Bilder, dann Layout – jede Stufe wartet auf die vorherige.

Neu: parallel und iterativ. Erst Visuals zur Richtungsfindung, dann Text anpassen; mehrere Stile parallel vergleichen; viele Varianten von der KI, finale Auswahl durch den Menschen.

Der Kern der Kreativarbeit verschiebt sich von „Ausführen“ zu „Kuratieren“ – nicht jedes Pixel selbst setzen, sondern Richtung, Auswahl und Details.

Das heißt nicht, dass Designer überflüssig werden. Im Gegenteil: Top-Leute gewinnen an Wert – Ästhetik, Konzept, Marke als „Meta-Fähigkeiten“, die die KI steuern. Wiederholbare Ausführung übernimmt das Werkzeug.

Schluss

Zurück zum Mittwochnachmittag.

Nach alter Methode wäre die Nacht durchgearbeitet worden. Mit dem neuen Workflow war die Aufgabe rechtzeitig fertig – inklusive Probe und Q&A-Vorbereitung.

Am nächsten Tag lief der Pitch. Bei technischen Fragen konnte ich schnell zur passenden Architekturfolie springen. Keine Stock-Fotos, sondern auf unser Produkt zugeschnittene, logisch klare Visuals.

Nano Banana 2 und Gemini 3 sind mehr als Tools – sie sind neue Partner in der Kreation. Sie ersetzen Ihre Ideen nicht, aber sie bringen sie schneller und leichter in die Welt.

Wenn Sie den Workflow noch nicht probiert haben: starten Sie klein. Nächste Team-Folien – Gliederung mit NotebookLM, ein paar Bilder mit Nano Banana 2 – und schauen Sie, was passiert.

Es wird selten beim ersten Mal perfekt sein. Sie werden aber merken: Wenn die KI die Ausführung trägt, bleibt Energie für das Entscheidende – die Geschichte, die Botschaft, das Publikum.

Und das ist das Wesen von Kreation.

FAQ

Was ist Nano Banana 2, und worin unterscheidet es sich von früheren Bildgenerierungsmodellen?

Nano Banana 2 ist Googles neuestes Bildgenerierungsmodell vom 26. Februar 2026 – technisch Gemini 3.1 Flash Image.

Wichtige Upgrades:
• **Schneller**: deutlich höhere Generierungsgeschwindigkeit als die Pro-Version, geeignet für Massenproduktion
• **Flexible Auflösung**: 512 px bis 4K, diverse Seitenverhältnisse
• **Charakterkonsistenz**: Serienbilder mit gleichen Figuren und Stil
• **SynthID-Wasserzeichen**: eingebaute KI-Kennzeichnung für Erkennung und Nachverfolgung

Im Vergleich zu frühen Modellen ist Nano Banana 2 vom „Spielzeug“ zum produktionsreifen Werkzeug gereift – besser für kommerzielle Szenarien.

Wie schreibt man gute Prompts für Nano Banana 2?

Einige Kernpunkte für starke Prompts:

**Stil konkret beschreiben**:
• Nicht „schön“, sondern „flaches Illustrationsdesign“ oder „3D-Render-Look“
• Kunststil benennen: „Cyberpunk“, „Minimalismus“, „Jugendstil“

**Einsatz klar machen**:
• „Als PPT-Hintergrund, mit Freiraum für Text“
• „Als App-Icon, schlicht und erkennbar“

**Farbpalette steuern**:
• Hauptfarbe direkt: „Markenblau #1E90FF mit Weiß“
• Stimmung: „warme Erdtöne“, „kühler Blau-Violett-Verlauf“

**Referenzen**:
• „Visuell wie eine Apple-Keynote“
• „Illustrationsqualität wie auf der Notion-Website“

Je präziser die Beschreibung, desto näher am Ziel das Ergebnis.

Wie funktioniert ein skizzengetriebener KI-Generierungs-Workflow?

Kernschritte des skizzengetriebenen Workflows:

1. **Skizze von Hand**: Struktur auf Papier (Kästen, Pfeile, Labels)
2. **Foto hochladen**: Handyfoto der Skizze an Gemini 3 senden
3. **Anforderung beschreiben**: gewünschter Stil und Zweck
4. **KI-Generierung**: Gemini versteht die Logik der Skizze, Nano Banana 2 liefert professionelle Visuals
5. **Iterieren**: Änderungen markieren, neu generieren

Vorteile:
• Die „Idee“ der Skizze bleibt, die „Darstellung“ wird aufgewertet
• Product Manager validieren Ideen schnell
• Designer starten mit Feinschliff statt bei Null
• Nach wenigen Runden oft ein nutzbares Ergebnis

Wie verbinden NotebookLM und die Google Slides API automatisierte Folien?

Vollständiger Automatisierungs-Workflow:

**NotebookLM-Phase**:
• Produktunterlagen, Whitepaper usw. hochladen
• Anweisung: „Investoren-Deck-Gliederung mit Fokus auf Technikarchitektur und Markt“
• Ausgabe: strukturierte Seitenübersicht und Kernpunkte pro Folie

**Nano-Banana-2-Phase**:
• passende Visuals pro Folie
• Stil je Seitentyp (Cover, Diagramm, Illustration)

**Google-Slides-API-Phase**:
• neue Präsentation anlegen
• Folien stapelweise hinzufügen
• Text aus NotebookLM einfügen
• Bilder aus Nano Banana 2 einfügen
• Layout und Format automatisch anwenden

Ergebnis: strukturierte, inhaltlich gefüllte, visuell professionelle Erstversion – Feinschliff durch Menschen.

Was bedeutet KI-Automatisierung für Kreative?

Drei Ebenen der Veränderung:

**Effizienz**: deutlich schnellere Ausführung – Routine an die KI, Menschen für Urteil und Feintuning

**Schwelle**: auch Nicht-Designer liefern „gut genug“ visuelle Inhalte – Design ist nicht mehr exklusiv

**Paradigma**: vom linearen zum parallelen, iterativen Workflow
• mehrere visuelle Richtungen gleichzeitig
• schnelle Schleife Generieren – Filtern – Optimieren
• Kreativkern verschiebt sich von „Ausführen“ zu „Kuratieren“

**Für Designer**:
• weniger Basis-Ausführung
• Ästhetik, Konzept, Markenverständnis als „Meta-Fähigkeiten“ wichtiger
• Top-Designer werden „Regisseure“ der KI statt „Handwerker“

Kern: KI ersetzt Kreativität nicht – sie lässt sie schneller Realität werden.

6 Min. Lesezeit · Veröffentlicht am: 28. Feb. 2026 · Aktualisiert am: 20. Juni 2026

Easton

AI & Intelligenz

Lesepfad der Serie Teil 7 von 7

Google AI Mastery

Wenn du über die Suche hier gelandet bist, kommst du am schnellsten weiter, indem du zum vorherigen oder nächsten Beitrag dieser Serie springst.

Serienübersicht öffnen

Datenschutz und Sicherheit im Google-KI-Ökosystem: NotebookLM Enterprise und Antigravity

Für CTOs und Security-Experten: Datenrichtlinien von NotebookLM Enterprise, die lokale-Cloud-Sicherheitsarchitektur von Antigravity und VPC Service Controls auf Enterprise-Niveau.

Teil 6 von 7

Dies ist bisher der neueste Beitrag dieser Serie.

27. Feb. 2026 AI & Intelligenz

Schritt für Schritt: Low-Latency Audio-Video-KI-Assistent mit Gemini Multimodal Live API

Architekturdiagramm der Echtzeit-Sprachinteraktion mit Gemini Live API

27. Feb. 2026 AI & Intelligenz

Schritt für Schritt: Low-Latency Audio-Video-KI-Assistent mit Gemini Multimodal Live API

27. Feb. 2026 AI & Intelligenz

Vektordatenbank ade? Gemini 2M Token Langkontext & Context Caching – Performance- und Kostenvergleich

Architekturdiagramm zu Gemini Langkontext und Context Caching

27. Feb. 2026 AI & Intelligenz

Vektordatenbank ade? Gemini 2M Token Langkontext & Context Caching – Performance- und Kostenvergleich

27. Feb. 2026 AI & Intelligenz

NotebookLM in der Praxis: Wie Sie 400 Forschungsquellen in ein interaktives „Digitales Gehirn“ verwandeln

Arbeitsplatzszenario für akademische Forschung mit NotebookLM

27. Feb. 2026 AI & Intelligenz

NotebookLM in der Praxis: Wie Sie 400 Forschungsquellen in ein interaktives „Digitales Gehirn“ verwandeln

Kommentare

Melde dich mit GitHub an, um einen Kommentar zu hinterlassen

Nano Banana 2: Googles neuer Maßstab für Bildgenerierung

Vom Text zum Bild: natürlichsprachliche Bildgenerierung

Prompt-Tipps

Vom Skizzenentwurf zum Ergebnis: doppelte Automatisierung von Visuelles und Logik

Automatisierte Folien: NotebookLM + Google Slides

Zukunftstrend: Paradigmenwechsel in kreativer Arbeit

Ebene 1: Effizienz

Ebene 2: niedrigere Schwelle

Ebene 3: Paradigmenwechsel

Schluss

FAQ

Google AI Mastery

Datenschutz und Sicherheit im Google-KI-Ökosystem: NotebookLM Enterprise und Antigravity

Ähnliche Beiträge

Schritt für Schritt: Low-Latency Audio-Video-KI-Assistent mit Gemini Multimodal Live API

Schritt für Schritt: Low-Latency Audio-Video-KI-Assistent mit Gemini Multimodal Live API

Vektordatenbank ade? Gemini 2M Token Langkontext & Context Caching – Performance- und Kostenvergleich

Vektordatenbank ade? Gemini 2M Token Langkontext & Context Caching – Performance- und Kostenvergleich

NotebookLM in der Praxis: Wie Sie 400 Forschungsquellen in ein interaktives „Digitales Gehirn“ verwandeln

NotebookLM in der Praxis: Wie Sie 400 Forschungsquellen in ein interaktives „Digitales Gehirn“ verwandeln

Kommentare