Zum Inhalt springen
CASOON

Lyria 3 und Pomelli Photoshoot: Google macht Kreativ-Assets zur Commodity

Wie Musik aus Textprompts und Studio-Produktfotos vom Smartphone den Qualitätsstandard heben und die Einstiegshürde senken

9 Minuten
Lyria 3 und Pomelli Photoshoot: Google macht Kreativ-Assets zur Commodity
#Google #Gemini #Lyria 3 #Pomelli Photoshoot

Google hat im Februar 2026 zwei Features nachgelegt, die auf den ersten Blick in unterschiedliche Richtungen zielen: ein generatives Musikmodell und ein Tool für Produktfotos. Auf den zweiten Blick erzählen beide dieselbe Geschichte: Der Qualitätsstandard steigt, die Einstiegshürde fällt. Und das hat Konsequenzen für jeden, der mit Content, E-Commerce oder Marketing zu tun hat.


Lyria 3: Musik aus Text und Bildern

Lyria 3 ist Googles generatives Musikmodell, direkt in Gemini integriert. Es erzeugt 30-Sekunden-Tracks inklusive Gesang, Instrumenten und automatisch generierten Lyrics.

Die Bedienung ist denkbar einfach: Entweder gibst du einen Textprompt ein („fröhlicher Pop-Song über Montagmorgen”) oder lädst ein Foto oder Video hoch, aus dem Stimmung, Style und Genre abgeleitet werden. Zusätzlich wird automatisch Cover-Art generiert, basierend auf Googles Bildmodell.

Wo es steht

Die Qualität liegt aktuell unter spezialisierten Tools wie Suno. Aber das ist nicht der Punkt. Lyria 3 ist gut genug für:

  • Intros und Jingles
  • Social-Media-Clips und Reels
  • Präsentations-Soundbeds
  • Podcast-Intros und Newsletter-Audio

Google framed es bewusst als kreatives Tool, nicht als Studio-Ersatz. Und genau das macht es relevant: Die Zielgruppe sind nicht Musikproduzenten, sondern alle anderen.

Konkrete Use Cases

Schnelle, lizenzklare Musik für Shorts und Reels. Eine direkte Anbindung an YouTube-Workflows ist in Planung. Das allein macht Lyria 3 für Creator interessant, die bisher auf Stockmusik-Bibliotheken angewiesen waren.

Personalisierte Audio-Snippets. Geburtstags-Songs, kurze Audio-Intros für Newsletter, Produktvideos. Alles, was bisher entweder generisch aus einer Library kam oder einen Auftrag an einen Musikproduzenten erforderte.

Sound-Branding light. Marken können in Sekunden verschiedene Varianten eines Audio-Signets testen, bevor sie in eine professionelle Produktion investieren. Nicht als Ersatz, sondern als Prototyping-Werkzeug.

Lyria 3 ist in vielen Ländern verfügbar, auch in Deutschland, zunächst primär in den kostenpflichtigen Gemini-Abostufen.

Pomelli Photoshoot: Vom Smartphone-Foto zum Studio-Look

Pomelli Photoshoot löst ein Problem, das jeder kleine Online-Shop kennt: Professionelle Produktfotos kosten zwischen 500 und 5.000 Euro pro Produkt. Die Alternative waren bisher Smartphone-Fotos vor weißem Hintergrund, die neben den polierten Bildern großer Marken amateurhaft wirken.

Das Feature verwandelt einfache Smartphone-Aufnahmen in Studio-artige Visuals. Aus einem Rohfoto lassen sich mehrere vordefinierte Styles generieren:

StyleErgebnis
StudioCleaner Hintergrund, professionelles Licht
FloatingFreigestelltes schwebendes Produkt
IngredientUmgebung mit Zutaten oder Bestandteilen
In UseKI-Model nutzt oder trägt das Produkt
LifestyleRealistische Szene mit Kontext

Unter der Haube nutzt Pomelli ein Bildmodell namens „Nano Banana” und passt Hintergrund, Licht, Perspektive und Farben an, ohne das Produkt selbst zu stark zu verändern.

Was es besonders macht

Der spannendste Aspekt ist das „Business-DNA-Profil”: Die generierten Bilder können automatisch an Markenfarben, Fonts und visuellen Stil angepasst werden. Das bedeutet konsistenter Markenlook über hunderte Produkte hinweg, obwohl die Ausgangsfotos aus völlig unterschiedlichen Situationen stammen.

Konkrete Use Cases

Varianten aus einem Packshot. Aus einem einzigen Foto dutzende Versionen erzeugen: Seasonal, Black Friday, Sommer-Edition. Ohne neues Shooting, ohne Photoshop.

A/B-Tests von Creatives. Studio vs. Lifestyle vs. Ingredient in Ads testen, ohne für jede Variante ein neues Set aufzubauen. Die Iteration wird von Wochen auf Minuten komprimiert.

Konsistenz über das Sortiment. Ein Shop mit 500 Produkten kann erstmals einen einheitlichen visuellen Standard erreichen, ohne ein sechsstelliges Foto-Budget.

Die These: Qualitätsstandard hoch, Einstiegshürde runter

Beide Produkte folgen demselben Muster, und es lohnt sich, das Muster ernst zu nehmen.

Was sich nach oben verschiebt

Selbst Einsteiger können nun Musik- und Bild-Assets erzeugen, die näher an den Agentur- und Studio-Look herankommen. Das verschiebt die Erwartungshaltung: Wenn jeder halbwegs professionelle Produktfotos und passende Musik hat, wird das zum neuen Minimum, nicht zum Differenzierungsmerkmal.

Was nach unten fällt

  • Kein Tonstudio und keine Producing-Skills mehr nötig für brauchbare 30-Sekunden-Tracks
  • Kein teures Produkt-Shooting und kein Lightroom-Know-how mehr nötig für saubere Produktbilder
  • Kein separates Budget für Stock-Musik oder Stock-Fotos

Was das für Profis bedeutet

Agenturen und Kreativprofis müssen stärker über Konzept, Marke, Kampagnen-Architektur und komplexe Produktionen differenzieren. Das reine Asset-Produzieren wird zunehmend commoditisiert. Das ist keine Bedrohung für gute Kreativarbeit, aber es ist das Ende von „wir machen hübsche Bilder” als Geschäftsmodell.

Workflows: Wie sich das praktisch einbauen lässt

Da beide Features im Gemini-Ökosystem leben, ergeben sich natürliche Workflow-Kombinationen:

1
Produktbeschreibung (Text)
2
Pomelli Bildvarianten generieren
3
Lyria 3 Musik/Jingle aus Bild + Text
4
Gemini Ad-Texte und Copy
5
Komplettes Creative-Set für Test-Kampagne

Drei konkrete Pfade

Schnelle Mockups. Produktidee plus einfaches Foto durch Pomelli schicken, Landingpage bauen, testen. Bevor du real shootest, weißt du bereits, welche Bildsprache konvertiert.

Social-Loops. Bild oder Clip als Input, Lyria 3 generiert Musik plus Cover, direkt als Short oder Reel exportieren. Der komplette Asset-Workflow in einem Tool-Stack.

Multimodal-Pipeline. Text (Produktbeschreibung) erzeugt Bildvarianten, daraus entsteht Musik, dazu Ads-Texte. Ein Flow, der vor einem Jahr vier verschiedene Tools und drei Freelancer gebraucht hätte.

Einordnung

Weder Lyria 3 noch Pomelli Photoshoot sind Best-in-Class in ihrer jeweiligen Kategorie. Suno macht bessere Musik, und ein erfahrener Fotograf mit Lightroom liefert bessere Produktfotos. Das ist nicht der Punkt.

Der Punkt ist die Integration und die Zugänglichkeit. Beides lebt in Gemini, beides braucht keine Vorkenntnisse, beides liefert Ergebnisse, die vor zwei Jahren noch ein Budget erfordert hätten. Für kleine Shops, Solo-Creator und Startups verschiebt sich damit die Frage von „Können wir uns professionelle Assets leisten?” zu „Welche Assets brauchen wir zuerst?”.

Für etablierte Marken und Agenturen ist es ein Weckruf: Das Baseline-Niveau steigt. Wer sich nur über Ausführungsqualität differenziert, bekommt ein Problem. Wer über Strategie, Marke und kreative Ideen differenziert, bekommt ein besseres Werkzeug.