KI lässt Pinguine gemeinsam mit Menschen Curling spielen

Seit ich mich mit KI-Bildgenerierung beschäftige, nutze ich in unregelmäßigen Abständen einen Prompt als Benchmark. Ich bitte die KI, mir Bilder von Pinguinen zu erstellen, die Curling spielen. Den Prompt habe ich irgendwann erweitert, sodass Menschen den Pinguinen beim Spielen zuschauen oder sie unterstützen. Meinen letzten Test von 4.10.2025 möchte ich hier zeigen und besprechen. Ich werde den Test in den nächsten Monaten sicher wiederholen.

Grok, Krea und Ideogram – Modelle, die ich kostenfrei nutze

„Pinguine beim Curling mit Menschen als Zuschauer“

Prompt: In the image, a group of penguins is seen playing curling on an ice rink, with people in winter clothing watching them. The penguins are holding curling sticks and pushing a stone towards a target.
    
Bild 1 erstellt von Grok

Grok (Aurora)

Die Stöcke sind gut umgesetzt. Insgesamt schwankt es irgendwo zwischen Cartoon und Realismus.

Bild 2 erstellt von Krea

Krea (Flux)

Krea hat den Curling-Stein auch als solchen dargestellt. Ansonsten ist das Bild so realistisch, wie es bei diesem surrealen Prompt-Motiv eben sein kann.

Bild 3 erstellt Ideogram

Ideogram (Ideogram 3.0)

Ideogram ist der Champion im Bereich Text im Bild.

„Pinguine beim Curling mit Menschen als Mitspieler“

Prompt: A highly detailed and humorous winter sports scene in Antarctica, showing two penguins realistically participating in a curling match with human players on an icy curling rink. The penguins are using their flippers to hold curling brooms in a believable way, sweeping curling stones toward the target. The humans are warmly dressed in winter sports clothing, smiling and engaging with the penguins as teammates. Surrounded by towering blue glaciers under an overcast sky, with natural lighting, realistic textures on the ice, cinematic depth of field, sharp facial features, accurate anatomy, realistic hands, playful and surreal atmosphere.
    
Bild 4 erstellt von Grok

Grok (Aurora)

Realistischer als das andere Bild. Die Adidas-Jacke lässt mich schmunzeln.

Bild 5 erstellt von Krea

Krea (Flux)

Auch hier ist das Bild etwas realistischer. Es ist, als hätte Krea mitgedacht: Die zwei Frauen halten die Stöcke – weil Pinguine das gar nicht könnten.

Bild 6 erstellt von Ideogram

Ideogram (Ideogram 3.0)

Ideogram zeigt wieder, wie gut es Text im Bild beherrscht.

Nachdem ich zuletzt im Januar 2025 verschiedene Modelle getestet hatte, war der Sprung innerhalb von neun Monaten kein beeindruckender. Die Qualität der Modelle, die ich zu Jahresanfang kostenfrei genutzt hatte, ist ungefähr gleich geblieben. Wahrscheinlich müsste ich nun (etwa beim Flux-Modell oder bei Aurora von X) demnächst auf die bezahlten Versionen upgraden. Das heißt allerdings nicht, dass die Ergebnisse als solche schlecht wären. Insbesondere Ideogram beeindruckt auch in seiner Kostenlos-Version mit starker Performance bei Text im Bild.

Adobe Firefly, Sora und Gemini: Das können die Bezahl-Modelle

„Firefly, Sora und Gemini: Pinguine beim Curling mit Menschen als Zuschauer“

Prompt: In the image, a group of penguins is seen playing curling on an ice rink, with people in winter clothing watching them. The penguins are holding curling sticks and pushing a stone towards a target.
    
Bild 1 erstellt von Firefly

Adobe (Firefly)

Adobe-Firefly macht es realistisch. Die Pinguine halten keine Stöcke, weil sie das ohnehin nicht könnten. Im Vergleich zu dem, was ich bisher von Firefly gewohnt war, bin ich sehr positiv überrascht.

Bild 2 erstellt von Gemini

Gemini (Imagen)

Gemini zeigt eine liebenswerte Mischung aus Realismus und Verspieltheit.

Bild 3 erstellt von Sora

Sora (DALL·E 3)

Sora liefert das technisch gesehen beste Ergebnis.

„Firefly, Sora und Gemini: Pinguine beim Curling mit Menschen als Mitspieler“

Prompt: A highly detailed and humorous winter sports scene in Antarctica, showing two penguins realistically participating in a curling match with human players on an icy curling rink. The penguins are using their flippers to hold curling brooms in a believable way, sweeping curling stones toward the target. The humans are warmly dressed in winter sports clothing, smiling and engaging with the penguins as teammates. Surrounded by towering blue glaciers under an overcast sky, with natural lighting, realistic textures on the ice, cinematic depth of field, sharp facial features, accurate anatomy, realistic hands, playful and surreal atmosphere.
    
Bild 4 erstellt von Firefly

Adobe (Firefly)

Der detailliertere Prompt war wohl etwas zu viel für Firefly. Dieses Bild fällt ein wenig ab im Vergleich zum Vorherigen.

Bild 5 erstellt von Gemini

Gemini (Imagen)

Das ist mein Favorit. Das Teamwork zwischen Menschen und Pinguinen ist sichtbar.

Bild 6 erstellt von Sora

Sora (DALL·E 3)

Sora macht es einfach und unspektakulär. Mal sehen, wie es sich in ein Video verwandeln lässt.

Von den drei Modellen, für die ich momentan bezahle, sind zwei im Vergleich zum Januar neu für mich: Sora von OpenAI und Gemini mit Imagen. Ich hatte beide im Laufe des Frühjahrs erworben und bereits mit anderen Prompts getestet. Nachdem zeitweise Gemini Ergebnisse gebracht hatte, die mir viel besser gefielen, geriet die Bilderstellung in Sora und ChatGPT für mich ein wenig in Vergessenheit. Nach den Erfahrungen der letzten Wochen liegen die beiden wieder gleichauf, mit Vorteilen des einen oder anderen Modells in verschiedenen Bereichen. Die positive Überraschung war für mich Firefly von Adobe. Ich musste nicht mal NanoBanana in Firefly verwenden, um sehr gute Resultate zu erhalten. Mit dem ersten, simpleren Prompt gefiel mit das Firefly-Ergebnis sogar am besten.


Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert