Zwischen Slop und kreativem Schaffen: Was KI-Bildgenerierung wirklich kann

Während KI-generierte Kartendarstellungen für viel Spott sorgen, sind authentische Deepfakes kaum noch erkennbar. Wie so häufig ist es entscheidend, das richtige Modell für den richtigen Anwendungsfall zu nutzen. Doch welche Arten von Bildmodellen gibt es überhaupt? Und wo liegen die Grenzen?

In diesem Vortrag sprechen wir über die verschiedenen Modi der Bildgenerierung: Text-to-Image, die Nutzung von Referenzen, Textdarstellungen, Detailtreue sowie die Kontrolle von Blickwinkeln.

Wir berichten von unseren praktischen Erfahrungen mit verschiedenen Modellen und berichten von unserem Anwendungsfall zur Erzeugung von visuellen Storyboards für die Videoproduktion.

Lernziele

  • Technologie-Grundlagen: Grundlegende Funktionsweise und technische Grenzen von Bildgenerierungsmodellen verstehen
  • Marktüberblick: Die wichtigsten Akteure und Modelle in der aktuellen KI-Bildgenerierungslandschaft (Google, Flux, etc.) kennen.
  • Die technischen Grenzen der Modelle verstehen
  • Praxisbeispiel: Erkenntnisse aus dem Produktiveinsatz der Modelle gewinnen.
  • Einen Überblick über soziale Implikationen gewinnen

Speaker

 

Mats Faulborn
Mats Faulborn ist von Haus aus Data Scientist und sammelte bei den scieneers umfangreiche Erfahrungen in Software Engineering und GenAI. In einem Kundenprojekt bei Bertelsmann treibt er derzeit die Entwicklung eines Systems zur automatisierten Werbekampagnengenerierung voran, bei dem modernste Bild- und Videogenerierung eingesetzt wird.