"Graf Babo verabschiedet seinen ältesten Sohn Wenzel von Freudenberg"
&
Dall-E 3
Kurzvorstellung: Graf Babo (2024)
Das erste Projekt im Studio Aunkofen setzt sich mit dem im Stadtmuseum Abensberg ausgestellten historischen Gemälde "Graf Babo verabschiedet seinen ältesten Sohn Wenzel von Freudenberg" und den neuesten bildgebenden Technologien in der Künstlichen Intelligenz (im Folgenden: KI) auseinander.
Unter Einsatz ausgewählter Anwendungen zur Bildgenerierung mittels Texteingabe (Dall-E 3 von OpenAI) und zur weiteren Bildbearbeitung und Komposition (Canva Visual Suite, Adobe Photoshop 2025) entsteht eine moderne und digitale Neuinterpretation des historischen Werks in der Form einer Collage.
Die Inhalte des Projekts werden nachfolgend dokumentiert, um Interessierten einen Einblick in das Werk und Erfahrungen im Umgang mit der generativen Künstlichen Intelligenz Ende 2024 zu geben. Hierzu zählt neben einem Einblick in die Prompts ebenso eine Beschreibung von Herausforderungen, die im Rahmen der Durchführung des Projekts aufgetreten sind, sowie deren konkrete Bewältigung.
Projektdokumentation
Ideenfindung
Für das Eröffnungsprojekt von Studio Aunkofen war es mir ein großes Anliegen, einen Bezug zu Abensberg herzustellen. Nach einer Vielzahl an Ideen bin ich bei der Recherche und Auseinandersetzung mit der Geschichte von Abensberg auf das großformatige Tafelgemälde "Graf Babo verabschiedet seinen ältesten Sohn Wenzel von Freudenberg" im Stadtmuseum Abensberg gestoßen. Inspiriert von den Möglichkeiten der Künstlichen Intelligenz im Bereich der Bildgebung ist die konkrete Idee und persönliche Herausforderung entstanden, eine digitale & moderne Neuinterpretation des historischen Gemäldes unter Einsatz der neuesten bildgebenden Technologien in der Künstlichen Intelligenz zu erschaffen.
Über das Tafelgemälde
Das Tafelgemälde "Graf Babo verabschiedet seinen ältesten Sohn Wenzel von Freudenberg" entstand um 1500 und wurde von einem nicht bekannten Künstler gemalt. Es zeigt die Verabschiedung des sagenumwobenen Grafen Babo von Abensberg und seiner Frau von ihrem ältesten Sohn Wenzel von Freudenberg. Daneben sind auf dem Gemälde die weiteren 31 Söhne des Grafen abgebildet, die von mehreren Frauen stammen sollen. Im Hintergrund ist eine hügelige Landschaft mit einer Burg und im Vordergrund unten links das Wappen der Herren von Freudenberg zu sehen.
Vor dem Erwerb durch die Stadt Abensberg im Jahr 1877 befand es sich in der Pfarrkirche Neukirchen bei Sulzbach-Rosenberg, die eine Patronatskirche der Herren von Freudenberg war. Es wird angenommen, dass das Tafelgemälde von einem Herrn von Freudenberg in Auftrag gegeben wurde, der seine Abstammung von Graf Babo zeigen wollte.
Graf Babo von Abensberg (auch: Babo II.) gilt als Stammvater der Grafen von Abensberg und soll den Überlieferungen nach Vater von insgesamt 32 Söhnen und 8 Töchtern gewesen sein. In Bezug auf die aktuellen historischen Erkenntnisse zu Graf Babo wird auf das Kapitel "Die vielen Söhne des Grafen Babo" in dem Aufsatz "Der Krieg der bayerischen Guelfen und Chibellinen von 1250 und das vexillum von Neukirchen an der Enknach" von Dr. Werner Robl aus dem Jahr 2018 verwiesen.
Aufgabenstellung
Erstellung einer digitalen & modernen Neuinterpretation des Tafelgemäldes "Graf Babo verabschiedet seinen ältesten Sohn Wenzel von Freudenberg" unter Verwendung der Anwendung Dall-E 3 von OpenAI. Für die weitere Bildbearbeitung und Komposition können Programme wie Canva Visual Suite und Adobe Photoshop (inkl. der darin enthaltenen generativen KI Adobe Firefly) verwendet werden.
Im Mittelpunkt des Projekts stehen die bildgebenden Anwendungen der Künstlichen Intelligenz in Verbindung mit der künstlerischen Freiheit bei der Umsetzung der Aufgabenstellung. Ein zentrales Element des Projekts soll in dem Aspekt der Zufälligkeit bei der Bildgenerierung liegen: interessantere Darstellungen sollen einen Vorrang erhalten. Hingegen ausdrücklich nicht relevant ist die historische Präzision in der Darstellung der Figuren einschließlich der im Original vorhandenen Farben, Formen und Muster.
Vorgehensweise / Problemlösung
Vorbereitend erfolgte ein Besuch des Stadtmuseums Abensberg und ein kompaktes Einlernen in den Umgang mit den Anwendungen Dall-E 3, Canva Visual Suite und Adobe Photoshop 2025.
Im Rahmen des Herantastens an die Bildgenerierung durch Verwendung erster Prompts in Dall-E 3 wurde festgestellt, dass es im Zeitpunkt des Projektbeginns im November 2024 noch nicht möglich ist, durch bildgebende Technologien der Künstlichen Intelligenz ein Gemälde der Komplexität des betrachteten Tafelgemäldes durch eine einzelne Bildaufforderung in Dall-E 3 zu generieren.
Mit dieser Erkenntnis und angesichts der Vielzahl an dargestellten Personen (insgesamt 34 Personen) mit jeweils unterschiedlichen Merkmalen, Bekleidung, Farben und weiterer Gemälde-Details (z.B. eine Hügellandschaft im Hintergrund mit Bäumen und Gebäuden etc.) wurde es als zielführend erachtet, anstelle eines gesamthaften Bildes eine große Anzahl an Einzelbildern vor einem weißen Hintergrund durch Dall-E 3 zu generieren, beispielsweise das Motiv "Babo" oder "Babo's Frau & ihr Sohn Wenzel von Freudenberg", um anschließend die ausgewählten Bilder in Canva Visual Suite zu einer Collage zusammenzuführen.
Die Einzelbilder wurden in Dall-E 3 anhand konkreter Texteingaben zur Bilderstellung generiert (auch "Prompt" oder "Bildaufforderung" genannt). In Bezug auf die Erstellung geeigneter Prompts haben sich im Rahmen der Durchführung die nachfolgend beschriebenen Herausforderungen ergeben:
-
Generierung von Bildern, welche die darzustellenden Figuren vollständig abbilden (und nicht lediglich einen Teil wie beispielsweise den Oberkörper oder das Gesicht zeigen);
-
Ausrichtung der Figuren auf dem Bild, beispielsweise durch die Angabe "Kopf nach links geneigt", da Dall-E 3 diese Aufforderungen im Regelfall nicht korrekt oder unvollständig umsetzt;
-
Anwendung eines konsistenten Kunststils, um einen visuellen Effekt zu erzielen, der sowohl modern als auch dem historischen Kontext angemessen ist (vorliegend verwendet: 3D Illustration, Impressionismus);
-
Verwendung der englischen Sprache für die Formulierung von Prompts, da somit bessere Ergebnisse in Dall-E 3 erzielt werden können.
-
Umsetzung weiterer Details im Rahmen der Formulierung von Prompts (z.B. Kopfbedeckung, Muster auf den Gewändern, etc.).
Es ist wichtig zu verstehen, dass Dall-E 3 in das Sprachmodell ChatGPT integriert ist und dadurch die ursprünglichen Texteingaben des Anwenders zur Bildgenerierung von ChatGPT für Dall-E 3 übersetzt und verändert werden, um aus Sicht der Künstlichen Intelligenz die bestmöglichen Ergebnisse bei der Generierung von Bildern zu erzielen. Dieser Aufbau geht zu Lasten einer wortwörtlichen Umsetzung und erschwert die konsistente Bildgenerierung, da beispielsweise Angaben zum Kunststil oder zu Einzelheiten fehlen können oder abgeändert werden. Mit der Integration von Dall-E 3 in ChatGPT sind auch weitere wesentliche Funktionen wie beispielsweise die Veränderung oder Erweiterung bestehender Bilder durch das sogenannte Inpainting und Outpainting wesentlich eingeschränkt worden.
Um die Herausforderungen zu bewältigen und einen möglichst einheitlichen Kunst- und Malstil zu gewährleisten, wurde für die Generierung der Einzelbilder in ChatGPT ein eigener "Generative Pre-Trained Trainer" (Bot) zur weitgehenden Standardisierung der verwendeten Figuren und des Kunststils entwickelt. Hierbei wurden die Figuren nach äußerlichen Kategorien wie beispielsweise "Bart / kein Bart", "grüne Robe / rote Robe", "lockiges Haar / glattes Haar" etc. gruppiert, um die Komplexität merklich zu reduzieren und die Erstellung der Einzelbilder zu strukturieren.
Anschließend erfolgte zunächst eine Komposition der ausgewählten Einzelbilder in Canva Visual Suite, wobei zuvor jeweils der Hintergrund auf dem Einzelbild unter Verwendung der Funktion "Background Remover" entfernt wurde.
Die Erstellung des Hintergrunds erfolgte durch ein Zusammenfügen von insgesamt zwei mit Hilfe von Dall-E 3 generierten Einzelbildern, teilweise gespiegelt und dadurch mehrfach verwendet, wobei das zweite Bild auf dem ersten basiert und lediglich durch Inpainting in Dall-E 3 leicht abgewandelt wurde. Dieser Weg wurde gewählt, da ein Hintergrund in dem gewünschten Format und der für das Werk erforderlichen Auflösung nicht zufriedenstellend erzeugt werden konnte. Diese Herangehensweise und Problemlösung ist bei einer genauen Betrachtung des Werks erkennbar geblieben und wurde bei der weiteren Bildbearbeitung nicht kaschiert, um die Lösung aufzuzeigen.
Da die Bildbearbeitungsmöglichkeiten in Canva Visual Suite begrenzt sind, wurde für die Feinarbeit Adobe Photoshop 2025 verwendet. Die darin enthaltenen bildgebenden generativen Funktionen (Adobe Firefly) wurden vereinzelt für die Darstellung bzw. Verbesserung von Augen und Händen verwendet.
Zum besseren Verständnis möchte ich nachfolgend kompakt darstellen, auf welche Inhalte des Originalgemäldes verzichtet wurde:
-
In Ermangelung einer adäquaten Annäherung des Wappens der Herren von Freudenberg trotz einer Vielzahl verschiedener verwendeter Prompts wurde auf eine Darstellung verzichtet. Außerdem steht die Neuinterpretation auch nicht im Zusammenhang mit Freudenberg.
-
Die mittelalterlichen Kopfbedeckungen der Söhne werden nicht gezeigt, da Dall-E 3 trotz entsprechender Angaben im Prompt dieses Detail sehr unzuverlässig umgesetzt hat. Aus diesem Grund wurde auf diese Detailangabe im Rahmen der Umsetzung verzichtet.
-
Eine Abbildung des auf dem Original ersichtlichen Gebäudes führte in den Versuchen zu einer wesentlichen Verschlechterung der Wirkung des Bildes, sodass es aus der Nachbildung herausgenommen wurde.
Fazit (verfasst von ChatGPT)
Im Eröffnungsprojekt von Studio Aunkofen wurde eine digitale und moderne Neuinterpretation des historischen Tafelgemäldes "Graf Babo verabschiedet seinen ältesten Sohn Wenzel von Freudenberg" realisiert. Ziel war es, mithilfe neuester KI-bildgebender Technologien und Bildbearbeitungsprogrammen wie Dall-E 3, Canva Visual Suite und Adobe Photoshop (inklusive Adobe Firefly) eine zeitgemäße Interpretation zu schaffen, die künstlerische Freiheit und Zufälligkeit in den Vordergrund stellt, ohne auf historische Genauigkeit zu bestehen.
Aufgrund technischer Limitationen war es nicht möglich, das komplexe Originalgemälde mit einer einzigen Bildaufforderung zu reproduzieren. Daher wurden zahlreiche Einzelbilder der Figuren erstellt und anschließend zu einer Collage zusammengesetzt. Herausforderungen wie die vollständige Darstellung der Figuren, konsistente Ausrichtung und einheitlicher Kunststil wurden durch gezielte Anpassungen der Prompts und die Erstellung eines eigenen "Generative Pre-Trained Trainers" bewältigt.
Bestimmte Elemente des Originalgemäldes, wie das Wappen der Herren von Freudenberg, die mittelalterlichen Kopfbedeckungen und ein spezifisches Gebäude, wurden bewusst weggelassen, um die visuelle Wirkung zu optimieren.
Durch die Kombination von moderner Technologie und kreativer Herangehensweise entstand eine innovative Neuinterpretation, die eine Brücke zwischen Vergangenheit und Gegenwart schlägt.
weiterführende Links
hochinteressanter Aufsatz von Dr. Werner Robl: