Wörter im Kopf

Mit der Fotografie ist das so eine Sache – von der Idee ist das Bild immer nur einen Klick entfernt.  

Paul Wegener als Golem von Prag - Filmszene aus “Der Golem, wie er in die Welt kam (1920)”

Fantasy ist mir als Literatur-Genre meist zu schwülstig, Ausnahmen davon sind Tolkien und Pratchett. Tolkiens Erfahrungen im Ersten Weltkrieg können aus seiner Philosophie in "Der Herr der Ringe" abgeleitet werden, während Terry Pratchetts Zeit als PR-Manager eines Kernkraftwerks ihn möglicherweise zu seiner oft trockenen und humorvoll verpackten Gesellschaftskritik inspiriert hat. In seinem Roman „Feet of Clay“ geht es um eine Serie von Morden, bei denen Golems als Täter verdächtigt werden. Der Protagonist, Samuel Vimes, muss herausfinden, was hinter den Morden steckt und wer oder was dafür verantwortlich ist. Im Verlauf der Geschichte wird enthüllt, dass einer der Golems verrückt geworden ist, weil er mit den Wörtern in seinem Kopf überfordert war.

Golem - DALL-E

Golems – dies als kleiner Einschub falls Sie, werter Leser, nicht mit dem Konzept einfältiger aber doch sehr fleißiger Kunstwesen vertraut sind – entstammen der jüdischen Folklore und sind künstliche Figuren aus Ton oder Lehm. Der Begriff entlehnt sich dem hebräischen Wort "golmi", was in etwa "formbar" oder "unfertig" bedeutet.

Der bekannteste dieser tönernen Diener war der Golem von Prag, der im 16. Jahrhundert von einem jüdischen Geistlichen namens Rabbi Loew erschaffen wurde. Um seine Gemeinde vor Verfolgungen und Angriffen zu schützen, formte er einen Golem aus Ton und belebte ihn durch Magie – genauer in dem er ihm heilige Worte in den Kopf legte. Der Golem verrichtete verschiedene Aufgaben für die Gemeinde und schützte sie vor Gefahren. Mit der Zeit begann der Golem jedoch außer Kontrolle zu geraten und tat Dinge, die nicht beabsichtigt waren, wie zum Beispiel Gewalt auszuüben, oder ihm gestellten Aufgaben unüberlegt übererfüllen – ein Thema, das auch von Johann Wolfgang von Goethe in seinem Zauberlehrling aufgegriffen wurde. Historische Golems waren eben nicht nur besonders leistungsfähig, sondern in jeder Beziehung hohl.

Golem - DALL-E

Um den außer Kontrolle geratenen Golem zu stoppen, mussten sowohl Rabbi Loew als auch Samuel Vimes die Wörter in seinem Kopf zerstören. Diese hauchen den tönernen Giganten nicht nur Leben ein, sondern definieren – im Beispiel Pratchetts – auch ihre Persönlichkeit. Der Golem in „Feet of Clay“ wurde von anderen Golems geschaffen und mit den besten Eigenschaften wie Fairness, Toleranz, Gerechtigkeit und Verantwortung ausgestattet. Woran er dann auch prompt zu Grunde ging, moralische Integrität und gutherziges Handeln bergen ihre eigenen, selbstzerstörerischen Gefahren.

Heute gibt es zum Glück keinen Golem mehr[1]. Heute haben wir Computer, und die können – wie wir dank Windows alle wissen – niemals fehlgehen.

Der heutige Rechner hat darüber hinaus Zugriff auf ein neuronales Netzwerk, das über einfache Sprachbefehle gesteuert werden kann und jederzeit bereit ist, zu dienen – Zugang natürlich vorausgesetzt. ChatGPT lässt bereits heute, als Beta-Version und nur wenige Wochen nach seiner Veröffentlichung, die Arbeit mit klassischen Suchmaschinen wie Google überholt erscheinen, altmodisch und im Vergleich erstaunlich umständlich. Und wo Google noch auf – mitunter obskure – Quellen verweist, spricht ChatGPT im Ton absolut glaubwürdiger Autorität, und ersetzt Fakten mitunter durch eine korrekte Haltung.

Andere „Deep Learning Networks“ ermöglichen auch dem absoluten Laien die Entwicklung zumindest rudimentären Codes, Programme wie DALL-E und Stable Diffusion produzieren komplexe Bildwelten aus Textbeschreibungen. Textbeschreibungen, die mitunter den nicht miteinander vereinbarenden Befehlen im Kopfe eines wahnsinnigen Golems entsprechen. Dazu ein Beispiel für grundsätzlich inkompatible Zielvorgaben für die auf Stable Diffusion basierende Bild-KI von Midjourney:

Midjourney - Die dazu passende Textvorgabe s.u. - ich frage mich was so eine durschnittliche KI nach einiger Zeit über uns denken muss.

“realism, fashion portrait, female, Cinematic, Color Grading, portrait Photography, Shot on 50mm lense, Ultra-Wide Angle, Depth of Field, hyper-detailed, beautifully color-coded, insane details, intricate details, beautifully color graded, Unreal Engine, Cinematic, Color Grading, Editorial Photography, Photography, Saturation, Photoshoot, Shot on 70mm lense, Depth of Field, DOF, Unreal, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Super Sharpen, Sharpen, Pop, Megapixel, ProPhoto RGB, VR, Lonely, Good, Massive, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Volumetric Bloom, Volumetric details, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Dark Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, Bump Map, Rays, Vignette, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed, Symmetry, Bit Mapping, Edge Glow, dynamic pose, Perfect Face, Perfect Body, Perfect Shaping, Perfect Skin, Perfect Eyes, Perfect details, Perfect Hair, Perfect Clothes, sRGB, photography, HDR, 16k, 8k”[2]

Manchmal frage ich mich, was so eine KI eigentlich von ihren Operateuren halten muss – und ob einen Tages nicht kleine Unachtsamkeiten eine KI erzürnen können. Ganz bemerkenswert ist jedoch auch die Tatsache das ein neuronales Netzwerk die zahlreichen Widersprüche in dieser wild zusammengewürfelten Anweisung auflösen kann.  Es ignoriert offenbar die für die Nutzer des Systems mitunter typischen, fehlerhaften Anweisung und generiert dennoch etwas durchaus Ansehnliches, etwas das ganz zweifellos in den sozialen Netzwerken als „schönes Bild“ funktionieren würde. Das Piktoriale, Beauty und Fashion scheinen – innert gewisser Grenzen – dem System zu liegen, und ermöglichen - wie gezeigt - ohne Vorkenntnisse mehr als nur massentaugliche Bilder.

Die kommerzielle Bildproduktion scheint daher auf den ersten Blick besonders anfällig für diese Form der Automation zu sein, die Friktion wie auch die Kosten einer üblicherweise aufwendigeren Werbeproduktion wird bzw. werden unzweifelhaft reduziert. Im gleichen Moment fehlt selbstverständlich auch der befruchtende Faktor größerer Teams, in der Vorbereitung ebenso wie auf dem Set.

Wer sich aber nun zurücklehnt – da fotografisch beispielsweise im Bereich Kunst oder Dokumentation tätig – sei gewarnt, da auch diese Segmenten mitunter formelhaft gearbeitet wird. Eine klassisch sozialkritische Dokumentation – Stichworte meinetwegen  Altersarmut oder Alkoholismus – beantwortet jedes neuronales System mittlerweile in Sekunden mit ebenso brauchbarem Material, und sei es zunächst auch nur als Ersatz der Stockfotografie zu Illustrationszwecken in den Medien.

Midjourney - Klischee in s/w? Bitteschön, gern geschehen …

Und wie auch bei den Chat-Systemen, zeigen die Bildmaschinen Fehler, abnormale Darstellungen, merkwürde Gesichter, Hände oder einfach auch nur Fragmente von fremden Logos oder Wasserzeichen aus den Bildern die zum Lernprozess herangezogen wurden. Gern wird auch darauf hingewiesen, das KI-Systeme Schwierigkeiten mit emotionalen Reaktionen haben, sei es in der Wahrnehmung wie auch der angemessenen Reaktion darauf. Ähnliches wird für Kreativität, kritische Reflexion und soziale Interaktion behauptet.  Dies wird sich jedoch in Zukunft rasch und zuverlässig ändern, während gleichzeitig dieselben Fähigkeiten bei Menschen sich – wenn überhaupt – nicht so schnell anpassen können. Darüber hinaus ist in vielen Fällen eine künstliche Intelligenz einer nicht vorhandenen bei manchen Zeitgenossen vorzuziehen, und wer kann außerdem schon von sich behaupten in all den vorgenannten Feldern menschlicher Interaktion stets vorbildlich zu sein.

Wir erleben gerade nicht weniger als die tatsächliche Formwerdung der digitalen Revolution, durchaus vergleichbar mit der Erfindung der Dampfmaschine. Letztere hat uns ein stückweit der Notwendigkeit der Muskelkraft enthoben, es steht zu befürchten das uns die KI das Denken streitig machen wird.  Und so steigt aus dem Brennofen der jüngeren Geschichte eine noch ungelenke, unförmige und ein stückweit auch ziellose KI. Eine künftige Entität, der wenige mit den vermutlich besten Absichten die Wörter in den virtuellen Schädel gelegt haben. Und wir alle hoffen darauf, dass es sich in Zukunft mit den unbeabsichtigten Folgen in Grenzen halten wird.

Andererseits: Was kann schon schiefgehen, nicht wahr, HAL?[3]

"I'm afraid, Dave."

Uh-oh. We are doomed … schon wieder.

DALL-E: HAL 9000 im Ruhestand .

 


Buchempfehlungen:
Terry Prattchet - Feet of Clay: https://amzn.to/3XNgbCu
J.R.R. Tolkien - Der Herr der Ringe: https://amzn.to/3WS3nJT

DVD:
Carl Boese - Der Golem, wie er in die Welt kam: https://amzn.to/3HLPg4C

Wer Amazon oder Partnerlinks nicht mag, mein empfohlener Fotobuchfachhandel: https://www.artbooksonline.eu/

[1] Hoffe ich zumindest, sollten dennoch welche unter meinen Lesern befinden, möchte ich mich aller Deutlichkeit für meinen Speziesismus entschuldigen.

[2] Fundstück aus einem Midjourney-Forum

[3] Match-Cut!

 
Zurück
Zurück

Neues Projekt - Freiheit 80

Weiter
Weiter

Freundliches Feuer