Maschinelles Lernen und Generative KI in der Bildbearbeitung
veröffentlicht am 05.05.2026 - aktualisiert am 14.05.2026 in * BILDBEARBEITUNG *
Inhaltsverzeichnis
In der Fotobearbeitung werden die Begriffe Maschinelles Lernen/Machine Learning (ML) und Generative Künstliche Intelligenz (Generative AI) häufig gleichgesetzt. Diese Gleichsetzung ist fachlich falsch und führt zu Missverständnissen über Funktionsweise, Auswirkungen und Eingriffstiefe moderner Bildbearbeitungswerkzeuge.
Der Unterschied ist insbesondere für Fotografen relevant, die mit RAW-Daten und nicht-destruktiver Nachbearbeitung arbeiten.
Warum ist das hier ein Thema: Weil aktuell im darktable-Umfeld diese Diskussion geführt wird. Die eine Gruppe, die Puristen, wollen ein “echtes Bild” erhalten, die anderen - ich nenne sie jetzt mal “zielorientierte Praktiker” - wollen aktuelle Technologien verwenden können, die die Arbeit mit RAW-Dateien erleichtert, hier insbesondere hinsichtlich Entrauschen und Maskieren.
Ausgangspunkt der Diskussion
Auslöser ist die verbreitete Annahme, KI-basierte Tools würden Originalbilddaten verwerfen und durch künstlich erzeugte Inhalte ersetzen. Diese Annahme ist insbesondere bei Machine-Learning-basierten Werkzeugen unzutreffend. ML-gestützte Bildbearbeitung arbeitet mit den tatsächlich vorhandenen Bilddaten und ersetzt keine Bildinhalte durch „fantasierte“ Pixel.
Andy Hutchinson beschreibt in seinem Video Machine Learning is not Generative A.I. (and Photographers Need to Know Why) sehr gut anhand von Beispielen für Fotografen die Grundlagen, um die beiden Begriffe sauber auseinander zu halten.
Für meine deutschsprachigen Leser soll hier eine kurze Zusammenfassung der wesentlichen Inhalte folgen (das Video läßt sich auch in deutscher Sprache untertiteln).
Historische Entwicklung von Machine Learning in der Fotografie
Frühe ML-Anwendungen
Machine Learning wird seit fast zwei Jahrzehnten in der Fotografie eingesetzt, zunächst in unterstützender Funktion:
- Gesichtserkennung
- Motiverkennung und Kategorisierung
- Horizonterkennung
- Automatische Bildorganisation
Frühe Beispiele sind Gesichtserkennung in Google Picasa (2008) und Apple Photos (2009) sowie die semantische Bildsuche in Google Photos (2015).
Weiterentwicklung durch Adobe Sensei
Mit der Einführung des Adobe-Sensei-Frameworks (ab 2016) wurden ML-Werkzeuge deutlich leistungsfähiger, z. B.:
- Gesichtsbasierte Bearbeitungswerkzeuge (Face-Aware Liquify)
- Automatische Motivauswahl („Select Subject“)
Diese Werkzeuge beschleunigten Arbeitsabläufe erheblich, ohne neue Bildinhalte zu erzeugen.
Was ist Machine Learning in der Bildbearbeitung?
Grundprinzip
Machine Learning analysiert vorhandene Bilddaten mithilfe statistischer Modelle. Ziel ist es:
- Fehler zu identifizieren (z. B. Rauschen, Unschärfe)
- diese Fehler anhand gelernter Muster zu korrigieren
Dabei wird kein neues Bildmaterial erfunden.
Wichtige ML-Konzepte
- Klassifikation: Erkennen und Zuordnen von Bildmerkmalen (z. B. Auge, Rauschen).
- Transformation: Pixelweise Umwandlung vorhandener Daten (z. B. Entrauschen).
- Signalrekonstruktion: Wiederherstellung eines plausiblen Signals aus gestörten Daten.
Typische Anwendungsfälle:
- Entrauschen (High-ISO-Rauschreduzierung)
- Hochskalieren (Upscaling)
- Schärfen und Entschärfen (Deblurring)
Das Bild bleibt in seinem Informationsgehalt grundsätzlich erhalten.
Was ist Generative Künstliche Intelligenz?
Funktionsweise
Generative KI erzeugt neue Bilddaten, die nie von der Kamera aufgenommen wurden. Grundlage ist das Lernen statistischer Strukturen aus sehr großen Trainingsdatensätzen. Bekannte Modellklassen sind:
- Diffusionsmodelle
- Generative Adversarial Networks (GANs)
- Transformer-basierte Modelle
Generative KI ersetzt Bildbereiche vollständig durch neu berechnete Inhalte.
Beispielhafte Anwendung
Bei generativen Werkzeugen wie „Generative Fill“ werden ausgewählte Bildbereiche nicht verfeinert, sondern komplett neu erzeugt. Dies kann dazu führen, dass:
- Gesichter verändert werden
- Bilddetails keinen Bezug mehr zum Original haben
- das Ergebnis nicht mehr als ursprüngliche Fotografie betrachtet werden kann
Zentrale Unterschiede zwischen ML und Generativer KI
| Aspekt | Machine Learning | Generative KI |
|---|---|---|
| Datenbasis | Vorhandene Bilddaten | Externe Trainingsdaten |
| Erzeugung neuer Pixel | Nein | Ja |
| Eingriffstiefe | Korrektur | Ersetzung |
| Ziel | Optimierung des Originals | Neuer Bildinhalt |
Hierbei sind die Übergänge aber fließend:
Mit mehr Skalierung und breiteren Daten wird die Anwendbarkeit größer; mit eingeschränkten Daten wird sie zielgerichteter. Welche “Nebenwirkungen” eine breitere Datenbasis aber haben kann, das zeigt folgendes Beispiel:

- Originalaufnahme
Ich habe hier generative KI-Modelle (GPT 5.5 von OpenAI sowie Opus von Claude) mit einer einfachen Aufgabe konfrontiert:
Entferne die rote Leine links des Hundes
Das sollte eigentlich eine einfache Aufgabe sein: maskieren und durch Struktur des Grases ersetzen. Stattdessen hat sich die generative KI des Gesamtbildes bemächtigt und “an allen Ecken und Enden optimiert”. Hier die beiden Versionen, die jeweils beim Überfahren per Maus das Originalbild zum Vergleich anzeigen:
Bildvergleich 1: (Maus über Bild bewegen zum Umschalten)
-
-
Bearbeitete Aufnahme, GPT 5.5
-
-
Originalaufnahme
Neben Unterschieden in Kontrast und Farbintensität fallen insbesondere Unterschiede auf in
- der Kopfhaltung des Hundes
- Form der Rückenlinie
- Schwanzstellung
- viele unterschiedliche Details des Geschirrs im Hals- und Rückenbereich: unterschiedliche Logos, unterschiedliche Schnallenformen und -anordnungen etc.
Kurz zusammengefaßt: Je “mächtiger” die Trainings-Datensätze sind, desto größer die Gefahr, daß die Bildinhalte selbst wesentlich verändert werden.
Und hier nochmal ein Vergleich, der zwei unterschiedliche “Interpretationen” der beiden verwendeten Modelle zeigt:
Bildvergleich 2: (Maus über Bild bewegen zum Umschalten)
-
-
Bearbeitete Aufnahme, GPT 5.5
-
-
Bearbeitete Aufnahme, Opus
Es zeigen sich hier grundsätzlich in denselben Bildbereichen wie im obigen Vergleich deutliche Unterschiede …
Bedeutung für Fotografen
Für Fotografen, die Wert auf die Integrität von RAW-Daten legen, ist diese Unterscheidung entscheidend:
- ML-Tools gelten als Weiterentwicklung klassischer Regler und Filter
- Generative KI verändert den Bildinhalt fundamental, und wie aus dem gezeigten Vergleich hervorgeht: nicht immer vorhersehbar
Der Einsatz ist eine bewusste gestalterische Entscheidung, keine rein technische Optimierung.
Fazit
Machine Learning und Generative KI verfolgen unterschiedliche Ansätze und dürfen nicht gleichgesetzt werden. Während ML vorhandene Bildinformation analysiert und verbessert, erzeugt Generative KI neue Inhalte. Die häufige Verwirrung entsteht durch unpräzise Kommunikation in Medien und Marketing. Ein korrektes Verständnis ermöglicht einen bewussten und informierten Einsatz moderner Bildbearbeitungswerkzeuge.
806 Worte - Lesezeit: 4 Minute(n)
weitere Artikel
Wellenform (Waveform) anstelle Histogramm in der Fotografie?
02.02.2025 Mit Version 5.0 wurde die Wellenform-Darstellung zur Voreinstellung in darktable gewählt. Was sagt diese Darstellung aus und wie unterscheidet sie sich vom 'normalen' Histogramm?
darktable: Beschreibung für Umsteiger
04.04.2024 Wer umsteigen will von einem vertrauten RAW-Konverter, der tut sich gelegentlich nicht wirklich leicht bei der Vielzahl der Funktionen dieser Programme. Und wenn dann die Anordnung 'sehr anders' ist ... könnte eine systemmatische Einführung helfen.
darktable: einfache szenenbezogene Entwicklung in 3 Schritten
29.09.2021 Seit darktable 3.0 ist die szenenbezogene Entwicklung zunehmend das Mittel der Wahl, will man ein RAW-Bild entwickeln. Die ersten Schritte zu einer effektiven Vorgehensweise zeigt dieses Tutorial ...
darktable 3.2 - die Auswirkungen des Lockdowns
10.08.2020 darktable 3.2 ist veröffentlicht. Es gab eine Menge Änderungen und neuer Features - und ein Team der französischen darktable-Community hat die etwas spröden Release-Notes um einen anschaulichen Artikel ergänzt.
