Das UNet ist der eigentliche „Bildgenerator“ innerhalb vieler KI-Bildmodelle wie Stable Diffusion.
Während andere Bestandteile:
den Prompt verstehen
Farben verarbeiten
Daten vorbereiten
ist das UNet hauptsächlich dafür zuständig, aus dem Bildrauschen Schritt für Schritt ein echtes Bild zu erzeugen.
Man kann vereinfacht sagen:
Das UNet ist der Teil der KI, der tatsächlich „zeichnet“.
Es entscheidet unter anderem:
Formen
Strukturen
Details
Beleuchtung
Bildaufbau
Deshalb beeinflussen Änderungen am UNet oft den gesamten Stil und die Bildqualität eines Modells.
Viele moderne Finetunes und Checkpoints bestehen im Kern aus angepassten UNet-Gewichten.
Kurz gesagt:
Das UNet ist die zentrale Bild-Engine eines KI-Modells und erzeugt aus Rauschen das eigentliche Bild.