Zum Inhalt springen
In der App anzeigen

Eine bessere Möglichkeit zum Browsen. Mehr erfahren.

Arteum Digital

Eine Vollbild-App auf Ihrem Startbildschirm mit Push-Benachrichtigungen, Badges und mehr.

So installieren Sie diese App unter iOS und iPadOS
  1. Tippen Sie in Safari auf das Teilen-Symbol
  2. Scrollen Sie durch das Menü und tippen Sie auf Zum Home-Bildschirm.
  3. Tippen Sie oben rechts auf Hinzufügen.
So installieren Sie diese App unter Android
  1. Tippen Sie oben rechts im Browser auf das 3-Punkte-Menü (⋮).
  2. Tippen Sie auf Zum Startbildschirm hinzufügen oder App installieren.
  3. Bestätigen Sie, indem Sie auf Installieren tippen.
Pony ist eine beliebte Modellreihe für stilisierte Charakterbilder, Anime-Art und expressive Illustrationen. Gemeint ist meist Pony Diffusion beziehungsweise darauf basierende Checkpoints.
Das Modell wurde stark auf:
Charakterdesigns
Gesichtsausdrücke
Posen
Anime- und Furry-Content
stylisierte Ästhetik
optimiert.
Pony versteht typische Tag-basierte Prompts besonders gut. Deshalb arbeiten viele Nutzer mit kurzen Schlagworten und Gewichtungen statt mit langen beschreibenden Sätzen.
Typisch für Pony:
große expressive Augen
sehr saubere Gesichter
starke Farben
dynamische Posen
hoher Detailgrad bei Haaren und Kleidung
Viele moderne Semi-Realistic- oder „Anime trifft Fotografie“-Looks basieren heute ebenfalls auf Pony-Finetunes oder Mischmodellen.
Der Nachteil:
Pony kann manchmal übertreiben. Haut wirkt schnell zu glatt, Gesichter zu perfekt und manche Bilder bekommen einen typischen „AI-Anime-Look“, den man sofort erkennt.
Kurz gesagt:
Pony ist eines der bekanntesten Modelle für moderne Anime- und Character-Art mit starkem Fokus auf Stil und Ausdruck.
Poses sind gespeicherte Körperhaltungen oder Bewegungsabläufe, die in der KI-Bildgenerierung als Vorlage genutzt werden können.
Viele Nutzer laden fertige Posen herunter, um:
bestimmte Körperhaltungen zu übernehmen
konsistente Charaktere zu erzeugen
dynamischere Bilder zu erstellen
schwierige Anatomie besser zu kontrollieren
Solche Pose-Vorlagen bestehen oft aus:
OpenPose-Skeletten
Strichfiguren
3D-Posing-Dateien
Referenzbildern
Sie werden meist zusammen mit:
ControlNet
OpenPose
ComfyUI
A1111
Draw Things
verwendet.
Besonders beliebt sind Pose-Packs für:
Fashion
Anime
Action-Szenen
Portraits
Paar-Posen
Der Vorteil:
Man muss komplexe Körperhaltungen nicht jedes Mal neu prompten oder zeichnen.
Kurz gesagt:
Poses sind vorgefertigte Körperhaltungen, die als visuelle Vorlage für KI-generierte Bilder genutzt werden können.
Der Positive Prompt beschreibt, was die KI erzeugen soll.
Der Negative Prompt beschreibt, was vermieden werden soll.
Beispiele für Positive Prompts:
Kleidung
Lighting
Bildstil
Kameraoptik
Posen
Stimmung
Beispiele für Negative Prompts:
schlechte Hände
zusätzliche Finger
blurry
low quality
watermark
deformierte Gesichter
Der Negative Prompt funktioniert dabei wie eine Art Gegengewicht. Die KI versucht, diese Dinge möglichst nicht ins Bild einzubauen.
Gerade ältere Modelle brauchten oft extrem lange Negative Prompts, um typische KI-Fehler zu vermeiden. Moderne Modelle wie Flux kommen häufig mit deutlich weniger aus.
Zu aggressive Negative Prompts können allerdings auch Probleme verursachen:
sterile Bilder
fehlende Details
unnatürliche Haut
kaputte Lighting-Stimmung
Kurz gesagt:
Der Positive Prompt sagt der KI, was sie erzeugen soll.
Der Negative Prompt sagt ihr, was sie vermeiden soll.
ost-Processing bezeichnet die Nachbearbeitung von Fotos oder Videos nach der Aufnahme.
Dabei können unter anderem angepasst werden:
Farben
Kontrast
Belichtung
Schärfe
Retusche
Bildausschnitt
Post-Processing reicht von:
kleinen Korrekturen
bis zu aufwendigen Composings und Color Grading
Es wird genutzt bei:
Fotografie
Film
Werbung
Social Media
digitaler Kunst
Typische Programme dafür sind:
Adobe Lightroom
Adobe Photoshop
DaVinci Resolve
Kurz gesagt:
Post-Processing umfasst alle Bearbeitungen eines Bildes oder Videos nach der eigentlichen Aufnahme.
Ein Preset ist eine gespeicherte Sammlung von Einstellungen, die mit einem Klick auf andere Bilder angewendet werden kann.
In der Fotografie und Bildbearbeitung betrifft das meist:
Belichtung
Kontrast
Farben
Schärfe
Gradationskurven
Farblooks
Presets werden häufig genutzt in:
Adobe Lightroom
Adobe Photoshop
Vorteile:
schneller Workflow
konsistenter Bildstil
einfache Wiederverwendung
einheitliche Serienlooks
Nachteile:
keine perfekte Anpassung an jedes Bild
kann bei falscher Nutzung unnatürlich wirken
oft nur Ausgangsbasis für weitere Bearbeitung
Kurz gesagt:
Ein Preset ist eine gespeicherte Einstellungskombination für schnelle und konsistente Bildbearbeitung.
Prompt Weighting bedeutet, bestimmte Begriffe im Prompt stärker oder schwächer zu gewichten.
Dadurch kann man der KI sagen, welche Elemente besonders wichtig sind.
Beispiele:
(red dress) → leicht verstärkt
((red dress)) → stärker verstärkt
(red dress:1.5) → genaue Gewichtung
[red dress] → abgeschwächt
Mit Gewichtungen lassen sich zum Beispiel:
Gesichter stärker betonen
bestimmte Farben hervorheben
Kleidungsdetails verstärken
Hintergründe abschwächen
Bildstimmungen kontrollieren
Besonders bei älteren Stable-Diffusion-Modellen war Gewichtung oft extrem wichtig, damit die KI bestimmte Begriffe überhaupt ernst nimmt.
Zu starke Gewichtungen können allerdings Probleme verursachen:
unnatürliche Bilder
übertriebene Details
kaputte Anatomie
chaotische Kompositionen
Moderne Modelle wie Flux reagieren meist natürlicher auf normale Sprache und benötigen weniger aggressive Gewichtung.
Kurz gesagt:
Prompt Weighting bestimmt, wie wichtig einzelne Begriffe für die KI sein sollen.
Quantization reduziert die Genauigkeit von KI-Modellen, damit sie weniger Speicher und Rechenleistung benötigen.
Dadurch laufen Modelle oft:
schneller
effizienter
auf schwächerer Hardware
Bekannte Formate:
FP16
BF16
FP8
INT8
Kurz gesagt:
Quantization komprimiert KI-Modelle für bessere Performance und geringeren Speicherverbrauch.

RAW

RAW ist ein Bildformat, das die rohen und weitgehend unbearbeiteten Bilddaten direkt vom Kamerasensor speichert.
Im Gegensatz zu JPEG enthält RAW deutlich mehr:
Bildinformationen
Dynamikumfang
Farbdetails
Reserven für Nachbearbeitung
RAW-Dateien eignen sich besonders für:
professionelle Bildbearbeitung
schwierige Lichtverhältnisse
Farbkorrekturen
maximale Bildqualität
Da RAW-Dateien noch nicht fertig entwickelt sind, wirken sie oft:
flacher
weniger kontrastreich
unschärfer
als fertige JPEGs.
Zur Bearbeitung werden Programme genutzt wie:
Adobe Lightroom
Capture One
Der Nachteil:
RAW-Dateien benötigen mehr Speicherplatz und müssen meist nachbearbeitet werden.
Kurz gesagt:
RAW speichert die unverarbeiteten Sensordaten einer Kamera für maximale Bildqualität und Bearbeitungsfreiheit.
Eine RAW-Datei enthält die rohen und weitgehend unbearbeiteten Bilddaten direkt vom Kamerasensor.
Im Gegensatz zu JPEG speichert sie deutlich mehr:
Farbdetails
Dynamikumfang
Schatteninformationen
Bearbeitungsreserven
RAW-Dateien eignen sich besonders für:
professionelle Bildbearbeitung
schwierige Lichtverhältnisse
Farbkorrekturen
hochwertige Prints
Da RAW-Dateien noch nicht fertig verarbeitet sind, wirken sie oft:
flacher
weniger kontrastreich
weniger geschärft
als fertige JPEGs.
Zur Entwicklung und Bearbeitung werden Programme genutzt wie:
Adobe Lightroom
Capture One
Der Nachteil:
RAW-Dateien benötigen mehr Speicherplatz und müssen meist nachbearbeitet werden.
Kurz gesagt:
Eine RAW-Datei speichert die unverarbeiteten Sensordaten einer Kamera für maximale Bildqualität und Bearbeitungsfreiheit.
Ein Refiner ist ein zusätzliches KI-Modell, das ein bereits generiertes Bild weiter verbessert.
Besonders bei SDXL wurde oft zwischen:
Base Model
und Refiner
unterschieden.
Der Refiner ergänzt meist:
Details
Hautstrukturen
Lighting
Schärfe
Kurz gesagt:
Ein Refiner verbessert ein fertiges KI-Bild in einem zusätzlichen Verarbeitungsschritt.
Eine Reflektion entsteht, wenn Licht von einer Oberfläche zurückgeworfen wird.
Typische reflektierende Oberflächen sind:
Wasser
Glas
Metall
Spiegel
glänzende Materialien
Reflektionen können:
störend
oder gezielt als Gestaltungsmittel genutzt werden.
In der Fotografie werden sie häufig eingesetzt für:
kreative Bildkompositionen
Spiegelungen
Lichtstimmungen
symmetrische Effekte
Unkontrollierte Reflektionen können allerdings:
Ablenkungen
Blendungen
Detailverlust
verursachen.
Fotografen nutzen oft:
Polfilter
Lichtformer
veränderte Perspektiven
um Reflektionen zu kontrollieren.
Kurz gesagt:
Reflektionen entstehen durch zurückgeworfenes Licht und beeinflussen die Wirkung eines Bildes stark.
Reflexionsflächen sind Oberflächen, die Licht zurückwerfen und dadurch Einfluss auf die Ausleuchtung eines Bildes haben.
Typische Reflexionsflächen sind:
Spiegel
Wasser
Glas
Metall
helle Wände
Reflektoren
Sie können:
Licht verstärken
Schatten aufhellen
Highlights erzeugen
oder störende Spiegelungen verursachen
Fotografen nutzen Reflexionsflächen oft gezielt für:
weichere Portraitbeleuchtung
Produktfotografie
kreative Effekte
natürliche Lichtführung
Unkontrollierte Reflexionen können allerdings:
Ablenkungen
Überstrahlungen
oder unerwünschte Spiegelbilder
verursachen.
Kurz gesagt:
Reflexionsflächen werfen Licht zurück und beeinflussen dadurch die Wirkung und Ausleuchtung eines Bildes.
Regional Prompter ist eine Technik oder Erweiterung, mit der unterschiedliche Bereiche eines Bildes separat gepromptet werden können.
Dadurch kann man der KI zum Beispiel sagen:
links eine Person
rechts eine andere Person
anderer Hintergrund
unterschiedliche Kleidung
verschiedene Lighting-Stimmungen
ohne dass alles im Prompt miteinander „verschmilzt“.
Das wird oft genutzt für:
Szenen mit mehreren Charakteren
komplexe Bildkompositionen
Comics
Werbemotive
kontrollierte Layouts
Regional Prompting funktioniert meist über:
Masken
Bildbereiche
Rasteraufteilungen
spezielle Extensions oder Nodes
Besonders in:
ComfyUI
AUTOMATIC1111
SDXL-Workflows
ist diese Technik beliebt.
Der Vorteil:
Deutlich mehr Kontrolle über komplexe Szenen.
Der Nachteil:
Falsch konfigurierte Regionen führen schnell zu sichtbaren Übergängen oder unnatürlich wirkenden Bildern.
Kurz gesagt:
Regional Prompter erlaubt es, verschiedene Bereiche eines KI-Bildes mit unterschiedlichen Prompts gezielt zu steuern.
Eine Reihenaufnahme erstellt mehrere Bilder schnell hintereinander, solange der Auslöser gedrückt wird.
Diese Funktion wird oft auch:
Serienbildmodus
Burst Mode
Continuous Shooting
genannt.
Reihenaufnahmen werden häufig genutzt bei:
Sport
Wildlife
Action
Events
schnellen Bewegungen
Der Vorteil:
Man erhöht die Chance, genau den richtigen Moment einzufangen.
Moderne Kameras schaffen teilweise:
mehrere Bilder pro Sekunde
bis hin zu extrem schnellen High-Speed-Serien
Der Nachteil:
Reihenaufnahmen erzeugen große Datenmengen und füllen Speicherkarte sowie Kamerapuffer schnell.
Kurz gesagt:
Eine Reihenaufnahme erstellt viele Bilder direkt hintereinander, um schnelle Bewegungen festzuhalten.
Retusche bezeichnet die gezielte Nachbearbeitung und Korrektur von Bildern.
Dabei werden zum Beispiel angepasst oder entfernt:
Hautunreinheiten
Staub
störende Objekte
Falten
Lichtfehler
kleine Details
Retusche wird häufig genutzt bei:
Portraits
Beauty
Fashion
Werbung
Produktfotografie
Die Bearbeitung kann:
sehr subtil
oder stark stilisiert
ausfallen.
Moderne Retusche nutzt oft:
Frequenztrennung
Dodge & Burn
KI-Werkzeuge
automatische Hautkorrektur
Zu starke Retusche kann allerdings schnell:
künstlich
plastikartig
oder unrealistisch
wirken.
Kurz gesagt:
Retusche verbessert oder korrigiert gezielt einzelne Bereiche eines Bildes in der Nachbearbeitung.
Ein Ringblitz ist ein Blitzgerät in Ringform, das direkt um das Objektiv herum montiert wird.
Dadurch entsteht eine sehr gleichmäßige Ausleuchtung nahezu ohne seitliche Schatten.
Ringblitze werden besonders genutzt bei:
Makrofotografie
Beauty
Fashion
Medizin- und Zahnfotografie
Typisch für Ringblitz-Aufnahmen sind:
weiches frontales Licht
gleichmäßige Hautausleuchtung
charakteristische Lichtreflexe in den Augen
Der Vorteil:
Sehr kontrolliertes Licht bei Nahaufnahmen und kleinen Motiven.
Der Nachteil:
Das Licht kann flach wirken und Bilder verlieren manchmal räumliche Tiefe.
Kurz gesagt:
Ein Ringblitz erzeugt gleichmäßiges Licht direkt um das Objektiv herum.
Rolling Shutter beschreibt einen Bildeffekt, der entsteht, weil ein Sensor nicht das gesamte Bild gleichzeitig, sondern zeilenweise ausliest.
Dadurch werden schnelle Bewegungen oder Kameraschwenks verzerrt dargestellt.
Typische Effekte:
schiefe Linien bei schnellen Bewegungen
„wackelige“ vertikale Objekte
verzogene Propeller oder Räder
Rolling Shutter tritt besonders häufig auf bei:
spiegellosen Kameras
Smartphones
Videoaufnahmen
schnellen Schwenks
Der Effekt ist stärker, wenn:
der Sensor langsam ausgelesen wird
sehr schnelle Bewegung im Bild ist
Moderne Kameras reduzieren Rolling Shutter durch:
schnellere Sensoren (z. B. Stacked CMOS)
Global Shutter (in einigen Profi-Systemen)
Kurz gesagt:
Rolling Shutter ist eine Bildverzerrung, die durch zeilenweises Auslesen des Sensors bei Bewegung entsteht.
Ein Safety Checker ist ein Filtersystem, das KI-Bilder automatisch auf problematische Inhalte überprüft.
Dabei erkennt die KI zum Beispiel:
Nacktheit
Gewalt
schockierende Inhalte
urheberrechtlich problematische Motive
oder andere gesperrte Inhalte
Viele KI-Tools blockieren oder verändern Bilder automatisch, wenn der Safety Checker anschlägt.
Safety Checker werden häufig eingesetzt bei:
Cloud-Diensten
öffentlichen KI-Plattformen
Apps
kommerziellen Bildgeneratoren
Lokale Stable-Diffusion-Tools erlauben es oft, diese Filter:
anzupassen
zu deaktivieren
oder komplett zu entfernen
Der Nachteil:
Safety Checker arbeiten nicht perfekt. Sie blockieren manchmal harmlose Bilder oder übersehen problematische Inhalte komplett.
Besonders bei Kunst, Fashion oder düsteren Bildstilen entstehen deshalb häufig Fehlentscheidungen.
Kurz gesagt:
Ein Safety Checker überprüft KI-Bilder automatisch auf Inhalte, die von einer Plattform oder einem Anbieter eingeschränkt werden sollen.
Der Sampler ist der Algorithmus, der bestimmt, wie die KI aus Bildrauschen Schritt für Schritt ein fertiges Bild erzeugt.
Vereinfacht gesagt:
Der Sampler entscheidet, wie die KI „zeichnet“.
Unterschiedliche Sampler beeinflussen:
Bildstil
Schärfe
Details
Kontrast
Geschwindigkeit
Stabilität des Ergebnisses
Bekannte Sampler sind zum Beispiel:
Euler
Euler A
DPM++ 2M
UniPC
DDIM
Manche Sampler erzeugen:
weichere und natürlichere Bilder
andere eher harte, kontrastreiche Looks
manche sind schneller
andere stabiler bei vielen Steps
Deshalb kann derselbe Prompt mit gleichem Modell je nach Sampler komplett anders aussehen.
Kurz gesagt:
Der Sampler ist die Methode, mit der die KI das Bild aus dem Rauschen „entwickelt“. Er beeinflusst stark den finalen Look und die Bildqualität.
Die Schärfeebene ist die exakt definierte Ebene im Raum, auf die eine Kamera fokussiert.
Alle Punkte, die genau auf dieser Ebene liegen, werden maximal scharf abgebildet.
Alles davor oder dahinter wird zunehmend unscharf, abhängig von der Tiefenschärfe.
Die Schärfeebene wird beeinflusst durch:
Fokusdistanz
Blende
Brennweite
Abstand zum Motiv
Besonders wichtig ist sie bei:
Portraits (Augen müssen exakt auf der Schärfeebene liegen)
Makrofotografie (sehr dünne Schärfeebene)
Produktfotografie (präzise Ausrichtung nötig)
Die Schärfeebene ist ein rein geometrisches Konzept und unterscheidet sich von der wahrgenommenen Tiefenschärfe.
Kurz gesagt:
Die Schärfeebene ist die exakt scharfe Ebene im Raum, auf die fokussiert wird.
Die Schärfentiefe beschreibt den Bereich eines Bildes, der scharf dargestellt wird.
Eine geringe Schärfentiefe:
nur kleiner Bereich scharf
starker Hintergrund-Blur
häufig bei Portraits genutzt
Eine große Schärfentiefe:
mehr Bereiche im Bild scharf
typisch für Landschaften oder Architektur
Die Schärfentiefe wird beeinflusst durch:
Blende
Brennweite
Abstand zum Motiv
Sensorgröße
Offene Blenden wie f/1.4 erzeugen meist geringe Schärfentiefe, kleine Blenden wie f/11 deutlich mehr.
Die gezielte Kontrolle der Schärfentiefe gehört zu den wichtigsten kreativen Werkzeugen in der Fotografie.
Kurz gesagt:
Die Schärfentiefe bestimmt, wie groß der scharf wirkende Bereich eines Bildes ist.
Der Scheduler steuert bei der KI-Bildgenerierung, wie stark das Bildrauschen in jedem Schritt reduziert wird.
Er arbeitet eng mit dem Sampler zusammen und beeinflusst:
Bildqualität
Detailaufbau
Kontrast
Stabilität
Geschwindigkeit
Vereinfacht gesagt:
Der Sampler bestimmt wie die KI zeichnet.
Der Scheduler bestimmt wie schnell und in welcher Reihenfolge das Bild entwickelt wird.
Unterschiedliche Scheduler können dafür sorgen, dass Bilder:
weicher
kontrastreicher
stabiler
detailreicher
oder natürlicher
aussehen.
Bekannte Scheduler-Arten sind zum Beispiel:
Karras
Exponential
Normal
Simple
Vor allem bei modernen Modellen wie SDXL oder Flux kann der Scheduler sichtbaren Einfluss auf den finalen Look haben.
Der Nachteil:
Für Anfänger wirken Unterschiede zwischen Schedulern oft verwirrend oder schwer nachvollziehbar.
Kurz gesagt:
Der Scheduler steuert den Ablauf der Bildentwicklung und beeinflusst, wie das KI-Bild Schritt für Schritt aus dem Rauschen entsteht.
Ein Schlagschatten ist der sichtbare Schatten, den ein Objekt durch eine Lichtquelle auf eine andere Fläche wirft.
Er entsteht abhängig von:
Lichtposition
Lichtstärke
Abstand
Größe der Lichtquelle
Schlagschatten beeinflussen stark:
Bildtiefe
Räumlichkeit
Stimmung
Lichtwirkung
Harte Lichtquellen erzeugen meist:
scharfe, dunkle Schatten
Weiche Lichtquellen erzeugen:
weichere, diffuse Schatten
Fotografen nutzen Schlagschatten gezielt für:
Portraits
Cinematic Looks
Produktfotografie
dramatische Lichtstimmungen
Kurz gesagt:
Ein Schlagschatten ist der durch Licht entstehende Schattenwurf eines Objekts auf eine Fläche.
Eine SD-Karte ist ein Speichermedium, auf dem Kameras Fotos und Videos speichern.
SD steht für Secure Digital.
SD-Karten werden genutzt in:
Kameras
Drohnen
Smartphones
Audiorekordern
Es gibt verschiedene Varianten:
SD
SDHC
SDXC
microSD
Wichtige Eigenschaften sind:
Speichergröße
Schreibgeschwindigkeit
Lesegeschwindigkeit
Schnelle SD-Karten sind besonders wichtig für:
Serienbilder
4K- oder 8K-Video
RAW-Aufnahmen
hohe Datenmengen
Zu langsame Karten können:
Aufnahmestopps
Pufferprobleme
oder Fehler verursachen.
Kurz gesagt:
Eine SD-Karte speichert Fotos und Videos direkt in der Kamera.
SDXL steht für Stable Diffusion XL und ist eine modernere, deutlich leistungsstärkere Version von Stable Diffusion.
Im Vergleich zu älteren Modellen wie SD 1.5 erzeugt SDXL:
höhere Bildqualität
bessere Lichtstimmungen
realistischere Details
sauberere Anatomie
deutlich bessere Textverständnis
Vor allem bei:
Portraits
Cinematic Looks
komplexen Szenen
professionellen Artworks
liefert SDXL meist sichtbar bessere Ergebnisse.
Der Nachteil:
SDXL benötigt deutlich mehr Leistung und VRAM. Ältere Grafikkarten kommen damit oft an ihre Grenzen.
Viele bekannte Realismus-Checkpoints wie:
Juggernaut XL
CyberRealistic XL
reaZit
basieren direkt auf SDXL.
Kurz gesagt:
SDXL ist die „große“ und deutlich modernere Generation von Stable Diffusion.
Der Seed ist die Zufallszahl, mit der eine KI ein Bild erzeugt. Er bestimmt den Ausgangspunkt des Bildrauschens, aus dem später das fertige Bild entsteht.
Mit demselben:
Modell
Prompt
Einstellungen
und Seed
entsteht normalerweise fast exakt dasselbe Bild erneut.
Ändert man nur den Seed, bleibt die Grundidee oft ähnlich, aber:
Pose
Gesichtsausdruck
Bildaufbau
Details
Lighting
können sich stark verändern.
Deshalb nutzen viele Künstler Seeds:
um gute Ergebnisse später wiederzufinden
Varianten eines Bildes zu erzeugen
bestimmte Kompositionen weiterzuentwickeln
Ein zufälliger Seed wird oft mit -1 erzeugt.
Kurz gesagt:
Der Seed ist der „Zufallsstartpunkt“ eines KI-Bildes. Er entscheidet, wie die KI ihre Bildidee konkret umsetzt.
Das Seitenverhältnis beschreibt das Verhältnis von Bildbreite zu Bildhöhe.
Es bestimmt die Form eines Bildes oder Videos.
Typische Seitenverhältnisse:
3:2 → klassische Fotografie
4:3 → viele Smartphones und ältere Kameras
16:9 → Video und moderne Displays
1:1 → quadratische Social-Media-Formate
4:5 → häufig für Instagram-Posts
Das Seitenverhältnis beeinflusst:
Bildkomposition
Bildwirkung
Zuschnitt
Platzierung von Motiven
Viele Kameras erlauben unterschiedliche Seitenverhältnisse direkt bei der Aufnahme oder später per Cropping.
Kurz gesagt:
Das Seitenverhältnis bestimmt die Form und Proportion eines Bildes oder Videos.
Sensorreinigung entfernt Staub oder Verschmutzungen vom Bildsensor einer Kamera.
Verschmutzte Sensoren verursachen oft:
dunkle Flecken
Punkte
sichtbare Schatten
besonders bei:
kleinen Blenden
hellem Himmel
gleichmäßigen Flächen
Staub gelangt häufig beim Objektivwechsel in die Kamera.
Viele moderne Kameras besitzen:
automatische Sensorvibration
integrierte Reinigungsfunktionen
Stärkere Verschmutzungen werden oft entfernt mit:
Blasebalg
Sensor-Swabs
speziellen Reinigungskits
Der Nachteil:
Unsachgemäße Reinigung kann den Sensor beschädigen.
Kurz gesagt:
Sensorreinigung entfernt Staub und Schmutz vom Kamerasensor, um Bildfehler zu vermeiden.
Der Serienbildmodus erlaubt es, mehrere Fotos schnell hintereinander aufzunehmen, solange der Auslöser gedrückt wird.
Die Kamera erstellt dabei eine Bildserie mit hoher Geschwindigkeit.
Der Serienbildmodus wird häufig genutzt bei:
Sport
Wildlife
Action
Konzerten
schnellen Bewegungen
Die Geschwindigkeit wird meist in:
Bildern pro Sekunde (FPS)
angegeben.
Moderne Kameras erreichen teilweise:
10
20
oder sogar über 100 Bilder pro Sekunde
Der Vorteil:
Höhere Chance, den perfekten Moment einzufangen.
Der Nachteil:
Große Datenmengen und schneller gefüllte Speicherpuffer.
Kurz gesagt:
Der Serienbildmodus erstellt viele Fotos direkt hintereinander für schnelle oder bewegte Motive.
Soft Proofing ist die digitale Vorschau eines Druckergebnisses auf dem Monitor.
Dabei wird simuliert, wie ein Bild später auf Papier aussehen wird, inklusive:
Farbverschiebungen
Kontrastverlust
begrenztem Farbraum
Papiercharakteristik
Soft Proofing wird vor allem genutzt bei:
Fine-Art-Druck
professioneller Bildbearbeitung
Farbmanagement-Workflows
Es hilft dabei, Probleme frühzeitig zu erkennen, bevor das Bild tatsächlich gedruckt wird.
Typische Anpassungen beim Soft Proofing:
Farbprofil des Druckers
Papierart
Helligkeitsanpassung
Programme wie:
Adobe Lightroom
Adobe Photoshop
unterstützen Soft Proofing direkt.
Kurz gesagt:
Soft Proofing simuliert den späteren Druck eines Bildes auf dem Bildschirm.
Eine spiegellose Kamera ist eine Digitalkamera ohne mechanischen Spiegel wie bei einer DSLR.
Das Bild wird stattdessen direkt vom Sensor an:
den elektronischen Sucher
oder das Display
übertragen.
Spiegellose Kameras bieten häufig:
kompaktere Bauweise
schnelleren Autofokus
moderne Video-Funktionen
lautloses Fotografieren
Echtzeit-Vorschau der Belichtung
Sie haben klassische DSLRs in vielen Bereichen inzwischen weitgehend ersetzt.
Besonders beliebt sind spiegellose Systeme bei:
Portraits
Video
Wildlife
Reisen
professioneller Fotografie
Der Nachteil:
Elektronische Sucher benötigen mehr Strom und manche ältere Modelle hatten kürzere Akkulaufzeiten.
Kurz gesagt:
Eine spiegellose Kamera arbeitet ohne Spiegelmechanismus und zeigt das Bild direkt digital an.
Spotmessung ist eine Belichtungsmessmethode, bei der die Kamera nur einen sehr kleinen Bereich des Bildes misst.
Dadurch kann die Belichtung gezielt auf ein bestimmtes Motiv abgestimmt werden, zum Beispiel:
ein Gesicht
ein Auge
eine Lichtquelle
ein einzelnes Objekt
Spotmessung wird häufig genutzt bei:
Gegenlicht
Bühnenfotografie
Wildlife
starkem Kontrast
schwierigen Lichtsituationen
Der Vorteil:
Sehr präzise Kontrolle über die Belichtung wichtiger Bildbereiche.
Der Nachteil:
Falsches Platzieren der Messung führt schnell zu über- oder unterbelichteten Bildern.
Kurz gesagt:
Spotmessung misst die Belichtung nur in einem kleinen ausgewählten Bildbereich.
Stable Diffusion ist eine der bekanntesten KI-Technologien zur Bildgenerierung. Sie erzeugt Bilder aus Texteingaben, sogenannten Prompts.
Die Besonderheit:
Stable Diffusion läuft lokal auf dem eigenen Rechner und ist größtenteils Open Source. Dadurch entstanden unzählige eigene Modelle, LoRAs, Tools und Community-Projekte.
Bekannte Programme wie:
Automatic1111
ComfyUI
InvokeAI
Draw Things
basieren direkt auf Stable Diffusion.
Technisch arbeitet Stable Diffusion mit einem sogenannten Diffusionsprozess. Die KI startet mit reinem Bildrauschen und „entschlüsselt“ daraus Schritt für Schritt ein fertiges Bild.
Seit der ersten Version entstanden viele Varianten:
SD 1.5
SDXL
Pony
Flux-basierte Workflows
hunderte Community-Checkpoints
Stable Diffusion war einer der Hauptgründe dafür, dass lokale KI-Bildgenerierung überhaupt massentauglich wurde.
Kurz gesagt:
Stable Diffusion ist die Grundlage eines großen Teils der modernen AI-Art- und KI-Bildszene.
Ein Stativ stabilisiert die Kamera und verhindert Verwacklungen bei Aufnahmen.
Es wird besonders genutzt bei:
Langzeitbelichtungen
Nachtfotografie
Landschaften
Studioaufnahmen
Video
Makro
Durch ein Stativ lassen sich:
längere Belichtungszeiten
präzisere Bildkompositionen
gleichbleibende Perspektiven
ermöglichen.
Es gibt verschiedene Arten:
Dreibeinstative
Einbeinstative
Tischstative
Videostative
Wichtige Eigenschaften sind:
Stabilität
Gewicht
maximale Höhe
Tragkraft
Der Nachteil:
Stative machen das Equipment größer und weniger mobil.
Kurz gesagt:
Ein Stativ stabilisiert die Kamera für verwacklungsfreie und präzise Aufnahmen.
Stitching bezeichnet das Zusammenfügen mehrerer Einzelbilder zu einem größeren Gesamtbild.
Dabei werden die Bilder so kombiniert, dass ein nahtloses Panorama oder eine hochauflösende Gesamtaufnahme entsteht.
Typische Anwendungen:
Panoramafotografie
360°-Bilder
hochauflösende Landschaftsaufnahmen
Architekturaufnahmen
Die Einzelbilder werden dabei so aufgenommen, dass sie sich leicht überlappen, damit Software die Übergänge berechnen kann.
Moderne Programme erkennen:
Kanten
Perspektiven
Helligkeitsunterschiede
und verbinden die Bilder automatisch.
Kurz gesagt:
Stitching ist das digitale Zusammensetzen mehrerer Fotos zu einem großen Gesamtbild.
Style Consistency bedeutet, dass mehrere KI-Bilder denselben visuellen Stil beibehalten.
Dazu gehören zum Beispiel:
Farben
Lighting
Gesichter
Kleidung
Kamera-Look
Bildstimmung
Rendering-Stil
Gute Style Consistency ist wichtig für:
Bildserien
Comics
Charaktere
Storyboards
Social-Media-Projekte
Games
Videos
Schlechte Consistency erkennt man daran, dass:
Gesichter ständig wechseln
Farben plötzlich anders wirken
Charaktere „eine andere Person“ werden
der Stil zwischen Bildern springt
Verbessert wird Style Consistency oft durch:
feste Seeds
Referenzbilder
LoRAs
IP-Adapter
ControlNet
genaue Prompts
Besonders moderne Modelle und Bildbearbeitungssysteme werden zunehmend darauf optimiert.
Kurz gesagt:
Style Consistency sorgt dafür, dass mehrere KI-Bilder wie Teil derselben Bildserie oder Welt wirken.
Ein Substep ist ein zusätzlicher Zwischenschritt innerhalb eines normalen Generierungsschritts bei der KI-Bildberechnung.
Manche Sampler oder Solver teilen einzelne Schritte intern weiter auf, um:
präzisere Berechnungen
stabilere Ergebnisse
bessere Details
weniger Fehler
zu erreichen.
Dadurch kann die Bildentwicklung:
genauer
weicher
oder kontrollierter
ablaufen.
Substeps spielen vor allem bei:
modernen Samplern
mathematischen Solver-Verfahren
High-Quality-Rendern
eine Rolle.
Für normale Nutzer bleiben Substeps meist im Hintergrund, weil viele Tools sie automatisch verwalten.
Mehr Substeps bedeuten allerdings oft:
längere Renderzeiten
höhere Rechenlast
Kurz gesagt:
Substeps sind zusätzliche interne Zwischenschritte, die die KI-Bildberechnung präziser und stabiler machen sollen.
Ein Sucher bzw. Viewfinder ist die Vorrichtung einer Kamera, durch die der Fotograf das Motiv betrachtet.
Der Sucher hilft bei:
Bildkomposition
Fokus
Belichtungskontrolle
Motivverfolgung
Es gibt verschiedene Arten:
optischer Sucher (OVF)
elektronischer Sucher (EVF)
Optische Sucher zeigen das Motiv direkt durch das Objektiv oder ein Prismensystem.
Elektronische Sucher zeigen ein digitales Livebild vom Sensor und können zusätzlich Informationen anzeigen wie:
Histogramm
Fokus-Peaking
Belichtungsvorschau
Moderne spiegellose Kameras nutzen meist elektronische Sucher.
Kurz gesagt:
Ein Viewfinder ist der Sucher einer Kamera zur Bildkontrolle und Komposition vor der Aufnahme.

TCD

TCD steht meist für Trajectory Consistency Distillation. Das ist eine moderne Technik, mit der KI-Modelle auch mit sehr wenigen Steps noch hochwertige Bilder erzeugen können.
Die Idee dahinter:
Das Modell lernt effizientere Bildentwicklungspfade, sodass weniger Generierungsschritte nötig sind.
Dadurch lassen sich:
schnellere Renderzeiten
gute Bildqualität
stabile Details
flüssigere Workflows
erreichen.
TCD wird häufig genutzt bei:
SDXL-Turbo-Workflows
Echtzeit-Generierung
schnellen Preview-Rendern
modernen High-Speed-Modellen
Der Vorteil:
Teilweise reichen schon wenige Steps für brauchbare Ergebnisse.
Der Nachteil:
Zu aggressive Beschleunigung kann:
Details reduzieren
Bilder weicher machen
oder kreative Variation verringern
Kurz gesagt:
TCD ist eine Technik zur Beschleunigung von KI-Bildgenerierung, damit auch mit wenigen Steps noch gute Ergebnisse entstehen.
Ein Telekonverter ist ein Zubehörteil, das zwischen Kamera und Objektiv eingesetzt wird, um die Brennweite zu verlängern.
Dadurch wirken entfernte Motive näher.
Typische Varianten:
1.4x
2x
Beispiel:
200mm mit 2x-Konverter → ungefähr 400mm
Telekonverter werden häufig genutzt bei:
Wildlife
Sport
Naturfotografie
Der Vorteil:
Mehr Reichweite ohne komplett neues Teleobjektiv.
Der Nachteil:
Telekonverter reduzieren meist:
Lichtstärke
Autofokus-Geschwindigkeit
teilweise auch Bildqualität
Besonders starke Konverter können Schärfe und Kontrast sichtbar verschlechtern.
Kurz gesagt:
Ein Telekonverter verlängert die Brennweite eines Objektivs für mehr Reichweite.
Ein Teleobjektiv besitzt eine lange Brennweite und vergrößert entfernte Motive.
Typische Brennweiten:
85mm
135mm
200mm
400mm und mehr
Teleobjektive werden häufig genutzt bei:
Wildlife
Sport
Konzertfotografie
Portraits
Naturaufnahmen
Typische Eigenschaften:
starke Hintergrundunschärfe
komprimierte Perspektive
große Motivtrennung
Lange Teleobjektive ermöglichen Aufnahmen aus großer Entfernung, ohne nah ans Motiv herangehen zu müssen.
Der Nachteil:
Teleobjektive sind oft:
größer
schwerer
lichtempfindlicher gegenüber Verwacklungen
Deshalb werden häufig:
Bildstabilisierung
hohe Verschlusszeiten
oder Stative
verwendet.
Kurz gesagt:
Ein Teleobjektiv holt entfernte Motive optisch näher heran und erzeugt starke Hintergrundunschärfe.
Ein Teleobjektiv besitzt eine lange Brennweite und vergrößert entfernte Motive.
Typische Brennweiten:
85mm
135mm
200mm
400mm und mehr
Teleobjektive werden häufig genutzt bei:
Wildlife
Sport
Konzertfotografie
Portraits
Naturaufnahmen
Typische Eigenschaften:
starke Hintergrundunschärfe
komprimierte Perspektive
große Motivtrennung
Lange Teleobjektive ermöglichen Aufnahmen aus großer Entfernung, ohne nah ans Motiv herangehen zu müssen.
Der Nachteil:
Teleobjektive sind oft:
größer
schwerer
lichtempfindlicher gegenüber Verwacklungen
Deshalb werden häufig:
Bildstabilisierung
hohe Verschlusszeiten
oder Stative
verwendet.
Kurz gesagt:
Ein Teleobjektiv holt entfernte Motive optisch näher heran und erzeugt starke Hintergrundunschärfe.
Temporal Consistency bedeutet, dass Inhalte über mehrere Bilder oder Video-Frames hinweg stabil bleiben.
Besonders wichtig ist das bei:
KI-Videos
Animationen
Frame-by-Frame-Generierung
bewegten Charakteren
Ohne gute Temporal Consistency verändern sich zwischen einzelnen Frames oft:
Gesichter
Kleidung
Farben
Lichtstimmungen
Hintergründe
Proportionen
Das führt zu typischem:
Flackern
Zittern
„Morphing“
unstabilen Bewegungen
Moderne KI-Video-Modelle versuchen deshalb gezielt:
Charaktere stabil zu halten
Bewegungen flüssiger zu machen
Bilddetails zwischen Frames zu synchronisieren
Verbessert wird Temporal Consistency oft durch:
Referenzframes
Motion-Tracking
Optical Flow
spezielle Video-Modelle
Kurz gesagt:
Temporal Consistency sorgt dafür, dass KI-Inhalte über mehrere Frames hinweg stabil und zusammenhängend bleiben.
Tethered Shooting bedeutet, dass eine Kamera während der Aufnahme direkt mit einem Computer, Tablet oder anderen Gerät verbunden ist.
Die Fotos werden dabei sofort übertragen und können direkt auf einem größeren Bildschirm betrachtet werden.
Tethered Shooting wird häufig genutzt bei:
Studiofotografie
Fashion
Produktfotografie
Werbeproduktionen
Kunden-Shootings
Vorteile:
sofortige Bildkontrolle
bessere Schärfeprüfung
direkte Zusammenarbeit mit Kunden oder Teams
effizienterer Workflow
Die Verbindung erfolgt meist über:
USB
WLAN
spezielle Apps oder Software
Beliebte Programme dafür sind:
Adobe Lightroom
Capture One
Kurz gesagt:
Tethered Shooting überträgt Fotos während des Shootings direkt von der Kamera auf einen Computer oder Monitor.
Der Text Encoder ist der Teil eines KI-Modells, der den geschriebenen Prompt „versteht“ und in Informationen für die Bild-KI umwandelt.
Er analysiert zum Beispiel:
Begriffe
Zusammenhänge
Stimmungen
Bildbeschreibungen
Gewichtungen im Prompt
Erst danach kann das eigentliche Bildmodell daraus ein Bild erzeugen.
Vereinfacht:
Text Encoder = versteht den Prompt
UNet = erzeugt daraus das Bild
Unterschiedliche Text Encoder beeinflussen oft stark:
Prompt-Treue
Stilverständnis
Sprachverständnis
komplexe Szenen
Umgang mit natürlicher Sprache
Gerade moderne Modelle wie Flux nutzen deutlich leistungsfähigere Text Encoder als ältere Stable-Diffusion-Versionen.
Der Nachteil:
Wenn der Text Encoder schlecht abgestimmt ist, versteht die KI zwar einzelne Wörter, aber nicht die eigentliche Bildidee.
Kurz gesagt:
Der Text Encoder übersetzt den Prompt in eine Form, die das KI-Modell überhaupt erst „verarbeiten“ kann.
Textual Inversion ist eine Methode, um einer KI neue Begriffe oder Konzepte beizubringen, ohne das komplette Modell neu zu trainieren.
Dabei lernt die KI:
* einen bestimmten Stil
* ein Gesicht
* ein Objekt
* oder eine Bildstimmung
unter einem neuen künstlichen Begriff oder Token kennen.
Beispiel:
Ein spezieller Begriff wie myStyle123 könnte später im Prompt verwendet werden, um genau diesen trainierten Look aufzurufen.
Textual Inversion war besonders in frühen Stable-Diffusion-Zeiten beliebt, weil:
* wenig Speicher benötigt wurde
* das Training relativ leicht war
* kleine Dateien entstanden
Technisch gehören viele Embeddings genau in diesen Bereich.
Der Nachteil:
Die Kontrolle und Qualität sind oft begrenzter als bei modernen LoRAs oder DreamBooth-Trainings.
Heute wird Textual Inversion deshalb seltener genutzt, existiert aber weiterhin für bestimmte Spezialfälle.
Kurz gesagt:
Textual Inversion bringt einer KI neue Begriffe oder Stile bei, die später wie normale Wörter im Prompt verwendet werden können.
Tiefenschärfe und Schärfentiefe werden im Alltag oft gleich verwendet, beschreiben technisch aber unterschiedliche Dinge.
Schärfentiefe beschreibt den Bereich im Raum, der im Bild scharf abgebildet wird:
von nah bis fern
abhängig von Blende, Brennweite und Abstand
Tiefenschärfe wird häufig synonym genutzt, ist technisch gesehen aber eher der subjektive Eindruck der Schärfeverteilung im Bild.
In der Praxis bedeutet das:
große Schärfentiefe → viel im Bild ist scharf
geringe Schärfentiefe → nur ein kleiner Bereich ist scharf
Besonders wichtig ist diese Unterscheidung bei:
Portraitfotografie
Makrofotografie
Offenblende-Arbeiten
Kurz gesagt:
Schärfentiefe beschreibt den physikalischen Schärfebereich, Tiefenschärfe wird oft als praktische Wahrnehmung davon genutzt.
Tile oder Tiled Diffusion teilt große Bilder in kleinere Bereiche auf, die einzeln verarbeitet werden.
Dadurch werden:
riesige Auflösungen
weniger VRAM-Verbrauch
detailliertere Bilder
möglich.
Kurz gesagt:
Tiled Diffusion verarbeitet große Bilder stückweise für höhere Auflösungen und bessere Speicherverwaltung.
Tilt-Shift bezeichnet eine spezielle Objektivtechnik, bei der sich Teile des Objektivs gezielt verschieben oder kippen lassen.
Dadurch können:
Perspektiven korrigiert
Schärfeebenen verändert
oder kreative Effekte erzeugt
werden.
Shift
korrigiert stürzende Linien
besonders wichtig bei Architektur
Tilt
verändert die Schärfeebene
ermöglicht ungewöhnliche Fokus-Effekte
Tilt-Shift-Objektive werden häufig genutzt bei:
Architektur
Produktfotografie
Landschaften
Miniatureffekt-Aufnahmen
Der Nachteil:
Tilt-Shift-Objektive sind meist:
teuer
manuell
und technisch anspruchsvoll
Kurz gesagt:
Tilt-Shift-Objektive erlauben gezielte Perspektiv- und Schärfe-Kontrolle für technische oder kreative Effekte.
Ein Time-Lapse ist ein Video, das aus vielen Einzelbildern besteht, die in größeren Zeitabständen aufgenommen wurden.
Beim späteren Abspielen wirkt die Zeit stark beschleunigt.
Dadurch werden langsame Bewegungen sichtbar, zum Beispiel:
Wolkenbewegungen
Sonnenuntergänge
Verkehr
Sternenhimmel
Menschenmengen
Pflanzenwachstum
Die Einzelbilder entstehen meist über:
Intervallaufnahmen
spezielle Kamera-Funktionen
oder externe Timer
Time-Lapse wird häufig genutzt bei:
Naturfilmen
Dokumentationen
Cinematic Videos
Social Media
Stadtaufnahmen
Für ruhige Ergebnisse verwendet man oft:
Stative
gleichmäßige Belichtung
stabile Wetterbedingungen
Kurz gesagt:
Ein Time-Lapse beschleunigt langsame Abläufe durch viele automatisch aufgenommene Einzelbilder.
Ein Token ist eine kleine Texteinheit, die ein KI-Modell verarbeitet.
Prompts werden intern in Tokens zerlegt, damit die KI sie verstehen kann.
Zu viele Tokens können:
abgeschnitten werden
Promptteile ignorieren
Performance beeinflussen
Kurz gesagt:
Tokens sind die kleinen Spracheinheiten, mit denen KI-Modelle Prompts verarbeiten.
Trailing ist eine spezielle Scheduler- beziehungsweise Noise-Schedule-Variante, die bei manchen modernen KI-Modellen verwendet wird.
Dabei wird das Bildrauschen gegen Ende der Generierung anders verteilt als bei klassischen Schedules wie Karras oder Exponential.
Das Ziel:
stabilere Details
sauberere Bildentwicklung
bessere Prompt-Treue
natürlicheres Rendering
Vor allem bei neueren Modellen wie:
Flux
reaZit
modernen SDXL-Finetunes
taucht Trailing häufiger auf.
Viele Nutzer empfinden Trailing als:
harmonischer
weniger überschärft
natürlicher bei Haut und Lighting
Der Nachteil:
Nicht jeder Sampler oder jedes Tool unterstützt Trailing korrekt. Außerdem sind die Unterschiede für Anfänger oft subtil.
Kurz gesagt:
Trailing ist ein moderner Noise Schedule, der die Bildentwicklung besonders in den letzten Generierungsschritten beeinflusst.
Eine Training Epoch beschreibt einen vollständigen Durchlauf aller Trainingsbilder während des KI-Trainings.
Vereinfacht gesagt:
Die KI schaut sich bei jeder Epoch den gesamten Trainingsdatensatz einmal komplett an.
Beim Training von:
LoRAs
DreamBooth
Embeddings
eigenen Modellen
bestimmt die Anzahl der Epochs, wie intensiv die KI das Material „lernt“.
Zu wenige Epochs:
Stil wird kaum erkannt
Charaktere wirken instabil
Details fehlen
Zu viele Epochs:
Overfitting
Bilder wirken kopiert
wenig Flexibilität
unnatürliche Ergebnisse
Deshalb gehört die richtige Epoch-Anzahl zu den wichtigsten Einstellungen beim Training.
Viele Nutzer speichern zusätzlich sogenannte Checkpoints nach bestimmten Epochs, um später die beste Version auswählen zu können.
Kurz gesagt:
Eine Epoch ist ein kompletter Lerndurchlauf aller Trainingsbilder während des KI-Trainings.
Überbelichtung bedeutet, dass ein Bild zu hell aufgenommen wurde.
Dabei trifft zu viel Licht auf den Kamerasensor, wodurch helle Bereiche:
ausfressen
Details verlieren
komplett weiß erscheinen können
Überbelichtung entsteht häufig durch:
zu lange Belichtungszeit
zu hohe ISO
zu offene Blende
falsche Belichtungsmessung
Besonders kritisch sind überbelichtete Highlights, da verlorene Bilddetails oft nicht mehr vollständig wiederhergestellt werden können.
Manche Fotografen nutzen leichte Überbelichtung allerdings bewusst als kreativen Stil für:
helle Portraits
High-Key-Looks
weiche Bildstimmungen
Kurz gesagt:
Überbelichtung bedeutet, dass ein Bild durch zu viel Licht zu hell wird und Details verliert.
Unconditional Generation bedeutet, dass eine KI Bilder ohne konkreten Prompt oder Vorgaben erzeugt.
Die KI generiert dabei Inhalte nur auf Basis dessen, was sie während des Trainings gelernt hat — ohne:
Texteingabe
Referenzbild
ControlNet
zusätzliche Steuerung
Das Ergebnis ist meist stark zufallsbasiert.
Solche Generierung wird vor allem genutzt für:
Forschung
Modelltests
kreative Exploration
Analyse von Trainingsdaten
Im normalen Alltag der KI-Bildgenerierung spielt Unconditional Generation eher eine kleine Rolle, weil moderne Tools fast immer mit Prompts arbeiten.
Technisch ist das Konzept trotzdem wichtig, weil viele Diffusionsmodelle genau zwischen:
„mit Vorgabe“
und „ohne Vorgabe“
arbeiten. Daraus entstand später auch CFG (Classifier Free Guidance).
Kurz gesagt:
Unconditional Generation bedeutet, dass eine KI Bilder komplett ohne Prompt oder andere Eingaben erzeugt.
Das UNet ist der eigentliche „Bildgenerator“ innerhalb vieler KI-Bildmodelle wie Stable Diffusion.
Während andere Bestandteile:
den Prompt verstehen
Farben verarbeiten
Daten vorbereiten
ist das UNet hauptsächlich dafür zuständig, aus dem Bildrauschen Schritt für Schritt ein echtes Bild zu erzeugen.
Man kann vereinfacht sagen:
Das UNet ist der Teil der KI, der tatsächlich „zeichnet“.
Es entscheidet unter anderem:
Formen
Strukturen
Details
Beleuchtung
Bildaufbau
Deshalb beeinflussen Änderungen am UNet oft den gesamten Stil und die Bildqualität eines Modells.
Viele moderne Finetunes und Checkpoints bestehen im Kern aus angepassten UNet-Gewichten.
Kurz gesagt:
Das UNet ist die zentrale Bild-Engine eines KI-Modells und erzeugt aus Rauschen das eigentliche Bild.
UniPC ist ein moderner Sampler für KI-Bildgenerierung mit Fokus auf hohe Qualität und effiziente Berechnung.
Der Name steht für Unified Predictor-Corrector.
UniPC wurde entwickelt, um:
schneller
stabiler
und qualitativ hochwertiger
zu arbeiten als viele ältere Sampler.
Typisch für UniPC:
saubere Details
gute Prompt-Treue
stabile Anatomie
weiche, natürliche Ergebnisse
gute Qualität bei wenigen Steps
Deshalb wird UniPC häufig genutzt für:
SDXL
Flux
realistische Portraits
hochwertige Final-Render
Viele Nutzer empfinden UniPC als eine gute Mischung aus:
Geschwindigkeit
Stabilität
und Bildqualität
Der Nachteil:
Je nach Modell wirkt UniPC manchmal etwas „zu glatt“ oder weniger kreativ als chaotischere Sampler wie Euler A.
Kurz gesagt:
UniPC ist ein moderner High-Quality-Sampler mit guter Balance aus Geschwindigkeit, Stabilität und Bildqualität.
Unterbelichtung bedeutet, dass ein Bild zu dunkel aufgenommen wurde.
Dabei erreicht zu wenig Licht den Kamerasensor, wodurch dunkle Bereiche:
Details verlieren
absaufen
oder komplett schwarz wirken können
Unterbelichtung entsteht häufig durch:
zu kurze Belichtungszeit
zu niedrige ISO
zu geschlossene Blende
falsche Belichtungsmessung
Starke Unterbelichtung führt oft zu:
mehr Bildrauschen
verlorenen Schatteninformationen
schlechterer Bildqualität beim Aufhellen
Manche Fotografen nutzen Unterbelichtung bewusst für:
düstere Stimmung
Silhouetten
Low-Key-Fotografie
cineastische Looks
Kurz gesagt:
Unterbelichtung bedeutet, dass ein Bild durch zu wenig Licht zu dunkel wird und Details verliert.
Ein Upscaler vergrößert ein Bild mithilfe von KI, ohne dass es einfach nur unscharf hochskaliert wird.
Dabei versucht die KI:
neue Details zu ergänzen
Kanten zu schärfen
Haut, Haare und Texturen sauberer wirken zu lassen
Artefakte zu reduzieren
Upscaler werden oft genutzt:
für höhere Auflösungen
Drucke
Social Media
Detailverbesserungen nach der Bildgenerierung
Bekannte Upscaler sind zum Beispiel:
4x UltraSharp
ESRGAN
Remacri
Topaz Gigapixel
Der Nachteil:
Zu aggressive Upscaler können Bilder künstlich wirken lassen. Haut wird schnell plastikartig und feine Details sehen manchmal „erfunden“ statt echt aus.
Viele erfahrene Nutzer generieren deshalb lieber direkt in hoher Auflösung, statt sich komplett auf Upscaling zu verlassen.
Kurz gesagt:
Ein Upscaler vergrößert Bilder mit KI und versucht dabei, zusätzliche Details glaubwürdig zu ergänzen.

USB

USB steht für Universal Serial Bus und ist ein weit verbreiteter Anschlussstandard für Datenübertragung und Stromversorgung.
In der Fotografie wird USB häufig genutzt für:
Bildübertragung
Tethered Shooting
Firmware-Updates
Akku-Ladung
Anschluss von Zubehör
Moderne Kameras verwenden meist:
USB-C
ältere Modelle oft Micro-USB oder Mini-USB
Über USB können Kameras direkt mit:
Computern
Smartphones
Tablets
externen Speichern
verbunden werden.
Schnelle USB-Standards sind besonders wichtig bei:
RAW-Dateien
Videoaufnahmen
großen Datenmengen
Studio-Workflows
Kurz gesagt:
USB verbindet Kameras mit anderen Geräten für Datenübertragung, Stromversorgung und Zubehör.

VAE

VAE steht für Variational Autoencoder. Klingt kompliziert, ist aber im Grunde nur ein Bestandteil der KI, der Farben, Kontraste und Details beim fertigen Bild beeinflusst.
Ein anderes VAE kann dafür sorgen, dass Bilder:
kräftigere Farben haben
weniger ausgewaschen wirken
bessere Hauttöne bekommen
sauberer oder kontrastreicher aussehen
Gerade bei älteren Stable-Diffusion-Modellen war das wichtig, weil manche Bilder ohne passendes VAE grau, flach oder „milchig“ aussahen.
Viele moderne Checkpoints haben heute bereits ein eigenes VAE integriert. Trotzdem nutzen manche Nutzer weiterhin separate VAEs für bestimmte Looks.
Kurz gesagt:
Das VAE beeinflusst hauptsächlich, wie das fertige Bild visuell „entwickelt“ wird — ähnlich wie ein Farbprofil oder eine digitale Filmentwicklung.
Der Verschluss steuert, wie lange Licht auf den Kamerasensor fällt.
Er öffnet und schließt sich während der Aufnahme und bestimmt damit die Belichtungszeit.
Kurze Verschlusszeiten:
frieren Bewegungen ein
eignen sich für Sport oder Action
Lange Verschlusszeiten:
erzeugen Bewegungsunschärfe
ermöglichen Langzeitbelichtungen
Es gibt verschiedene Verschlussarten:
mechanischer Verschluss
elektronischer Verschluss
Zentralverschluss
Der Verschluss beeinflusst unter anderem:
Bildhelligkeit
Bewegungsdarstellung
Blitzsynchronisation
Kurz gesagt:
Der Verschluss kontrolliert die Dauer der Belichtung und damit die Lichtmenge auf dem Sensor.
Die Verschlusszeit beschreibt, wie lange der Kameraverschluss geöffnet bleibt und Licht auf den Sensor fällt.
Sie wird meist in Sekunden oder Sekundenbruchteilen angegeben, zum Beispiel:
1/1000s
1/125s
1s
Kurze Verschlusszeiten:
frieren Bewegungen ein
eignen sich für Sport, Wildlife oder Action
Lange Verschlusszeiten:
erzeugen Bewegungsunschärfe
ermöglichen Langzeitbelichtungen
zeigen Lichtspuren oder weiches Wasser
Die Verschlusszeit beeinflusst außerdem:
Bildhelligkeit
Verwacklungsgefahr
Bewegungsdarstellung
Zusammen mit:
Blende
ISO
gehört sie zum Belichtungsdreieck.
Kurz gesagt:
Die Verschlusszeit bestimmt, wie lange Licht auf den Sensor trifft und wie Bewegung im Bild dargestellt wird.
Verzeichnung beschreibt optische Verzerrungen, bei denen gerade Linien im Bild nicht mehr gerade erscheinen.
Typische Formen:
Tonnenverzeichnung → Linien biegen sich nach außen
Kissenverzeichnung → Linien biegen sich nach innen
Verzerrung durch Perspektive → starke Schrägen bei Weitwinkel
Verzeichnung entsteht vor allem durch:
Objektivkonstruktion
Weitwinkelobjektive
günstige Linsen
starke Bildbearbeitung
Besonders sichtbar ist sie bei:
Architektur
Architekturdetails
Gittern, Gebäuden, Kanten
Moderne Kameras und Software korrigieren Verzeichnung oft automatisch.
Kurz gesagt:
Verzeichnung ist eine optische Verzerrung, bei der gerade Linien im Bild gebogen dargestellt werden.
Vignettierung beschreibt eine Abdunklung der Bildränder im Vergleich zur Bildmitte.
Sie entsteht häufig durch:
Objektive
offene Blenden
Filter
Gegenlichtblenden
optische Konstruktionen
Leichte Vignettierung tritt besonders oft auf bei:
Weitwinkelobjektiven
lichtstarken Objektiven
Offenblende
Manche Fotografen empfinden sie als störenden Bildfehler, andere nutzen sie bewusst für:
stärkere Bildwirkung
Blickführung
cineastische Looks
Vintage-Stil
Moderne Kameras und Bildbearbeitungsprogramme können Vignettierung oft automatisch korrigieren.
Kurz gesagt:
Vignettierung ist eine Abdunklung der Bildränder, die durch Objektiv oder Zubehör entstehen kann.
Ein Vollformatsensor ist ein großer Kamerasensor mit ungefähr derselben Größe wie klassischer 35mm-Kleinbildfilm.
Er misst etwa:
36 × 24 mm
Vollformatkameras bieten häufig:
hohe Bildqualität
starken Dynamikumfang
bessere Low-Light-Performance
geringere Schärfentiefe
stärkeres Bokeh
Deshalb werden sie besonders genutzt bei:
Portraits
Fashion
Reportage
Werbung
professioneller Fotografie
Im Vergleich zu APS-C oder Micro Four Thirds wirken Brennweiten auf Vollformat „natürlicher“, da kein zusätzlicher Crop-Faktor entsteht.
Der Nachteil:
Vollformatkameras und Objektive sind oft:
größer
schwerer
teurer
Kurz gesagt:
Ein Vollformatsensor entspricht der klassischen Kleinbildgröße und bietet besonders hohe Bildqualität und Freistellungsmöglichkeiten.
VRAM ist der Videospeicher einer Grafikkarte und einer der wichtigsten Faktoren für KI-Bildgenerierung.
Mehr VRAM ermöglicht:
größere Modelle
höhere Auflösungen
komplexere Workflows
mehr ControlNets
schnellere Verarbeitung
Zu wenig VRAM führt oft zu:
Abstürzen
extrem langsamen Renderzeiten
Speicherfehlern
Kurz gesagt:
VRAM ist der Arbeitsspeicher der Grafikkarte und entscheidend für KI-Performance.
Der Weißabgleich sorgt dafür, dass Farben unter unterschiedlichen Lichtquellen natürlich wirken.
Da verschiedene Lichtarten unterschiedliche Farbtemperaturen besitzen, kann ein Bild sonst:
zu warm
zu kalt
oder farbstichig
wirken.
Beispiele:
Glühlampen → warm/orange
Schatten → kühl/bläulich
Tageslicht → neutraler
Der Weißabgleich passt die Farbdarstellung entsprechend an.
Es gibt:
automatischen Weißabgleich
feste Presets
manuellen Weißabgleich
Besonders wichtig ist er bei:
Portraits
Produktfotografie
Mischlicht
Studioaufnahmen
RAW-Dateien erlauben später deutlich flexiblere Anpassungen des Weißabgleichs.
Kurz gesagt:
Der Weißabgleich korrigiert Farbtemperaturen, damit Farben natürlich dargestellt werden.
Ein Weitwinkelobjektiv besitzt eine kurze Brennweite und erfasst einen großen Bildwinkel.
Typische Brennweiten:
14mm
24mm
35mm
Weitwinkelobjektive werden häufig genutzt für:
Landschaften
Architektur
Innenräume
Street Photography
Vlogging
Typische Eigenschaften:
viel Umgebung im Bild
starke Perspektivwirkung
betonte Tiefenwirkung
Objekte im Vordergrund wirken oft größer und näher, während Hintergründe weiter entfernt erscheinen.
Der Nachteil:
Sehr kurze Brennweiten können sichtbare Verzerrungen erzeugen, besonders an Bildrändern.
Kurz gesagt:
Ein Weitwinkelobjektiv zeigt einen großen Bildausschnitt und erzeugt starke Perspektivwirkung.
Wildcards sind Platzhalter in Prompts, die automatisch durch zufällige Begriffe oder Textbausteine ersetzt werden.
Dadurch lassen sich schnell viele Bildvarianten erzeugen, ohne jeden Prompt manuell umzuschreiben.
Beispiel:
Statt immer neue Haarfarben einzutippen, könnte ein Prompt automatisch zufällig wählen:
blonde hair
red hair
black hair
silver hair
Wildcards werden oft genutzt für:
zufällige Charaktere
Outfit-Variationen
Prompt-Generatoren
Batch-Rendering
Inspiration
große Bildserien
Die Begriffe liegen meist in einfachen Textdateien, aus denen das Tool zufällig auswählt.
Besonders beliebt sind Wildcards in:
AUTOMATIC1111
ComfyUI
Dynamic Prompting Extensions
Der Vorteil:
Mehr Abwechslung und schnellere Variationen mit wenig Aufwand.
Der Nachteil:
Zu viele Zufallselemente machen Ergebnisse schnell unkontrollierbar oder inkonsistent.
Kurz gesagt:
Wildcards erzeugen automatisch zufällige Prompt-Variationen und helfen dabei, schnell unterschiedliche Bildideen zu generieren.
Workflows sind fertige Arbeitsabläufe für KI-Tools wie ComfyUI, InvokeAI oder andere nodebasierte Systeme.
Statt alles selbst aufzubauen, laden Nutzer komplette Workflows herunter, die bereits:
Modelle
Nodes
Einstellungen
Effekte
Bildprozesse
vorkonfiguriert enthalten.
Solche Download-Workflows können zum Beispiel:
bestimmte Bildstile erzeugen
automatische Upscaling-Pipelines enthalten
Face-Fixing übernehmen
komplexe Flux-Setups bereitstellen
Video- oder Animation-Workflows nutzen
Besonders bei ComfyUI teilen viele Nutzer komplette Workflow-Dateien online, damit andere exakt denselben Aufbau verwenden können.
Der Vorteil:
Auch komplexe KI-Setups lassen sich ohne tiefes technisches Wissen nutzen.
Der Nachteil:
Viele heruntergeladene Workflows sind chaotisch aufgebaut, schlecht dokumentiert oder funktionieren nur mit ganz bestimmten Modellversionen und Custom Nodes.
Kurz gesagt:
Workflows sind fertige KI-Arbeitsabläufe zum Download, mit denen sich komplexe Bildgenerierung und Effekte schnell übernehmen lassen.
Zero-Shot Generation bedeutet, dass eine KI Inhalte erzeugen kann, obwohl sie dafür nicht speziell trainiert wurde.
Die KI löst dabei Aufgaben allein durch ihr allgemeines Wissen aus dem ursprünglichen Training.
Beispiele:
ein völlig neuer Bildstil
unbekannte Objektkombinationen
ungewöhnliche Szenen
neue Charakterideen
ohne zusätzliches Training oder LoRAs.
Moderne Modelle wie:
Flux
DALL·E
Imagen
Midjourney
sind besonders stark bei Zero-Shot-Aufgaben, weil sie sehr große und vielseitige Trainingsdaten besitzen.
Der Vorteil:
Neue Ideen funktionieren oft sofort ohne eigenes Modelltraining.
Der Nachteil:
Die Ergebnisse können ungenau oder inkonsistent sein, weil die KI das Konzept nur „abschätzt“ statt wirklich darauf spezialisiert zu sein.
Kurz gesagt:
Zero-Shot Generation bedeutet, dass eine KI neue Aufgaben oder Bildideen ohne zusätzliches Spezialtraining umsetzen kann.

ZIT

Z-Image beziehungsweise Z-Image Turbo sind Community-Checkpoints für SDXL, die vor allem auf realistische Portraits, Fashion und moderne Cinematic-Looks optimiert wurden.
Die Modelle sind bekannt für:
starke Hautdetails
realistisches Lighting
gute Prompt-Treue
moderne Editorial-Ästhetik
saubere Gesichter
Besonders beliebt wurde Z-Image Turbo durch:
hohe Qualität bei wenigen Steps
schnelle Generierung
gute Kombination mit modernen Samplern wie UniPC oder DPM++
Viele Nutzer verwenden Z-Image für:
Portraits
Beauty
Fashion
Social-Media-Looks
Semi-Professional Photography Styles
Im Vergleich zu älteren SDXL-Checkpoints wirken Bilder oft:
kontrastreicher
moderner
sauberer
weniger „matschig“
Der Nachteil:
Wie viele stark optimierte Realismus-Modelle kann auch Z-Image schnell zu perfekt oder zu glatt wirken.
Kurz gesagt:
Z-Image Turbo ist ein moderner SDXL-Checkpoint mit Fokus auf schnelle, hochwertige und realistische Portrait- und Editorial-Bilder.
Zoom beschreibt die Möglichkeit, die Brennweite eines Objektivs zu verändern und dadurch den Bildausschnitt anzupassen.
Mit einem Zoomobjektiv kann man:
näher an Motive heranholen
mehr Umgebung zeigen
flexibel zwischen verschiedenen Bildwinkeln wechseln
ohne das Objektiv zu wechseln.
Beispiele:
24–70mm
70–200mm
18–135mm
Zoomobjektive sind besonders beliebt bei:
Reisen
Reportage
Events
Wildlife
Allround-Fotografie
Der Vorteil:
Hohe Flexibilität mit nur einem Objektiv.
Der Nachteil:
Zoomobjektive sind oft:
größer
schwerer
oder weniger lichtstark
als vergleichbare Festbrennweiten.
Kurz gesagt:
Zoom verändert die Brennweite eines Objektivs und damit den sichtbaren Bildausschnitt.
Der Zoombereich beschreibt den Brennweitenbereich eines Zoomobjektivs.
Er zeigt, zwischen welchen Bildwinkeln das Objektiv wechseln kann.
Beispiele:
24–70mm
70–200mm
18–135mm
Ein kleiner Zoombereich:
oft bessere Bildqualität
meist lichtstärker
Ein großer Zoombereich:
mehr Flexibilität
vielseitiger im Alltag
weniger Objektivwechsel nötig
Der Zoombereich beeinflusst, ob ein Objektiv eher:
Weitwinkel
Standard
oder Teleaufnahmen
abdeckt.
Kurz gesagt:
Der Zoombereich beschreibt den verfügbaren Brennweitenbereich eines Zoomobjektivs.

Konto

Navigation

Suche

Suche

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.