ControlNet ist eine Technik, mit der man KI-Bilder gezielt steuern kann. Statt der KI nur einen Textprompt zu geben, nutzt man zusätzlich eine Vorlage oder Struktur als Orientierung.
Damit lassen sich zum Beispiel kontrollieren:
Posen
Perspektive
Bildaufbau
Tiefeninformationen
Kanten und Formen
Gesichtspositionen
ControlNet analysiert dafür meist ein Referenzbild und erzeugt daraus Hilfsdaten wie:
Linien
Skelettpunkte
Tiefenkarten
Silhouetten
Die KI orientiert sich dann beim Generieren daran.
Typische Einsatzgebiete:
exakte Posen übernehmen
Bildkomposition kontrollieren
Consistency zwischen mehreren Bildern
bessere Character-Szenen
realistischere Perspektiven
Bekannte ControlNet-Typen:
OpenPose
Canny
Depth
Lineart
Tile
Kurz gesagt:
ControlNet gibt der KI zusätzliche visuelle Vorgaben, damit Bilder gezielter und kontrollierter erzeugt werden können.