Textual Inversion ist eine Methode, um einer KI neue Begriffe oder Konzepte beizubringen, ohne das komplette Modell neu zu trainieren.
Dabei lernt die KI:
* einen bestimmten Stil
* ein Gesicht
* ein Objekt
* oder eine Bildstimmung
unter einem neuen künstlichen Begriff oder Token kennen.
Beispiel:
Ein spezieller Begriff wie myStyle123 könnte später im Prompt verwendet werden, um genau diesen trainierten Look aufzurufen.
Textual Inversion war besonders in frühen Stable-Diffusion-Zeiten beliebt, weil:
* wenig Speicher benötigt wurde
* das Training relativ leicht war
* kleine Dateien entstanden
Technisch gehören viele Embeddings genau in diesen Bereich.
Der Nachteil:
Die Kontrolle und Qualität sind oft begrenzter als bei modernen LoRAs oder DreamBooth-Trainings.
Heute wird Textual Inversion deshalb seltener genutzt, existiert aber weiterhin für bestimmte Spezialfälle.
Kurz gesagt:
Textual Inversion bringt einer KI neue Begriffe oder Stile bei, die später wie normale Wörter im Prompt verwendet werden können.