Distillation ist eine Technik, bei der ein großes KI-Modell in ein kleineres und schnelleres Modell „komprimiert“ wird.
Das Ziel:
schnellere Generierung
weniger Speicherverbrauch
ähnliche Bildqualität
Turbo-Modelle basieren oft auf Distillation.
Kurz gesagt:
Distillation macht KI-Modelle kleiner und schneller, ohne ihr Wissen komplett zu verlieren.