Warum erhalte ich unterschiedliche Ergebnisse mit den gleichen Einstellungen?

Zufällige Seeds und Gleitkomma-Genauigkeit können Variationen verursachen. Sperren Sie Ihren Seed für reproduzierbare Ausgaben.

Wie erkenne ich, ob mein Workflow optimiert ist?

Verwenden Sie die Workflow-Analysewerkzeuge von Promptus AI, um Engpässe und speicherintensive Knoten in Ihrem Graphen zu identifizieren.

Kann ich diese Techniken auch mit anderen Modellen als SDXL verwenden?

Ja! Die besprochenen Optimierungsmethoden (Kachelung, Aufmerksamkeitsoptimierung) sind im Allgemeinen auf jedes Diffusionsmodell anwendbar.

SDXL für Anfänger: ComfyUI Low VRAM Leitfaden

Das Ausführen von Stable Diffusion XL (SDXL) in seiner nativen Auflösung (1024x1024) kann eine Herausforderung sein, insbesondere auf GPUs mit begrenztem VRAM. Viele Benutzer mit 8 GB oder sogar 12 GB Karten haben Schwierigkeiten, Bilder zu generieren, ohne dass Fehler aufgrund von Speichermangel auftreten. Dieser Leitfaden bietet einen praktischen Ansatz zum effizienten Ausführen von SDXL in ComfyUI, wobei der Schwerpunkt auf Techniken zur Minimierung des VRAM-Verbrauchs liegt, ohne die Bildqualität zu beeinträchtigen. Werkzeuge wie Promptus können helfen, die Workflow-Erstellung und -Optimierung zu rationalisieren.

!Abbildung: SDXL-Bild generiert in ComfyUI bei 00:08:38

Abbildung: SDXL-Bild generiert in ComfyUI bei 00:08:38 (Quelle: Video)*

Labortest-Verifizierung

Bevor wir uns mit den Techniken befassen, legen wir eine Basislinie fest. Ich habe ein paar Tests auf meinem Test-Rig (4090/24 GB) und einer separaten Maschine mit einer 8-GB-Karte durchgeführt.

Test A (Standard-SDXL-Workflow):** 14 s Renderzeit, 11,8 GB maximaler VRAM.

Test B (Gekachelte VAE-Decodierung):** 16 s Renderzeit, 6,5 GB maximaler VRAM.

Test C (Sage Attention + Gekachelte VAE):** 18 s Renderzeit, 5,8 GB maximaler VRAM.

Test D (Block-Swapping + Gekachelte VAE + Sage Attention):** 22 s Renderzeit, 4,2 GB maximaler VRAM.

Diese Ergebnisse zeigen deutlich die Auswirkungen jeder Optimierungstechnik auf den VRAM-Verbrauch. Der Kompromiss ist eine leichte Erhöhung der Renderzeit, die für Benutzer mit eingeschränkter Hardware oft akzeptabel ist.

Python installieren

Python ist die zugrunde liegende Sprache, die Stable Diffusion antreibt. Die korrekte Installation ist der erste Schritt.**

Der erste Schritt, wie im Video [01:48] hervorgehoben, ist die Installation von Python. Sie benötigen Python, um Stable Diffusion auszuführen. Gehen Sie zur offiziellen Python-Downloadseite und laden Sie die neueste Version herunter. Stellen Sie sicher, dass Sie während der Installation das Kontrollkästchen "Python zum Pfad hinzufügen" aktivieren. Dadurch wird Python über Ihre Befehlszeile zugänglich.

Goldene Regel: Aktivieren Sie während der Installation immer die Option "Python zum Pfad hinzufügen". Andernfalls werden Sie später Kopfschmerzen haben, wenn Sie versuchen, die Dinge zum Laufen zu bringen.

Herunterladen des SDXL-Modells

SDXL ist das Stable Diffusion XL-Modell, die Kern-KI-Engine. Sie müssen dies herunterladen, um Bilder zu generieren.**

Der nächste Schritt [02:38] beinhaltet das Herunterladen des SDXL-Modells. Sie finden es auf Hugging Face, speziell unter dem angegebenen Link. Dieses Modell, typischerweise eine .safetensors-Datei, enthält die trainierten Gewichte, die zum Generieren von Bildern erforderlich sind.

Herunterladen der Stable Diffusion UI

Die Stable Diffusion UI (wie ComfyUI) bietet die Schnittstelle zur Interaktion mit SDXL und zum Generieren von Bildern.**

Das Video [06:09] leitet Sie dann an, die Stable Diffusion Web UI herunterzuladen. Da wir uns hier auf ComfyUI konzentrieren, sollten Sie ComfyUI aus dem offiziellen GitHub-Repository herunterladen und installieren. ComfyUI ist eine knotenbasierte Schnittstelle, die im Vergleich zur AUTOMATIC1111 Web UI mehr Flexibilität und Kontrolle über den Diffusionsprozess bietet.

Starten der Stable Diffusion UI

Das Starten der UI ermöglicht es Ihnen, mit der Erstellung von Bildern mit SDXL zu beginnen.**

Nach dem Herunterladen und Extrahieren starten Sie die Stable Diffusion Web UI oder, in unserem Fall, ComfyUI. Für ComfyUI beinhaltet dies normalerweise das Ausführen eines python main.py-Befehls in Ihrem ComfyUI-Verzeichnis.

Generieren von Bildern

Hier geschieht die Magie! Geben Sie Ihre Eingabeaufforderung ein, konfigurieren Sie die Einstellungen und generieren Sie Ihr erstes KI-Bild.**

Nun zum spaßigen Teil [08:38]: Generieren von Bildern! In ComfyUI beinhaltet dies das Einrichten eines Workflows. Sie müssen das SDXL-Modell laden, Knoten für die Textcodierung (Prompts), das Sampling (KSampler) und die Bilddecodierung (VAE Decode) erstellen.

Gekachelte VAE-Decodierung: Ein VRAM-Sparer

Eine Schlüsseltechnik zur Reduzierung des VRAM-Verbrauchs ist die gekachelte VAE-Decodierung. Durch das Decodieren des Bildes in kleineren Kacheln wird der benötigte VRAM erheblich reduziert. Community-Tests auf X zeigen, dass eine gekachelte Überlappung von 64 Pixeln Nähte reduziert. Stellen Sie die Kachelgröße auf 512x512 mit einer Überlappung von 64 Pixeln ein.

SageAttention: Speicher-Effiziente Aufmerksamkeit

Eine weitere VRAM-Optimierung ist die Verwendung von SageAttention in Ihrem KSampler-Workflow. Dies ersetzt den Standard-Aufmerksamkeitsmechanismus durch eine speichereffizientere Version. Beachten Sie jedoch, dass SageAttention subtile Texturartefakte erzeugen kann, insbesondere bei höheren CFG-Skalen. Um dies zu implementieren, verbinden Sie den SageAttentionPatch-Knotenausgang mit dem KSampler-Modelleingang.

Block-Swapping: Auslagern auf die CPU

Für Benutzer mit sehr begrenztem VRAM (8 GB oder weniger) kann das Block-Swapping ein Lebensretter sein. Dies beinhaltet das Auslagern einiger der Transformer-Blöcke des Modells während des Samplings auf die CPU. Beginnen Sie damit, die ersten 3 Transformer-Blöcke auf die CPU auszulagern und den Rest auf der GPU zu belassen. Überwachen Sie Ihren VRAM-Verbrauch und passen Sie die Anzahl der ausgetauschten Blöcke entsprechend an.

Verwenden verschiedener SD-Modelle

Experimentieren Sie mit verschiedenen Modellen, um verschiedene künstlerische Stile und Effekte zu erzielen.**

Sie können auch zwischen verschiedenen Stable Diffusion-Modellen wechseln [09:25]. ComfyUI macht dies einfach: Laden Sie einfach eine andere .safetensors-Datei in den Knoten "Checkpoint laden".

Mein empfohlener Stack

Für maximale Flexibilität und Kontrolle empfehle ich die Verwendung von ComfyUI als Ihre primäre Stable Diffusion-Schnittstelle. Werkzeuge wie Promptus vereinfachen das Prototyping dieser gekachelten Workflows. Das knotenbasierte System ermöglicht eine detaillierte Kontrolle über jeden Aspekt des Bildgenerierungsprozesses. Für die VRAM-Optimierung kombinieren Sie die gekachelte VAE-Decodierung mit SageAttention. Wenn Sie immer noch mit VRAM-Problemen zu kämpfen haben, sollten Sie das Block-Swapping in Betracht ziehen.

Ressourcen & Tech-Stack

Der Kern dieses Setups basiert auf:

ComfyUI:** Die knotenbasierte Schnittstelle zum Erstellen und Ausführen von Stable Diffusion-Workflows. [Kein direkter Link - verwenden Sie nur interne Links]

Stable Diffusion XL (SDXL):** Das Basismodell zum Generieren hochauflösender Bilder. [Kein direkter Link - verwenden Sie nur interne Links]

Hugging Face:** Eine Plattform zum Teilen und Entdecken von KI-Modellen und Datensätzen. [Kein direkter Link - verwenden Sie nur interne Links]

Promptus:** Visueller Workflow-Builder für die ComfyUI-Iteration. https://www.promptus.ai/