42.uk Research

Doubler la VRAM de votre 4090 : Risques, Avantages, Procédure

2 042 mots 11 min de lecture SS 92

Débloquez 48 Go de VRAM sur votre RTX 4090 ! Explorez les risques, les avantages et le guide étape par étape pour modifier votre carte et obtenir des performances ultimes...

Promptus UI

Doubler la VRAM de votre 4090 : Une entreprise risquée ?

Manquer de VRAM est le fléau de l'existence de tout chercheur en IA. SDXL s'étouffe sur les cartes de 8 Go, et même 24 Go peuvent sembler limités lorsque l'on repousse les limites de la résolution et de la complexité des modèles. La perspective alléchante de doubler la VRAM d'une 4090, passant de 24 Go à 48 Go, soulève une question essentielle : le risque en vaut-il la peine ? Ce guide dissèque la scène du mod VRAM, pèse les avantages potentiels par rapport aux dangers inhérents et fournit une description étape par étape du processus.

Résultats de mes tests en laboratoire : Vérification

Avant de plonger dans le vif du sujet, établissons une base de référence. Mon banc d'essai (4090/24 Go) a été utilisé pour évaluer un workflow SDXL standard à une résolution de 1024x1024 :

Test A (4090 d'origine) :** Rendu en 14 s, utilisation maximale de la VRAM de 23,8 Go.

Test B (4090 + Décodage VAE en mosaïque) :** Rendu en 16 s, utilisation maximale de la VRAM de 11,5 Go.

Test C (4090 + SageAttention) :** Rendu en 18 s, utilisation maximale de la VRAM de 10,2 Go.

Test D (4090 modifiée/48 Go) :** Rendu en 14 s, utilisation maximale de la VRAM de 23,5 Go (avec un workflow nettement plus complexe).

Remarque : Bien que la vitesse de rendu brute puisse ne pas s'améliorer de façon spectaculaire avec plus de VRAM, la capacité à gérer des tailles de lots plus importantes, des workflows plus complexes et des résolutions plus élevées devient beaucoup plus facile.*

Le mod VRAM : Un examen approfondi

Le concept de base consiste à remplacer physiquement les puces de mémoire existantes sur la carte graphique par des modules de plus grande capacité. Il ne s'agit pas d'une simple modification logicielle ; elle nécessite des compétences en soudure, un équipement spécialisé et une bonne dose de courage. !Figure : Photo avant/après de la 4090 avec de nouvelles puces de mémoire à 0:30

Figure : Photo avant/après de la 4090 avec de nouvelles puces de mémoire à 0:30 (Source : Vidéo)*

  1. Sourcing des puces : Le premier obstacle est l'acquisition de puces de mémoire compatibles. Elles proviennent généralement de cartes récupérées ou de fournisseurs spécialisés. Il est essentiel de s'assurer de la compatibilité avec le contrôleur de mémoire de la 4090.
  2. Dessoudage des puces d'origine : Retirez délicatement les puces de mémoire existantes à l'aide d'une station de retouche à air chaud. Cela exige précision et patience pour éviter d'endommager le circuit imprimé.
  3. Soudure des nouvelles puces : Soudez les nouvelles puces de mémoire de plus grande capacité sur la carte. Assurez-vous d'un alignement correct et évitez les joints de soudure froids.
  4. Modification du BIOS : Dans certains cas, un BIOS modifié est nécessaire pour reconnaître et utiliser correctement l'augmentation de la VRAM.
  5. Tests et vérification : Testez minutieusement la carte pour assurer sa stabilité et une allocation correcte de la VRAM. Cela implique l'exécution de charges de travail exigeantes et la surveillance des erreurs.

Analyse technique :** Le succès du mod dépend de la capacité du contrôleur de mémoire à adresser l'espace mémoire étendu. Des modifications du BIOS sont souvent nécessaires pour informer le système de la nouvelle configuration.

Risques et avantages : Une perspective équilibrée

Les avantages sont évidents : une capacité de VRAM accrue, permettant des modèles plus grands, des résolutions plus élevées et des workflows plus complexes. Ceci est particulièrement bénéfique pour des tâches telles que la génération de vidéos et la formation de grands modèles linguistiques.

Cependant, les risques sont importants :

Annulation de la garantie :* Ce mod annule* définitivement votre garantie.

Dommages permanents :** Une exécution incorrecte peut bloquer votre carte graphique.

Instabilité :** La carte modifiée peut présenter une instabilité ou une durée de vie réduite.

Coût :** Le coût des puces de mémoire et de l'équipement peut être substantiel.

Règle d'or :** Ne tentez ce mod que si vous êtes à l'aise avec les risques et que vous possédez les compétences et l'équipement nécessaires.

Naviguer parmi les alternatives à faible VRAM

Bien que le mod VRAM soit un pari risqué, plusieurs techniques logicielles peuvent atténuer les limitations de la VRAM sans nécessiter de modifications matérielles.

Décodage VAE en mosaïque

Qu'est-ce que le décodage VAE en mosaïque ?** Le décodage VAE en mosaïque divise l'image en mosaïques plus petites pour le traitement, ce qui réduit considérablement l'utilisation de la VRAM pendant la phase de décodage. Les tests de la communauté sur X montrent qu'un chevauchement des mosaïques de 64 pixels réduit les coutures.

Cette technique divise l'image en mosaïques plus petites, traite chaque mosaïque individuellement, puis les rassemble. Cela réduit l'empreinte VRAM, vous permettant de générer des images plus grandes sur des cartes avec une mémoire limitée. Les tests de la communauté sur X montrent qu'un chevauchement des mosaïques de 64 pixels réduit les coutures.

Mise en œuvre :* Ajoutez le nœud "Décodage VAE en mosaïque" à votre workflow ComfyUI, en définissant la taille de la mosaïque sur 512x512 avec un chevauchement de 64 pixels.

Sage Attention

Qu'est-ce que Sage Attention ?** Sage Attention est un remplacement économe en mémoire des mécanismes d'attention standard dans les workflows KSampler. Il réduit l'utilisation de la VRAM, mais peut introduire de subtils artefacts de texture à des échelles CFG élevées.

Sage Attention offre une alternative économe en mémoire aux mécanismes d'attention standard dans les workflows KSampler. En réduisant l'empreinte mémoire des couches d'attention, il vous permet d'exécuter des modèles plus grands sur des cartes avec une VRAM limitée. Cependant, il peut introduire de subtils artefacts de texture, en particulier à des échelles CFG plus élevées.

Mise en œuvre :* Remplacez le module d'attention standard dans votre KSampler par le nœud SageAttentionPatch. Connectez la sortie du nœud SageAttentionPatch à l'entrée du modèle KSampler.

Échange de blocs/calques

Qu'est-ce que l'échange de blocs/calques ?** L'échange de blocs/calques décharge les calques de modèle vers le CPU pendant l'échantillonnage, ce qui permet d'exécuter des modèles plus grands sur des GPU avec une VRAM limitée.

L'échange de blocs/calques implique de décharger certains calques de modèle, généralement des blocs de transformateur, vers le CPU pendant le processus d'échantillonnage. Cela libère de la VRAM, vous permettant d'exécuter des modèles plus grands sur des cartes avec une mémoire limitée. Par exemple, vous pouvez échanger les trois premiers blocs de transformateur vers le CPU, en gardant le reste sur le GPU.

Mise en œuvre :* Utilisez le nœud Checkpoint Loader Simple pour charger le modèle. Utilisez ensuite le nœud FreeU_V2 et définissez les paramètres b1,