Stable Diffusion é um popular gerador de imagens com tecnologia de IA que você pode executar em seu próprio PC. Mas quais são as especificações mínimas para executar o Stable Diffusion e quais componentes são mais importantes?
Índice
Qual hardware de PC a difusão estável requer?
O componente mais crítico para a difusão estável é a placa gráfica (GPU). Difusão estável — pelo menos a versão primária — roda quase exclusivamente em sua GPU. Isso significa que outros componentes do sistema, como CPU , RAM e unidades de armazenamento, não importam tanto.
Os forks da comunidade às vezes mudam a forma como o Stable Diffusion opera e podem resultar em uma demanda maior de CPU e RAM do que o lançamento oficial do Stable Diffusion.
De modo geral, aqui estão as especificações mínimas que recomendamos se você estiver construindo um novo PC com Difusão Estável em mente:
- CPU : Qualquer CPU AMD ou Intel moderna .
- RAM : Um mínimo de 16 gigabytes de RAM DDR4 ou DDR5 .
- Armazenamento : Qualquer unidade de estado sólido SATA ou NVMe de uma empresa confiável com 256 gigabytes ou maior. Você precisa de pelo menos 10 gigabytes de espaço livre disponível. Normalmente, unidades de um terabyte oferecem o melhor preço por gigabyte de armazenamento.
- GPU: Qualquer GPU GeForce RTX com no mínimo 8 gigabytes de memória GDDR6.
Que tipo de placa gráfica (GPU) você precisa para executar uma difusão estável?
A comunidade do Stable Diffusion tem trabalhado diligentemente para expandir o número de dispositivos nos quais o Stable Diffusion pode ser executado. Vimos o Stable Diffusion rodando em Macs M1 e M2 , placas AMD e placas NVIDIA antigas, mas eles tendem a ser difíceis de executar e são mais propensos a problemas. As GPUs RTX NVIDIA são as únicas GPUs com suporte nativo do Stable Diffusion no momento em que este artigo foi escrito, em dezembro de 2022.
Qualquer uma das seguintes placas NVIDIA RTX funcionará imediatamente:
- RTX 2060 (12 GB), RTX 2070, RTX 2070 Super, RTX 2080, RTX 2080 Super, RTX 2080 Ti ou RTX Titan
- RTX 3060, RTX 3060 Ti, RTX 3070, RTX 3070 Ti, RTX 3080, RTX 3080 (12 GB), RTX 3080 Ti, RTX 3090 ou RTX 3090 Ti
- RTX 4090, RTX 4080 e futuras GPUs da série 40
O RTX 3050 também funcionaria, mas é difícil recomendá-lo dado seu preço em comparação com a variante RTX 3060 de 12 gigabytes.
Tente comprar a GPU mais nova que puder. Qualquer uma das GPUs das séries 20, 30 ou 40 com 8 gigabytes de memória da NVIDIA funcionará, mas GPUs mais antigas — mesmo com a mesma quantidade de RAM de vídeo (VRAM) — levarão mais tempo para produzir o mesmo tamanho imagem. Se você estiver construindo ou atualizando um PC especificamente com o Stable Diffusion em mente, evite as GPUs mais antigas da série RTX 20, a menos que encontre um negócio fantástico em uma, já que elas são significativamente mais lentas.
De quanta memória de vídeo (memória GPU) você precisa?
Quanto maiores você tornar suas imagens, mais VRAM Stable Diffusion usará. A quantidade mínima de VRAM que você deve considerar é de 8 gigabytes.
A versão não modificada do Stable Diffusion produzirá imagens de 256×256 usando 8 GB de VRAM, mas você provavelmente terá problemas ao tentar produzir imagens de 512×512. Se você quiser ir para imagens de 512×512 sem mexer nas configurações, adquira uma GPU com 12 gigabytes de VRAM ou mais.
O RTX 3060 é uma opção potencial com um preço bastante baixo. O RTX 3060 é mais lento que o 3060 Ti , porém, o RTX 3060 possui 12 giga de VRAM, enquanto o 3080 Ti possui apenas 8 giga. A VRAM extra realmente brilhará no Stable Diffusion, mas isso prejudica a velocidade e o desempenho do jogo.
MSI Gaming GeForce RTX 3060
Uma GPU GeForce RTX com 12 GB de RAM para difusão estável a um ótimo preço.
Quando se trata de VRAM adicional e Difusão Estável, o céu é o limite – a Difusão Estável usará com prazer cada gigabyte de VRAM disponível em um RTX 4090 . Tudo depende do tamanho da imagem que você está gerando.
Claro, existem todos os tipos de garfos otimizados que permitem que você obtenha muito menos VRAM em detrimento da velocidade, mas se quiser ter certeza de que funcionará, opte por placas NVIDIA RTX que tenham pelo menos 8 gigabytes de memória.
Você deve usar um garfo otimizado de difusão estável?
Em uma palavra: sim.
A comunidade Stable Diffusion fez um trabalho fantástico expandindo o número de GPUs suportadas para tornar o Stable Diffusion mais acessível.
Os forks comunitários geralmente incluem uma interface de usuário, modelos adicionais para refinar suas criações e otimizações que permitem gerar imagens maiores com menos VRAM. Alguns usuários conseguiram gerar imagens de 512×512 com apenas 4 gigabytes de VRAM usando garfos comunitários. As mesmas otimizações permitem que usuários com GPUs de 8 e 12 gigabytes produzam imagens significativamente maiores.
A interface do usuário também é um ótimo recurso, pois facilita o uso do Stable Diffusion . Também torna possível a geração de vídeo de IA com difusão estável .
Apenas tenha cuidado. A maioria das modificações que você encontrará foram escritas por entusiastas bem-intencionados, mas sempre existe a possibilidade de alguém estar agindo de forma maliciosa. Se o seu antivírus sinalizar um fork do Stable Diffusion como malicioso, não o ignore. O Stable Diffusion não é conhecido por produzir falsos positivos de software antivírus, portanto, quaisquer avisos que você receber devem ser levados a sério.
Depois de obter o hardware certo, você pode gastar tempo otimizando os prompts do Stable Diffusion em vez do PC.