Os geradores de imagens de IA estão na moda atualmente, mas a maioria deles se limita à criação de imagens em baixas resoluções ou o hardware fica sem memória de vídeo. Agora existe (pelo menos) uma correção para isso: uma versão modificada do Stable Diffusion chamada “txt2imghd”.
O novo projeto txt2imghd é baseado no modo “GOBIG” de outra ramificação do Stable Diffusion, que por sua vez é o modelo usado para criar a maior parte da arte de IA que você provavelmente viu ultimamente. As imagens criadas com txt2imghd podem ser maiores do que aquelas criadas com a maioria dos outros geradores – as imagens de demonstração são 1536×1536, enquanto o Stable Diffusion é geralmente limitado a 1024×768, e o padrão para Midjourney é 512×512 (com upscaling opcional para 1664 x 1664 ) .
Txt2imghd tem uma maneira inteligente de aumentar a escala de imagens. De acordo com a documentação do projeto, ele “cria imagens detalhadas e de alta resolução, primeiro gerando uma imagem a partir de um prompt, aumentando-a e, em seguida, executando img2img em pedaços menores da imagem aumentada e mesclando o resultado de volta à imagem original”. É uma solução inteligente para os limites das placas de vídeo, mas como você pode esperar, o resultado leva mais tempo para ser gerado do que uma única imagem de baixa resolução.
A versão atualizada tem aproximadamente os mesmos requisitos de sistema do Stable Diffusion regular, que recomenda uma placa gráfica com pelo menos 10 GB de memória de vídeo (VRAM). Se estiver interessado em experimentar, você pode executar o modelo em seu navegador (é necessária uma conta GitHub gratuita). Você também pode baixar o código para rodar em seu próprio computador no link da fonte abaixo.
Fonte: GitHub