Stable Diffusion , um popular gerador de arte de IA, requer prompts de texto para criar uma imagem. Às vezes, ele faz um trabalho incrível e gera exatamente o que você deseja com um aviso vago. Outras vezes, você obtém resultados abaixo do ideal. Aqui estão algumas dicas e truques para obter resultados ideais.
Índice
Se você já passou algum tempo com geradores de imagens de IA, como Stable Diffusion, DALL-E ou MidJourney , deve ter notado que um prompt bem formulado é crítico. Uma mensagem bem formulada é a diferença entre transformar sua ideia em uma ótima imagem e obter alguma monstruosidade de um vale misterioso com muitos dedos olhando para você.
As pessoas têm tentado descobrir as melhores maneiras de obter resultados ideais desde o lançamento do Stable Diffusion em agosto de 2022, e eles serão “ferreiros imediatos” ou “engenharia imediata” nos próximos anos. Isso é especialmente provável porque os pontos de verificação que informam como o Stable Diffusion gera imagens receberão atualizações periódicas. O prompt ideal será um alvo móvel no futuro próximo.
A versão mais recente do Stable Diffusion no momento desta atualização, versão 2.1, responde muito bem a solicitações negativas. Os prompts negativos são iguais aos prompts normais, mas em vez de descrever o que você deseja, você descreve o que não deseja. Tente gerar seu primeiro conjunto de imagens sem avisos negativos e, em seguida, adicione avisos negativos para remover os elementos que você não gosta.
A difusão estável tende a prosperar em prompts específicos, especialmente quando comparada a algo como MidJourney. Você precisa dizer exatamente o que deseja. Aqui está um exemplo usando os animais favoritos da internet: Gatos fofos.
Tudo bem, eles são muito fofos, exceto talvez pelo pobre sujeito do meio-alto que parece ter passado muito tempo olhando para o abismo. Mas e se você quisesse gatos cinzentos, e não uma mistura de gatos? Bem, você precisa especificar isso. Use “Gatos cinzentos fofos” como prompt.
Agora o Stable Diffusion retorna todos os gatos cinzentos. Você pode continuar adicionando descrições do que deseja, incluindo acessórios para os gatos nas fotos.
Isso se aplica a tudo o que você deseja que o Stable Diffusion produza, incluindo paisagens. Seja descritivo e, ao tentar diferentes combinações de palavras-chave, observe mentalmente como a imagem muda. Algumas palavras e frases tendem a distorcer uma imagem mais fortemente do que outras palavras, portanto, talvez seja necessário ajustar sua solicitação de acordo.
A necessidade de especificidade não termina quando você descreve completamente o conteúdo da imagem desejada. Você pode (e deve) também especificar o estilo desejado. Manteremos nosso prompt “Gato cinza fofo” para isso. Digamos que queremos alguns gatos cinzentos fofos, mas também queremos que pareçam uma pintura acrílica. A primeira coisa que você deve tentar é adicionar “pintura acrílica” como a próxima palavra-chave em seu prompt, para que leia: “Gato cinza fofo, pintura acrílica”.
Geralmente, é melhor começar com o menor número de palavras-chave para chegar perto do que você deseja e, em seguida, adicionar mais para focar na estética que você está procurando.
A difusão estável reconhece dezenas de estilos diferentes , desde desenhos a lápis a modelos de argila e renderização 3D do Unreal Engine.
Esses exemplos de prompts são extremamente simples, mas você pode usar dezenas de palavras-chave para ajustar seus resultados. Se você quiser modelos estranhos de frango de barro com cores psicodélicas em um Walmart, precisará especificar todos esses termos.
Stable Diffusion é capaz de fazer mais do que emular estilos ou mídias específicas; pode até imitar artistas específicos, se você quiser fazer isso. Este exemplo usou Pablo Picasso.
Definitivamente, você deve tentar inserir “por (nome do artista)” em seus prompts, caso ainda não o tenha feito. Tende a produzir resultados dramáticos. Não tenha medo de combinar artistas que normalmente não combinariam. Muitas vezes, o Stable Diffusion combinará seus respectivos estilos de maneiras emocionantes e imprevisíveis.
Se você estiver usando a versão GUI do Stable Diffusion para Windows que recomendamos , há um botão “Roll” à direita da janela do prompt que lançará aleatoriamente um artista no seu prompt. É uma ótima maneira de descobrir novos estilos.
É claro que apenas inserir palavras-chave em seu prompt só o levará até certo ponto. O que acontece se você receber todas as coisas certas em seu prompt, mas elas não estiverem nas proporções adequadas?
O Stable Diffusion oferece suporte à ponderação de palavras-chave imediatas. Em outras palavras, você pode dizer que ele realmente precisa prestar atenção a uma palavra-chave (ou palavras-chave) específica e prestar menos atenção a outras. É útil se você estiver obtendo resultados que são exatamente o que você procura, mas não exatamente lá.
Na versão de linha de comando do Stable Diffusion , basta adicionar dois pontos seguidos de um número decimal à palavra que deseja enfatizar. Os números decimais são porcentagens, portanto devem somar 1.
Voltando ao nosso prompt “Gato cinza fofo”, vamos imaginar que ele estava produzindo gatos fofos corretamente, mas poucas das imagens de saída apresentavam gatos cinzentos. Você poderia modificar o prompt para ler: “fofo, gato cinza: 0,7”, e ele prestaria mais atenção ao gato cinza e, em seguida, aplicaria automaticamente a diferença a “fofo”. Você também pode atribuir pesos a cada palavra no prompt manualmente se desejar um controle mais preciso, como “Fofo: 0,10, Gato cinza: 0,60, Renderização do Unreal Engine: 0,30”, por exemplo.
A maioria das GUIs disponíveis para Difusão Estável lida com ponderação sem exigir que você insira porcentagens explícitas. Geralmente, você pode adicionar parênteses em torno de um termo em seu prompt para enfatizá-lo e colchetes para diminuir a importância de um termo. Portanto, o “gato cinza fofo” anterior pode parecer “[fofo],((gato cinza)).”
Você pode usar vários parênteses para aumentar a ênfase tanto quanto desejar.
Stable Diffusion e outros geradores de arte de IA experimentaram um aumento explosivo de popularidade. Você pode encontrar esse tipo de arte de IA em todo lugar. Isso significa que agora existem pelo menos alguns milhões de imagens geradas por usuários circulando na Internet e, na maioria das vezes, as pessoas incluem o prompt que usaram para obter seus resultados.
Aqui estão alguns recursos para ajudar a despertar sua inspiração se você não tiver certeza do que deseja criar:
Todos estes são potencialmente NSFW .
Um bom prompt é a parte mais difícil de usar o Stable Diffusion, mas existem algumas outras configurações que mudarão drasticamente os resultados.
Esses são alguns de nossos prompts favoritos, pois tendem a funcionar de maneira confiável. Basta inserir um assunto de sua escolha e alguns modificadores. Todas as outras configurações de Difusão Estável foram mantidas iguais às instruções acima.
Como regra, a Difusão Estável cria o pôr do sol e as folhas caem excepcionalmente bem.
Escolha um assunto e este prompt retornará de forma confiável resultados fotorrealistas de pessoas, animais e paisagens.
Este exemplo de prompt também incluiu “Golden Hour” para obter as cores do pôr do sol.
Insira um assunto e você o obterá na estética “Art of Rally”.
Basta inserir um assunto e uma descrição ambiental, e esse prompt fornecerá ótimas imagens de arte conceitual de cidades com um efeito ambiental de sua escolha. Aqui está um exemplo usando a cidade de Nova York como tema e tempestade de poeira como descrição ambiental:
A difusão estável produz ótimos resultados com Kermit. Experimente em qualquer lugar.
Por que é assim que a Stable Diffusion interpreta “Kermit in Mordor”, e quem é a coisa vermelha e maligna do Kermit que está por trás de nosso robusto herói? Nenhuma idéia.
Lembre-se, não tenha medo de remover o que você acha que pode ser um termo-chave do seu prompt. Certas palavras, como “linda”, influenciarão fortemente a aparência de uma imagem, mesmo que não tenha um significado preciso. À medida que você passa mais tempo com o Stable Diffusion, você desenvolverá uma noção de como ele responde a certas palavras e descobrirá rapidamente que escrever um bom prompt é uma arte em si.
Muitos aplicativos de limpeza estão disponíveis para Windows ao longo dos anos, mas hoje em…
Seu PlayStation 4 está congelado? Seus jogos favoritos continuam travando? Reiniciar seu PS4 pode resolver…
A popularidade das mensagens de texto significou aprender uma forma totalmente nova de comunicação. Você…
A foto dos "Pilares da Criação" tirada pelo Telescópio Espacial Hubble é uma das fotos…
O Proton Drive saiu de seu estágio beta há algumas semanas, mas o aplicativo real…
Para ver suas fotos mais de perto ou para uma edição precisa , você pode…