Se você já esteve perto de crianças, sabe como a imaginação delas pode ser ilimitada. Uma simples caixa de papelão é um mundo infinito de possibilidades. E se deixarmos a imaginação correr solta com DALL-E e Stable Diffusion?
Essa é a coisa incrível sobre os muitos geradores de imagens de IA que estão disponíveis agora . Obviamente, há limites para o que a IA pode fazer, mas basicamente você é livre para inserir qualquer coisa e ver o que acontece. É um playground para sua imaginação.
Decidi deixar meu filho de 4 anos se divertir naquele parquinho. Primeiro, expliquei a ele que tinha uma ferramenta que poderia criar uma imagem de qualquer coisa que ele pudesse imaginar. Mostrei a ele alguns exemplos de imagens que fiz para ele começar. Aí perguntei que coisas divertidas ele gostaria de fazer…
As imagens abaixo mostram resultados do DALL-E 2 Beta (esquerda) e de uma versão web do Stable Diffusion (direita).
Índice
Um gafanhoto comendo pizza
A primeira ideia que ele teve foi brilhante. Imediatamente, eu sabia que isso seria divertido.
DALL-E fez um trabalho muito bom com este. Quase parece que o gafanhoto está segurando um pedaço de crosta na boca. Não tenho muita certeza do que a Difusão Estável fez aqui. É uma pizza com um pouco de verde? Não quero pensar no que isso pode ser.
Um cachorro-quente dizendo olá para uma pizza
Em seguida veio outra sugestão com tema de pizza. Você pode dizer que gostamos de pizza?
DALL-E fez um trabalho muito melhor com este também. Acrescentou um cachorro de verdade e não incluiu pizza, mas conseguiu escrever “olá” corretamente (uma vez), o que nem sempre acontece. A Difusão Estável acabou de nos dar uma pizza de salsicha.
Homem-Aranha se mexendo e cantando
Depois do último, ele mergulhou na toca do coelho dizendo “olá” para outras coisas. Sugeri sutilmente tentar outra coisa, como seu super-herói favorito.
Bem, isso é definitivamente o Homem-Aranha fazendo… alguma coisa. Gosto do estilo da imagem de DALL-E, embora não saiba dizer se ele está cantando ou olhando para seus dedos mutilados em agonia. O Stable Diffusion ficou mais realista e adicionou alguns membros extras.
Um bolo de aniversário quadrado com cobertura de mirtilo e cereja e morango por cima
Percebi que dar a ele um pouco de orientação foi útil, então pedi que descrevesse seu próximo bolo de aniversário. Ele foi surpreendentemente detalhado com sua descrição.
DALL-E e Stable Diffusion se saíram muito bem com este. Eu acreditaria que ambos eram bolos reais que as pessoas poderiam fazer. Adorei especialmente que DALL-E colocou um “5” no bolo. Não tenho ideia de onde isso veio, mas é perfeito.
Um louva-a-deus desenhando um morango
Sua próxima ideia foi “um desenho de um louva-a-deus”, então perguntei a ele o que deveria desenhar. A fruta ainda estava em sua mente.
Novamente, o DALL-E esteve muito mais próximo do que tínhamos em mente. A Difusão Estável meio que cuspiu um monte de partes do corpo de louva-a-deus e morangos.
Um fantasma rindo e dançando
No momento em que este artigo foi escrito, o Halloween estava chegando, e esse é um momento emocionante para uma criança de 4 anos. Pedi a ele que pensasse em algo relacionado ao Halloween.
Adorável. Bem, um deles é adorável. DALL-E parece ter como padrão imagens animadas fofas se você não fornecer muitos detalhes. Não sei o que o Stable Diffusion fez, mas não quero mais olhar para isso.
Um tamanduá usando calças
Este último prompt pode ser o meu favorito. Pedi-lhe que pensasse em algumas coisas tolas que os animais poderiam fazer.
Aí está, pessoal, a resposta para a velha pergunta: “como uma criatura de quatro patas deve usar calças?” A imagem do DALL-E é muito engraçada para mim. Adoro a expressão no rosto do tamanduá. Mais uma vez, a Difusão Estável está me assustando.
Isso foi muito divertido de fazer e meu filho estava se divertindo muito com isso! Com apenas algumas pequenas sugestões aqui e ali, criamos ótimas sugestões: Coisas que eu nunca teria pensado em mim mesmo. Também há muito mais que você pode fazer com a arte gerada por IA .