Como proteger suas imagens de geradores de arte de IA

Mesa Amazon montada na CES 2023 com obras de arte na parede.

Os geradores de arte de IA podem não ser capazes de imitar a criatividade humana, mas com certeza podem enganar você. Esta é uma preocupação tanto para os artistas quanto para aqueles que temem a aquisição da IA, mas nem tudo pode estar perdido.

Como proteger arte protegida por direitos autorais da IA

Os geradores de arte de IA  não são nada sem os conjuntos de dados nos quais foram treinados. Isso envolve pegar uma grande amostra de obras de arte existentes e contextualizá-las de uma forma que permita aos humanos usar instruções em linguagem natural para criar obras de arte semelhantes. Você pode experimentar você mesmo usando um aplicativo de arte generativo como o DALL-E 2  ou Midjourney da OpenAI .

Pedimos ao DALL-E 2 para produzir “uma foto do Elmo da Vila Sésamo no estilo de Pablo Picasso” e aqui está o que conseguimos (sim, esse foi o melhor do grupo):

Elmo no estilo de Pablo Picasso, cortesia da OpenAI DALL-E 2

Ser capaz de criar obras de arte no estilo de artistas mortos pode não soar muitos alarmes, especialmente em um estilo que é tão reconhecível. Mas para artistas modernos que compartilham suas criações através de ArtStation, DeviantArt, Behance, sites pessoais e páginas de mídia social como Instagram ou Facebook, é muito mais preocupante.

Então, o que você pode fazer para proteger suas próprias criações de serem usadas para treinar uma IA que pode cuspir criações muito mais rápido do que você?

Desativar conjuntos de dados de treinamento

Você pode optar por não participar de dois dos maiores conjuntos de dados de treinamento de imagem abertos na Internet, LAION-400M e LAION-5B, usando HaveIBeenTrained.com . Esses conjuntos de dados são usados ​​por alguns dos maiores geradores de imagens da web, incluindo Stable Diffusion e Google Imagen. Por serem verdadeiramente abertas, muitas outras ferramentas generativas de IA também as utilizam.

Infelizmente, o processo de fazer isso é lento e tedioso. Você precisará primeiro se inscrever em uma conta e, em seguida, pesquisar ou fazer upload de uma imagem para encontrar correspondências no conjunto de dados. Você pode então clicar com o botão direito na imagem no navegador do seu desktop e escolher a opção “Adicionar às minhas desativações”. Alternativamente, você pode dar permissão explícita ao conjunto de dados para usar uma imagem clicando em “Adicionar a meus opt-ins”.

Desative conjuntos de dados com HaveIBeenTrained.com

Você precisará fazer isso para cada imagem que encontrar, por isso pode ser um processo trabalhoso se você for um artista com uma grande obra. Quanto tempo levará, realisticamente, em última análise, depende de quão fácil é filtrar seu trabalho, o que pode ser mais fácil se você tiver um trabalho associado a um nome ou projeto exclusivo, um grande número de seguidores online e assim por diante.

Embora esses dois enormes conjuntos de dados sejam um ótimo lugar para começar, eles estão longe de ser os únicos usados. Os indivíduos podem criar seus próprios conjuntos de dados, e alguns o fazem para replicar um determinado artista ou estilo de arte. Algumas empresas como a OpenAI não divulgam quais conjuntos de dados suas ferramentas usam, então não há como combatê-los.

Recomendado:  Como mostrar arquivos ocultos no Windows 11

Use Robots.txt para afastar rastreadores

Um arquivo robots.txt é um pequeno documento de texto colocado no diretório raiz de um site para informar aos rastreadores da web onde eles podem ou não ir. Embora o Google afirme explicitamente que “não é um mecanismo para manter uma página da web fora do Google”, você ainda pode tentar usá-lo para manter os rastreadores da web longe de seu trabalho artístico se você o hospedar em seu próprio site.

Como o nome pode sugerir, os rastreadores da web rastreiam a web em busca de conteúdo para indexação. Os mecanismos de pesquisa estão longe de ser os únicos rastreadores, e os rastreadores também são usados ​​para criar conjuntos de dados muito parecidos com os conjuntos de dados LAION-400M e LAION-5B mencionados acima. O principal problema do robots.txt é que ele depende do rastreador da web para respeitar sua solicitação.

Um dos maiores conjuntos de dados existentes é o Common Crawl , cujos dados foram usados ​​para construir os conjuntos de dados do LAION. O processo de rastreamento da web é contínuo, com LAION afirmando que seu conjunto de dados LAION-400M atual (no momento da escrita) foi criado “a partir de páginas da web aleatórias rastreadas entre 2014 e 2021”.

O Rastreamento Comum afirma que respeita o robots.txt e o Protocolo de Exclusão de Robôs, tanto em termos de bloqueio de conteúdo quanto de atraso no rastreamento (para economizar largura de banda). Você pode fazer isso criando uma regra para o agente de usuário “CCBot” em seu arquivo Robots.txt. Claro, nada disso ajudará se você não hospedar sua arte por conta própria.

A Central de Pesquisa do Google tem um guia prático para criar um arquivo robots.txt, ou você pode usar um site como o Gerador Robots.txt da Ryte  para criar um para você. Você pode permitir ou desabilitar agentes de usuário específicos de diretórios específicos ou simplesmente bloquear tudo com um curinga (*). Por exemplo, um arquivo robots.txt que bloqueia todos os arquivos em seu diretório /images/ do rastreamento comum e ainda permite que outros rastreadores indexem seu site seria:

Agente do usuário: CCbot

Proibir: /imagens/

Agente de usuário: *

Permitir: /

Mapa do site: https://www.example.com/sitemap.xml

Isso não anulará os rastreadores que já visitaram seu site, mas deve impedir que o rastreamento comum indexe sua pasta /images/ (e quaisquer novos uploads desde o último rastreamento) no futuro.

Embora os direitos autorais estejam implícitos no trabalho que você criou, também pode valer a pena fazer um esforço para proteger os direitos autorais do seu trabalho. Nos EUA, você pode fazer isso registrando seus trabalhos em Copyright.gov . Você pode enviar até 10 trabalhos inéditos em uma única inscrição, mas esteja ciente de que pode demorar um pouco (atualmente cerca de um ano) para que seus trabalhos sejam processados.

Ter registrado os direitos autorais de seu trabalho lhe dá mais apoio em questões que envolvem os tribunais. Essa é a ideia por trás de uma ação coletiva movida contra Stability AI (desenvolvedor de Stable Diffusion e DreamStudio, financiador de LAION), DeviantArt (uma plataforma para artistas e desenvolvedor de DreamUp) e Midjourney, um aplicativo de arte generativo em nome dos artistas afetados. .

Diferentes tipos de trabalho que você pode proteger com direitos autorais em Copyright.gov

Você pode ler tudo sobre o processo em  StableDiffusionLitigation.com , e se você acredita que seu trabalho foi usado para treinar esses geradores, então você pode ter motivos para ingressar na ação coletiva entrando em contato com a equipe jurídica. Solicitar o registro de sua arte no US Copyright Office é um primeiro passo importante se você deseja seguir esse caminho.

Recomendado:  Como criar, editar e visualizar documentos do Microsoft Word gratuitamente

Como outras práticas que atraíram advogados no passado – pirataria, jailbreak, compartilhamento de arquivos – é improvável que uma ação judicial interrompa totalmente a prática. A defesa provavelmente argumentará que essas ferramentas foram treinadas com base em material de “uso justo” coletado de sites públicos. Teremos que esperar e ver para descobrir que efeito ações judiciais como essas terão, se houver.

Marca d’água agressiva

Se você enviar seu trabalho artístico apenas com alguma marca d’água agressiva ou quase autodestrutiva presente, o trabalho artístico incluído nos conjuntos de dados refletirá isso. Em última análise, isso depende muito do motivo pelo qual seu trabalho artístico está sendo carregado. Se você está criando obras de arte de forma não comercial para diversão na Internet, isso parece contraproducente.

Uma marca d’água ridícula do How-To Geek

No entanto, se você vende pinturas do mundo real e deseja um meio de exibi-las on-line antes da venda, isso pode ajudar um pouco. Certamente isso prejudicará a arte final, então é algo que você terá que considerar por si mesmo.

Não carregue sua arte na Internet

Isso pode parecer ridículo (e é), mas se o seu trabalho artístico nunca for carregado na Internet, não há chance de ele ser capturado na rede e usado para treinar IA. É claro que ganhar a vida como artista sem usar a Internet para compartilhar suas obras de arte pode ser quase impossível (especialmente se você trabalha em meio digital).

Para artistas que trabalham com música, isso é uma impossibilidade. Mesmo se você trabalhar com materiais tradicionais como óleo ou aquarela, não há como saber se alguém vai tirar uma foto de uma peça acabada e carregá-la por conta própria.

A arte da IA ​​pode ser protegida por direitos autorais?

A questão de saber se o resultado da IA ​​generativa pode ser protegido por direitos autorais é complexa. Uma coisa geralmente aceita é que a ferramenta de IA usada para gerar a arte raramente tem quaisquer direitos sobre o resultado.

Isto está claramente afirmado nos termos de serviço da maioria das ferramentas, incluindo Stable Diffusion :

Exceto conforme estabelecido neste documento, o Licenciador não reivindica nenhum direito sobre o Resultado gerado por Você usando o Modelo. Você é responsável pelo Resultado gerado e seus usos subsequentes. Nenhum uso da saída pode contrariar qualquer disposição estabelecida na Licença.

A licença proíbe qualquer uso que “viole qualquer lei ou regulamento nacional, federal, estadual, local ou internacional aplicável”, que inclua leis de direitos autorais.

Meio da jornada :

Você possui todos os Ativos que cria com os Serviços, na medida do possível sob a legislação vigente. Isso exclui o aumento de escala das imagens de terceiros, cujas imagens permanecem propriedade dos criadores originais dos ativos.

E OpenAI (DALL-E 2):

Entre as partes e na medida permitida pela lei aplicável, você possui todos os Inputs e, sujeito à sua conformidade com estes Termos, a OpenAI cede a você todos os seus direitos, títulos e interesses no Output.

Em termos de direitos autorais de qualquer coisa que você tenha criado com tal ferramenta, o US Copyright Office declarou que os direitos autorais só se aplicam à arte criada por humanos (juntamente com outros requisitos, como originalidade):

Nos casos em que é reivindicada autoria não humana, os tribunais de recurso concluíram que os direitos de autor não protegem as alegadas criações.

O direito está em constante evolução, pelo que isto poderá ser desafiado com sucesso no futuro. Também é importante notar que elementos de um produto final que não são produto de um gerador de IA (como enredo ou diálogo) ainda podem ser protegidos por direitos autorais, mesmo que outros elementos (como arte ou música) não o sejam.

Os geradores de arte de IA podem usar minha arte protegida por direitos autorais?

A questão não é necessariamente “podem” os geradores de IA usar sua arte protegida por direitos autorais, mas “eles já usam sua arte protegida por direitos autorais”. A resposta a essa pergunta, como muitos artistas descobriram, é um sonoro sim. Acima, discutimos alguns métodos para cancelar conjuntos de dados e impedir que rastreadores indexem seu conteúdo, mas essas técnicas dependem, em última análise, de quem está no comando, respeitando suas preferências.

Recomendado:  Como usar os controles de música do Google Maps para Spotify, Apple Music ou Google Play Music

Você pode descobrir se sua arte está incluída nos maiores conjuntos de dados públicos de imagens usando HaveIBeenTrained.com . Faça upload de uma de suas obras de arte mais conhecidas ou pesquise seu nome, título da obra de arte, webcomic ou outra criação e dê uma olhada. Se você vir sua arte aparecer no site, ela será incluída em um conjunto de dados usado pela Stable Diffusion e outros.

Isso sem falar de outros aplicativos de arte generativa que não divulgam quais conjuntos de dados estão em uso (como o DALL-E da OpenAI). Você sempre pode tentar um prompt como “arte no estilo do seu nome” para ver se algo familiar aparece.

As próximas ferramentas podem ajudar a derrotar os geradores de arte de IA

Pode haver alguma esperança para os artistas na forma de ferramentas que podem tornar mais difícil para uma IA generativa reproduzir obras de arte baseadas em imagens em um conjunto de dados. Infelizmente, essas soluções ainda não chegaram (no momento em que este artigo foi escrito) e não há como dizer até que ponto serão eficazes a longo prazo. As ferramentas de IA evoluem rapidamente, por isso é possível que evoluam para contornar tais salvaguardas.

O primeiro é o Glaze , um projeto da Universidade de Chicago que “adiciona pequenas alterações” à arte antes de ser carregada. Os desenvolvedores referem-se a essas mudanças como uma “capa de estilo” e observam que a arte parece – ao olho humano – quase idêntica ao original, enquanto faz com que a IA interprete mal o estilo como se fosse outro.

Projeto Glaze para camuflagem de imagens

O Glaze será lançado como um aplicativo para Mac e Windows, para que a arte possa ser “ocultada” sem sair do computador do artista. Os desenvolvedores dizem que não comercializarão a ferramenta, portanto ela será de uso gratuito para qualquer pessoa. O projeto Glaze vê a ferramenta como “um primeiro passo necessário em direção a ferramentas de proteção centradas no artista para resistir ao mimetismo da IA”.

Outra técnica, conforme delineada no blog Pursuit da Universidade de Melbourne, descreve o uso sutil de ruído que “altera pixels suficientes em uma imagem para confundir a IA e transformá-la em uma imagem ‘ineprendível’”. A instituição afirma ter criado uma técnica que explora uma fraqueza dos modelos e chega a descrever ferramentas como a Difusão Estável como “aprendizes preguiçosos”.

Esta técnica tem uma ampla gama de usos potenciais, incluindo arte visual, mas também áudio e fotografias que identificam você pessoalmente. É importante reconhecer que essas técnicas ainda estão no início em termos de desenvolvimento, então teremos que esperar e ver do que elas são realmente capazes.

Ascensão dos Robôs

Os aplicativos de arte generativos podem criar obras de arte rapidamente, mas não são verdadeiramente criativos da mesma forma que os humanos . O ChatGPT pode ser capaz de escrever seu currículo , mas você precisará revisá-lo com cuidado porque o chatbot geralmente está errado .

O resultado final é que as soluções atuais de IA podem ser úteis, mas também são fracas .