Google lança um gerador de imagens alimentado por IA

Malditos deepfakes de Taylor Swift, o Google está lançando uma nova ferramenta alimentada por IA, ImageFX, para criação de imagens.

Sustentado pelo modelo de imagem Imagen 2, um modelo de imagem GenAI desenvolvido pela equipe DeepMind do Google, o ImageFX oferece uma interface de usuário baseada em prompt para criar e editar imagens. Isso não é diferente de ferramentas como o DALL-E 3 da OpenAI, Midjourney, Imagine with Meta AI da Meta e o Designer da Microsoft. Mas o toque único do ImageFX são os "chips expressivos" - basicamente uma lista de sugestões de palavras-chave que permitem aos usuários experimentar "dimensões adjacentes" de suas criações e ideias.

"Projetado para experimentação e criatividade, o ImageFX permite que você crie imagens com um simples prompt de texto e, em seguida, modifique-as facilmente com uma nova abordagem ao usar chips expressivos", escreve o Google em um post de blog.

Mas e o potencial para abuso - especialmente à luz dos eventos recentes?

Créditos da Imagem: Google

O Google afirma que tomou medidas para garantir que o ImageFX não possa ser usado de maneiras para as quais não foi destinado, por exemplo, adicionando "salvaguardas técnicas" para limitar "saídas problemáticas" como conteúdo violento, ofensivo e sexualmente explícito. O ImageFX também possui um filtro de nível de prompt para "pessoas nomeadas", presumivelmente figuras públicas - embora o Google não tenha sido especialmente claro sobre esse ponto em seus materiais de imprensa.

"Investimos na segurança dos dados de treinamento desde o início", disse o Google. "Em conformidade com nossos princípios de IA, também realizamos extensos testes adversariais e de red teaming para identificar e mitigar potenciais conteúdos nocivos e problemáticos."

Como medida de segurança adicional, o Google está marcando as imagens produzidas usando o ImageFX com o SynthID, uma marca d'água digital supostamente robusta contra edições e recortes de imagem.

Um exemplo de imagem do Imagen 2. Créditos da Imagem: Google

“As marcas d'água SynthID são imperceptíveis ao olho humano, mas detectáveis para identificação”, continua o Google no post do blog. "Com insights adicionais em 'Sobre esta imagem', você saberá se uma imagem pode ter sido gerada com as ferramentas de IA do Google quando a encontrar na Pesquisa do Google ou no Chrome."

Você encontrará o ImageFX no AI Test Kitchen, o aplicativo da web do Google para projetos experimentais de IA.

Imagen 2 expandido

Em notícias relacionadas hoje, o Google disse que está levando o Imagen 2 para mais de seus produtos e serviços a partir desta semana, incluindo para sua experiência de pesquisa com IA de próxima geração e a família de serviços de IA gerenciados Vertex AI.

O Imagen 2 - que também agora alimenta capacidades de texto para imagem nos Anúncios do Google e Duet AI no Workspace, a suíte GenAI do Google para produtividade - fez seu caminho para a SGE do Google (Search Generative Experience). A SGE, que começou a apresentar ferramentas de geração de imagem para usuários na Pesquisa de Imagens do Google em outubro passado, agora utiliza o Imagen 2 para gerar imagens. Os usuários podem inserir um prompt especificando que tipo de imagem desejam e a SGE retornará quatro resultados diretamente na experiência conversacional da SGE.

Outro exemplo do Imagen 2. Créditos da Imagem: Google

No Vertex AI, o Imagen 2 está disponível por meio de uma API para os clientes do Google Cloud. Em outros lugares, o Imagen 2 agora pode ser invocado pelo Bard, o chatbot alimentado por IA do Google.

"Com o Imagen 2, o Bard entende prompts simples ou complexos para que você possa gerar uma variedade de imagens de alta qualidade", explica o Google. "Basta digitar uma descrição - como 'criar uma imagem de um cachorro surfando' - e o Bard gerará visuais personalizados e abrangentes para ajudar a dar vida à sua ideia."

O Google ainda não revelou os dados usados para treinar o Imagen 2, o que - embora decepcionante - não é exatamente uma surpresa. É uma questão legal em aberto se os fornecedores de GenAI como o Google podem treinar um modelo em dados publicamente disponíveis - mesmo protegidos por direitos autorais - e depois comercializar esse modelo.

Créditos da Imagem: Google

Ações judiciais relevantes estão seguindo seu caminho pelos tribunais, com os fornecedores argumentando que estão protegidos pela doutrina do uso justo. Mas levará algum tempo até que a poeira assente.

Enquanto isso, o Google está jogando pelo seguro ao ficar em silêncio sobre o assunto.