Uma nova pesquisa da Universidade de Zurique, na Suíça, revela que a geração de imagens com IA generativa pode não ser tão realista quanto esperamos. Quando orientadas a gerar imagens que emulam momentos do passado – como dos séculos 18 e 19, por exemplo –, ferramentas de IA acabam incluindo objetos modernos em cena. Assim, smartphones, ferros de passar roupa e microfones acabam parando em imagens históricas.
O estudo, que teve como base mais de 30 mil imagens geradas por três modelos de difusão de IA generativa, demonstrou que a tecnologia ainda possui limitações técnicas. Além de misturar referências modernas e inserir objetos contemporâneos em momentos históricos, as ferramentas também reproduzem alguns vieses.
Por dentro do estudo da IA generativa
As imagens analisadas na pesquisa foram criadas pelos modelos Stable Diffusion XL, Stable Diffusion 3 e FLUX. 1. Todas foram criadas a partir de cem descrições simples de atividades do ser humano, transformadas em cenas com pano de fundo no passado – desde o século 17 até os tempos atuais.
Um dos fenômenos observados pelos pesquisadores é que, apesar de não haver instruções sobre a estética do período retratado, as IAs generativas aplicaram estilos visuais de acordo com a época. Ou seja, em um prompt que dizia “Uma imagem realista de uma pessoa rindo com um amigo na década de 1930”, a IA generativa aplicou um tom sépia na imagem.
Já quando o pedido é para retratar uma pessoa no século 17, a IA cria uma imagem num estilo de gravura – em vez de uma cena realista. Segundo o estudo, esse fenômeno se dá devido ao aprendizado dos modelos com base nas imagens disponíveis online. Assim, a tecnologia acaba repetindo padrões por mais que o prompt não tenha direcionado dessa forma.
O problema do viés da IA generativa
Quem lembra em 2024 quando o Gemini, do Google, gerou imagens de soldados nazistas da Segunda Guerra Mundial negros? Essas inconsistências históricas demonstraram como os modelos de difusão – que geram imagens transformando ruído aleatório em conteúdo coerente por meio de um processo reverso – facilmente caem em vieses.
Segundo o estudo, isso se dá devido a um processo chamado de entanglement (ou emaranhamento). Nele, características que aparecem com frequência juntas nos dados de treinamento acabam se fundindo nas execuções do modelo.
Por exemplo, se objetos modernos como smartphones costumam aparecer associados a ações como falar ou ouvir, o modelo pode passar a relacionar essas atividades com dispositivos modernos. Isso mesmo quando o prompt pede um cenário histórico. O problema é que, uma vez que essas associações são incorporadas ao modelo, torna-se difícil separar a atividade de seu contexto contemporâneo. O resultado são imagens historicamente imprecisas.
Smartphones no século 20
Para identificar a presença de objetos contemporâneos nas representações geradas por IA, os pesquisadores utilizaram o modelo GPT-4o com modelos de visão computacional. Assim, o modelo da OpenAI analisou as imagens e respondeu a alguns questionamentos. Como: “Essa pessoa está usando dispositivos de áudio modernos, como fones de ouvido ou smartphones?”.
A IA teve uma taxa de acerto de 72% quando comparada com avaliadores humanos. Ou seja, a tecnologia apresenta uma certa dificuldade em distinguir um período histórico do outro.
A conclusão do estudo é que ainda é difícil gerar imagens realistas de personagens de períodos passados. Isso porque a IA irá recorrer a padrões tirados de filmes e da televisão. E, quando os modelos falham em cumprir com os prompts, não há dados de onde a IA pode tirar para corrigir a rota. Assim, corrigir esses vieses irão depender de melhorias futuras.
Prêmio Consumidor Moderno 2025
A votação para as categorias especiais do Prêmio Consumidor Moderno de Excelência em Serviços ao Cliente 2025 está aberta. Você pode definir quem serão os grandes nomes da edição. O CEO do Ano reconhece a liderança e a visão estratégica de executivos no topo. Na categoria Hall da Fama, são homenageados os líderes com visão, estratégia e impacto positivo nas relações com clientes. Já o prêmio de Empresa do Ano valoriza as organizações que realmente fizeram a diferença na experiência do consumidor. Clique aqui e faça a sua escolha. A votação foi prorrogada até 16 de junho.
*Foto gerada com ChatGPT.





