A ByteDance, gigante chinesa de tecnologia e dona do TikTok, está dobrando suas apostas na Inteligência Artificial como estratégia para se manter relevante nos Estados Unidos, onde enfrenta desafios regulatórios e concorrência acirrada. O mais recente avanço nessa corrida é a OmniHuman, uma IA generativa capaz de criar vídeos hiper-realistas a partir de uma única foto, sincronizando movimentos corporais e labiais com um áudio fornecido pelo usuário.
A OmniHuman se destaca por sua capacidade de transformar uma imagem estática em um vídeo dinâmico e realista. De acordo com a ByteDance, seu diferencial está na combinação de áudio e vídeo para controle preciso de expressões faciais e gestos corporais. A empresa explica que, devido às condições mistas de treinamento do modelo, a IA pode imitar ações específicas de um vídeo de referência ou ser direcionada apenas por um áudio.
O modelo foi treinado com 18,7 mil horas de vídeos humanos, o que permitiu um refinamento significativo na naturalidade dos movimentos e na precisão da sincronização labial. Além disso, a OmniHuman aceita uma ampla variedade de inputs, desde fotos de pessoas até elementos não-humanos, como cartuns, objetos artificiais e animais, ampliando suas possibilidades de aplicação.
Aplicações e desafios
Um dos exemplos demonstrados pela ByteDance é um vídeo de Albert Einstein aparentemente dando uma aula. A partir de uma única foto do renomado cientista e um áudio pré-existente, a IA foi capaz de dar “vida” a Einstein, criando um efeito surpreendente de realismo. A tecnologia também promete aprimorar o manuseio de gestos, um dos maiores desafios para os métodos atuais de IA generativa.
Embora a inovação da ByteDance abra novas possibilidades para a criação de conteúdo digital, também levanta preocupações éticas e regulatórias, principalmente no que diz respeito ao uso indevido de deepfakes. A capacidade da OmniHuman de gerar vídeos tão realistas pode ser explorada para desinformação e manipulação de imagens públicas, algo que já é motivo de atenção para governos e especialistas em tecnologia.
Enquanto empresas investem em inovações para impressionar o público, a questão que fica é: estamos preparados para um mundo onde realidade e ficção se tornam praticamente indistinguíveis?
Ilusão dos deepfakes e vulnerabilidade
O avanço da IA generativa levanta preocupações sobre a disseminação de deepfakes, vídeos e imagens falsificadas de maneira quase imperceptível. Um estudo recente da iProov revelou que menos de 1% das pessoas consegue identificar com precisão conteúdos gerados por IA. A pesquisa testou 2.000 consumidores no Reino Unido e nos EUA e mostrou que apenas 0,1% dos participantes distinguiram corretamente entre vídeos reais e falsificados.
Outros destaques do estudo incluem:
- Gerações mais velhas são mais vulneráveis: 30% das pessoas entre 55 e 64 anos e 39% das com 65 anos ou mais nunca ouviram falar de deepfakes.
- Vídeos são mais difíceis de detectar: apenas 9% dos entrevistados conseguiram identificar corretamente todos os deepfakes em vídeo.
- Falsa sensação de segurança: mais de 60% dos participantes acreditavam que poderiam reconhecer deepfakes, apesar do baixo desempenho.
- Redução da confiança nas redes sociais: Meta (49%) e TikTok (47%) são apontadas como as principais plataformas de disseminação de deepfakes, o que tem levado metade dos entrevistados a confiar menos nas mídias sociais.
- Falta de ação e conscientização: apenas 29% dos entrevistados tomam alguma atitude ao encontrar um deepfake, e 48% dizem não saber como denunciá-los.
O estudo também destacou que apenas um em cada quatro usuários busca fontes alternativas para verificar a autenticidade de um vídeo suspeito, e apenas 11% analisam criticamente a fonte e o contexto da informação.
Desafios para a ByteDance
A nova solução da OmniHuman traz diversas possibilidades criativas, desde sua aplicação a campanhas de marketing, experiência do consumidor e até mesmo em setores como audiovisual e artístico. No entanto, hoje a ByteDance aguarda um posicionamento sobre um possível banimento do TikTok nos Estados Unidos ou a possível venda da rede social para uma empresa norte-americana. A preocupação do governo dos Estados Unidos se deve, principalmente, à falta de transparência da empresa em relação ao compartilhamento de dados de usuários norte-americanos com o governo chinês.
Assim, será que essa nova solução também poderá enfrentar sanções dos Estados Unidos? Sendo o país uma das lideranças globais em IA, com esforços anunciados de se tornar uma verdadeira supremacia na tecnologia, o que podemos esperar para as próximas soluções de IA generativa do outro lado do mundo?