Depois de a Meta lançar sua própria plataforma de compartilhamento de vídeos de IA, chegou a vez da OpenAI. A empresa lançou o modelo Sora 2, de criação de vídeos e áudios com Inteligência Artificial generativa. A nova geração da ferramenta, lançada pela primeira vez em fevereiro de 2024, foi treinada com capacidades de simulação mais avançadas. O resultado é um modelo capaz de criar cenários em vídeo e áudio mais complexos.
“Embora ainda imperfeito, ele é melhor em obedecer às leis da física em comparação com sistemas anteriores”, afirma a empresa. “Essa é uma capacidade extremamente importante para qualquer simulador de mundo realmente útil – é preciso ser capaz de modelar o fracasso, não apenas o sucesso.”
O modelo também é capaz de inserir elementos do mundo real diretamente nos vídeos. Por exemplo, é capaz de inserir pessoas reais em ambientes gerados pela IA – inclusive, com uma representação de imagem e voz precisa. O próprio Sam Altman, CEO da OpenAI, estampa um dos vídeos de apresentação do Sora 2. Confira:
App Sora
O novo modelo foi acompanhado de um aplicativo próprio para a criação e compartilhamento de vídeos gerados por IA. O app, disponível para o sistema iOS, foi nomeado como Sora.
Usuários podem criar, remixar vídeos gerados por outras pessoas, e descobrir novas produções por meio de um feed personalizável. Ainda, é possível colocar a si mesmo nos cenários generativos – isso após o usuário registrar uma única gravação no aplicativo para verificação de identidade.
Trata-se de uma dinâmica similar ao Vibes, da Meta, que conta com um feed de vídeos curtos gerados por IA. Além disso, também permite remixar vídeos de outros usuários ou começar a produção do zero.
AI slop?
À primeira vista, as novidades da OpenAI e da Meta parecem seguir movimentos já liderados por outras plataformas, como TikTok e Instagram. Nelas, a criação de conteúdo como vídeos, fotos e Stories guia as interações e engajamento, seja por tons mais humorísticos, conversas reais ou lifestyle. No caso do Sora e do Vibes, a ideia parece mais uma iniciativa de compartilhamento de criação de conteúdo, mas com IA.
No entanto, há também um risco dessas plataformas fomentarem cada vez mais o chamado AI slop – conteúdos de baixa qualidade gerados pela Inteligência Artificial. Ou então, até vídeos de brain rot – conteúdos non sense sem um propósito ou assunto aparente.
Esse tipo de vídeo já é bastante frequente em plataformas como TikTok e Instagram. Alguns casos já viralizaram nas redes devido à verossimilhança, como o vídeo que mostra um canguru sendo impedido de entrar em uma aeronave.
A ferramenta da OpenAI também revela um grande potencial para deepfakes, uma vez que é possível inserir a aparência e a voz do usuário nos vídeos. Mas, ainda não é claro os limites da ferramenta para barrar essas iniciativas.
Com o Sora, os usuários podem esperar mais possibilidades de geração de vídeos, é verdade. É possível imaginar novas realidades, criar cenários impossíveis e se inserir em mundos fantásticos em poucos prompts. Mas, até que ponto esse é um conteúdo que gerará interesse a longo prazo?
Lançamento responsável
Segundo a OpenAI, “preocupações com doomscrolling (rolagem infinita), vício, isolamento e feeds otimizados por aprendizado por reforço (RL-sloptimized) estão no topo das discussões”.
Para lidar com esses desafios, a empresa aponta que está oferecendo ferramentas aos usuários para que possam ter controle do que desejam ver no feed. Assim, a empresa desenvolveu novos algoritmos de recomendação que podem ser instruídos por meio de linguagem natural. Ainda, a plataforma oferece mecanismos para questionar usuários sobre seu bem-estar e entender se desejam personalizar o feed.
“Por padrão, mostramos a você conteúdos fortemente direcionados a pessoas que você segue ou com quem interage, e priorizamos vídeos que o modelo acredita que você tem mais probabilidade de usar como inspiração para suas próprias criações. Não estamos otimizando o tempo gasto no feed e projetamos explicitamente o aplicativo para maximizar a criação, não o consumo.”
Ainda, a OpenAI destaca que os usuários estão no controle quanto ao uso da imagem e voz nos vídeos. Assim, eles podem revogar acesso ou vídeos com a participação dos usuários a qualquer momento.
Disponibilidade
Hoje, o novo app do Sora está disponível para o sistema iOS nos Estados Unidos e no Canadá. No entanto, a solução deve ser expandida para mais países em breve. Incialmente, o app estará disponível gratuitamente, com “limites generosos” para que as pessoas explorem suas capacidades.
Ainda, usuários do ChatGPT Pro poder usar o modelo Sora 2 Pro, de maior qualidade e mais experimental, no site sora.com e, em breve, no aplicativo.





