O Reddit – rede social fundada em 2005 por Steve Huffman e Alexis Ohanian, nos Estados Unidos – é uma das maiores plataformas de conteúdo do mundo e um dos sites mais visitados nos Estados Unidos. Com cerca de 73,1 milhões de usuários ativos diariamente, reúne inúmeros fóruns para discussões criadas pelos visitantes sobre os mais diversos assuntos – desde cinema a gastronomia, turismo, esportes, jogos online, política e conselhos de relacionamentos.
Agora, a empresa anunciou uma nova parceria com o Google para que o gigante site de buscas utilize a plataforma para treinar seus modelos de Inteligência Artificial (IA) a partir do conteúdo produzido por lá. Em contrapartida, o Reddit terá acesso ao Vertex AI, serviço do Google que tem como objetivo melhorar os resultados de pesquisa de outras empresas.
O acordo é o primeiro anunciado pelo Reddit desde que a rede social decidiu, no ano passado, fechar o uso gratuito de sua API (Application Programming Interface, programa que permite a integração de um serviço digital em outros), seguindo decisão tomada pelo X (antigo Twitter), sob a nova direção de Elon Musk. Desde então, desenvolvedores e empresas apenas podem utilizar a API do Reddit se pagarem.
“Com esta parceria, e através da nossa API de dados, estamos inaugurando novas formas para o conteúdo do Reddit ser exibido nos produtos do Google, fornecendo acesso programático a novas postagens públicas, comentários, etc., constantemente em evolução e dinâmicos no Reddit”, afirmou a plataforma em comunicado. “Esta colaboração aprimorada fornece ao Google uma forma eficiente e estruturada de acessar o vasto corpo de conteúdo existente no Reddit e permite ao Google utilizar a API de Dados do Reddit para melhorar seus produtos e serviços – incluindo o suporte a novas formas de exibir conteúdo do Reddit e fornecer formas mais eficientes de treinar modelos”.
Treinando a IA
O treinamento dos grandes modelos de linguagem é uma etapa essencial da construção de ferramentas de Inteligência Artificial. É por meio da alimentação e análise de uma imensa quantidade de dados que a tecnologia consegue aprender como oferecer respostas refinadas e precisas para os diferentes comandos. Em setembro de 2023, o X atualizou sua política de privacidade para informar seus usuários de que a plataforma poderia coletar dados biométricos, históricos de trabalho e educação, e outros dados par treinar modelas de IA e Machine Learning.
A nova parceria, mais do que oferecer ao Google uma infinitude de conteúdos para o treinamento de suas próprias IAs, possivelmente deixa à disposição diferentes conteúdos personalizados e com diferentes linguagens e idiomas criados pelos usuários do Reddit. Por fim, uma vez que o treinamento com uso de dados do Reddit será feito por meio de um acordo, o Google evita riscos de processos por infração a direitos autorais.
Além disso, empresas de notícias como The New York Times, Raw Story, AlterNet e The Intercept processaram a OpenAI, criadora do ChatGPT, por infração a direitos autorais devido ao treinamento do modelo de linguagem. Segundo as empresas, a empresa não pediu autorização ou creditou trabalhos de jornalistas ao utilizá-los para alimentar e treinar o ChatGPT. As empresas de mídia Raw Story, AlterNet e The Intercept pedem US$ 2,500 por violação de direitos autorais, e que a OpenAI retire todos os conteúdos protegidos por copyright da base de dados.
Reddit nas buscas
Além do uso dos dados do Reddit em tempo real para o treinamento de IAs do Google, o acordo também prevê que a plataforma terá acesso ao Vertex AI. Trata-se de uma plataforma de Machine Learning que permite o treinamento e implementação de modelos de IA. Por meio do serviço, o Reddit afirma que será mais fácil para pessoas descobrirem e engajarem em diferentes conteúdos e comunidades da rede social.
“Ao tornar o conteúdo e as comunidades do Reddit mais fáceis de encontrar, conseguimos manter nossa crença no internet aberta, ao mesmo tempo em que atendemos melhor aos usuários atuais e alcançamos novos públicos” o Reddit declarou em comunicado. “Tudo isso se baseia em nossa parceria existente com o Google Cloud para integrar novas capacidades alimentadas por IA para melhorar o Reddit e ajudar a alcançar nossa missão de trazer comunidade, pertencimento e capacitação para todos no mundo”.
A empresa também afirma que a parceria não altera a nova política de uso de suas APIs, que não podem ser utilizadas para fins comerciais sem a aprovação do Reddit. A parceria com o Google acontece em período próximo ao estipulado pelo mercado para o IPO (Initial Public Offering, ou oferta pública inicial) do Reddit, cujo pedido foi registrado no dia 22 de fevereiro na Comissão de Valores Mobiliários dos Estados Unidos. Em 2021, a empresa foi avaliada em US$ 10 bilhões após uma rodada de investimentos.
*Foto: Volt Design / Shutterstock.com