/
/
Por que a OpenAI e a NVIDIA lançaram modelos de IA de código aberto?

Por que a OpenAI e a NVIDIA lançaram modelos de IA de código aberto?

Com suporte da infraestrutura da NVIDIA, OpenAI lança modelos gpt-oss-120b e 20b, marcando marcando a entrada da empresa no mercado de Inteligência Artificial de código aberto.
Com suporte da infraestrutura da NVIDIA, OpenAI lança modelos gpt-oss-120b e 20b, marcando marcando a entrada da empresa no mercado de Inteligência Artificial de código aberto.
Com suporte da infraestrutura da NVIDIA, OpenAI lança modelos gpt-oss-120b e 20b, marcando marcando a entrada da empresa no mercado de Inteligência Artificial de código aberto.
Foto: NVIDIA.

Dois dos maiores nomes do mercado de Inteligência Artificial, OpenAI e NVIDIA, têm redefinido os limites da tecnologia. A empresas lançaram, em parceria, dois modelos de linguagem de código aberto: o gpt-oss-120b e o gpt-oss-20b. Disponibilizados sob a licença Apache 2.0, os modelos representam um marco na democratização da IA, combinando desempenho comparável aos modelos proprietários mais avançados com flexibilidade, segurança e acessibilidade sem precedentes.

Esses novos modelos de peso aberto foram projetados para permitir que desenvolvedores, startups, empresas, instituições governamentais e pesquisadores em qualquer lugar do mundo possam implementar soluções de IA de alto nível em suas próprias infraestruturas, locais ou na nuvem.

“A OpenAI mostrou ao mundo o que poderia ser construído com a IA da NVIDIA, e agora eles estão promovendo a inovação em software de código aberto”, comenta Jensen Huang, fundador e CEO da NVIDIA. “Os modelos gpt-oss permitem que desenvolvedores em todos os lugares construam sobre essa base de código aberto de última geração, fortalecendo a liderança tecnológica dos EUA em IA, tudo isso na maior infraestrutura de computação de IA do mundo.”

Open source: tendência de IA

O anúncio é especialmente relevante, uma vez que se tratam de modelos de Inteligência Artificial de código aberto. Desde o lançamento do ChatGPT, a OpenAI vem mantendo a tecnologia de seus modelos entre quatro paredes, comercializando assinaturas para uso de usuários e organizações. Já outras tecnologias, como a do DeepSeek, concorrente chinesa, vem apostando na tendência open source.

Segundo um estudo conduzido pela consultoria McKinsey, mais de 50% das organizações dos respondentes relatam utilizar tecnologias de IA de código aberto, frequentemente em conjunto com ferramentas proprietárias de empresas como OpenAI, Google e Anthropic. Além disso, as organizações que atribuem alta prioridade à IA são as que mais tendem a usar tecnologias de código aberto.

Há um motivo para essa tendência: custo. Segundo o estudo, 60% dos tomadores de decisão relataram custos de implementação mais baixos com IA de código aberto em comparação com ferramentas proprietárias semelhantes. Mas, além disso, por meio de modelos de código aberto, as organizações e seus profissionais são, geralmente, capazes de ter um entendimento mais profundo sobre a tecnologia, o que atrai interesse das comunidades de desenvolvedores. 81% dos desenvolvedores e tecnólogos entrevistados pela consultoria afirmaram que a experiência com ferramentas de código aberto é altamente valorizada em sua área.

Modelos pequenos, capacidades gigantes

Embora os modelos gpt-oss-120b e 20b tenham, respectivamente, 117 bilhões e 21 bilhões de parâmetros totais, suas arquiteturas otimizadas os tornam eficientes para inferência com menos memória. O gpt-oss-120b opera em uma única GPU de 80 GB, enquanto o 20b pode rodar localmente com apenas 16 GB de memória. A arquitetura utiliza o método “Mixture of Experts” (MoE), que ativa seletivamente apenas uma parte dos parâmetros por token (5,1 bi e 3,6 bi, respectivamente), garantindo eficiência e escalabilidade.

Ambos foram treinados com as técnicas mais recentes da OpenAI em pré e pós-treinamento, incluindo aprendizado por reforço e alinhamento com os modelos mais avançados da empresa, como o o3 e o o4-mini. Os dados usados foram de alta qualidade, com ênfase em ciência, tecnologia, programação e conhecimentos gerais, e tokenizados com o novo modelo “o200k_harmony”.

Desempenho que rivaliza com os melhores

Segundo a OpenAI, os modelos superam ou igualam modelos de ponta da própria empresa, como o o3-mini e o o4-mini, em tarefas como raciocínio, programação, matemática competitiva, uso de ferramentas e consultas em saúde. O gpt-oss-120b, por exemplo, supera o o4-mini no benchmark de saúde e nas avaliações matemáticas AIME 2024 e 2025.

Os modelos também foram otimizados para uso em fluxos agênticos, com destaque para a habilidade de seguir instruções, realizar chamadas de funções com poucos exemplos, e utilizar ferramentas externas como navegadores e ambientes de execução de código. São compatíveis com sistemas de saída estruturada, suporte para CoT (Chain of Thought) e permitem ajuste dinâmico de níveis de reflexão. Assim, equilibram latência e profundidade de raciocínio.

Segurança como prioridade

A OpenAI implementou uma robusta metodologia de segurança nos modelos, incluindo treinamentos adversariais e filtros para conteúdos sensíveis (como temas químicos, biológicos ou nucleares). Além disso, os modelos passaram por testes com ajustes finos em áreas críticas como biologia e cibersegurança, para ensinar o modelo a recusar prompts perigosos e defender-se de injeções de prompts.

Um diferencial relevante é que os gpt-oss não possuem supervisão direta sobre a linha de raciocínio. Isso, segundo a OpenAI, permite a pesquisadores identificar sinais de comportamento indesejado, além de contribuir para a criação de ferramentas próprias de monitoramento e alinhamento. No entanto, a empresa alerta que essa linha de raciocínio pode conter material inadequado, e não deve ser mostrada diretamente aos usuários finais.

Como parte de seu compromisso com a segurança da comunidade, a OpenAI também lançará um Desafio para Red Teams, oferecendo até US$ 500 mil em prêmios para pesquisadores que identificarem vulnerabilidades ou comportamentos perigosos nos modelos.

A força da colaboração com a NVIDIA

A parceria com a NVIDIA, hoje a empresa mais valiosa do mundo, avaliada em mais US$ 4 trilhões, revela a posição estratégica dos novos modelos. Treinados nas GPUs H100 da NVIDIA – vale lembrar que os chips de IA são considerados assets valiosos no desenvolvimento e treinamento de IA –, os modelos são otimizados para rodar na plataforma NVIDIA CUDA, com desempenho de inferência em centenas de milhões de GPUs ao redor do mundo. A integração com o ecossistema da NVIDIA inclui o suporte a microsserviços do NVIDIA NIM, o que facilita a implementação em ambientes corporativos com alto nível de privacidade e segurança.

Além disso, os modelos estão ajustados para o NVIDIA Blackwell, sistema de ponta que atinge até 1,5 milhão de tokens por segundo usando a arquitetura GB200 NVL72. Com suporte para inferência em 4 bits (NVFP4), é possível rodar LLMs de trilhões de parâmetros com menor consumo de energia e maior precisão.

A comunidade CUDA, que já soma mais de 6,5 milhões de desenvolvedores em 250 países, agora tem acesso facilitado aos modelos gpt-oss, otimizados para rodar em frameworks populares como llama.cpp, Hugging Face, vLLM, FlashInfer e bibliotecas da própria NVIDIA, como o TensorRT-LLM.

Disponibilidade dos modelos da OpenAI

Os modelos estão disponíveis gratuitamente para download no Hugging Face, com implementações de referência em PyTorch, Rust e Metal (da Apple). Ferramentas auxiliares, como um renderizador do prompt “harmony” e exemplos de uso com plataformas populares, também foram disponibilizadas em código aberto.

A Microsoft, por exemplo, apresentou versões otimizadas para GPU do gpt-oss-20b para Windows, ampliando ainda mais o alcance dos modelos para desenvolvedores em sistemas operacionais amplamente usados.

A OpenAI também fechou parcerias com plataformas como AWS, Azure, Databricks, Vercel, Cloudflare, LM Studio, Together AI e empresas de hardware como AMD, Groq e Cerebras, garantindo ampla compatibilidade e desempenho de ponta.

IA aberta como estratégia global

A OpenAI vê os gpt-oss como um passo estratégico para fomentar um ecossistema saudável de IA de código aberto. Os modelos permitem que organizações com recursos limitados, especialmente em mercados emergentes, tenham acesso a tecnologias de última geração sem os altos custos de soluções proprietárias.

“Com acesso a ferramentas potentes e acessíveis, pessoas de qualquer lugar do mundo podem desenvolver, inovar e criar novas oportunidades para si mesmas e para outrem. O amplo acesso a esses avançados open-weight models desenvolvidos nos EUA expande as possibilidades democráticas da IA”, frisa a empresa em nota.

CONAREC 2025

Tecnologia empática, Agentes de IA, conexão emocional, CX Super-Humano. Essas e outras tendências estarão presentes no CONAREC – o maior e mais relevante evento de Customer Experience da América Latina, que ocorre nos dias 9 e 10 de setembro, em São Paulo. Não perca! Clique aqui e saiba mais.

Compartilhe essa notícia:

Recomendadas

MAIS +

Veja mais noticias

Em novo clipe, que antecede o lançamento do novo álbum da banda, os Rolling Stones decidiram encarar de frente a tecnologia que parte da indústria cultural trata como uma ameaça existencial.
O que os Rolling Stones podem nos ensinar sobre IA?
Em novo clipe, que antecede o lançamento do novo álbum da banda, os Rolling Stones decidiram encarar de frente a tecnologia que parte da indústria cultural trata como uma ameaça existencial.
Líderes globais já enxergam a Inteligência Artificial como capaz de transformar operações, modelos de lucro e estruturas corporativas.
IA deixa de ser ferramenta e passa a redesenhar empresas
Líderes globais já enxergam a Inteligência Artificial como capaz de transformar operações, modelos de lucro e estruturas corporativas.
Almaviva se posiciona entre os fornecedores de crescimento mais acelerado globalmente, segundo o Gartner – um feito relevante em um mercado altamente competitivo e fragmentado.
Almaviva revela os vetores de transformação da tecnologia para CX
Almaviva se posiciona entre os fornecedores de crescimento mais acelerado globalmente, segundo o Gartner – um feito relevante em um mercado altamente competitivo e fragmentado.
Estudo global revela que uso de IA cresce entre músicos profissionais como ferramenta de evolução e produtividade.
8 em cada 10 profissionais da música já utilizam IA em fluxos de trabalho
Estudo global revela que uso de IA cresce entre músicos profissionais como ferramenta de evolução e produtividade.

Webstories

SUMÁRIO – Edição 296

A evolução do consumidor traz uma série de desafios inéditos, inclusive para os modelos de gestão corporativa. A Consumidor Moderno tornou-se especialista em entender essas mutações e identificar tendências. Como um ecossistema de conteúdo multiplataforma, temos o inabalável compromisso de traduzir essa expertise para o mundo empresarial assimilar a importância da inserção do consumidor no centro de suas decisões e estratégias.

A busca incansável da excelência e a inovação como essência fomentam nosso espírito questionador, movido pela adrenalina de desafiar e superar limites – sempre com integridade.

Esses são os valores que nos impulsionam a explorar continuamente as melhores práticas para o desenho de uma experiência do cliente fluida e memorável, no Brasil e no mundo.

A IA chega para acelerar e exponencializar os negócios e seus processos. Mas o CX é para sempre, e fará a diferença nas relações com os clientes.

CAPA: Rhauan Porfírio
IMAGEM: IA Generativa | ChatGPT


Publisher
Roberto Meir

Diretor-Executivo de Conhecimento
Jacques Meir
[email protected]

Diretora-Executiva
Lucimara Fiorin
[email protected]

COMERCIAL E PUBLICIDADE
Gerentes

Daniela Calvo
[email protected]

Elisabete Almeida
[email protected]

Érica Issa
[email protected]

Gustavo Bittencourt
[email protected]

Juliana Carvalho
[email protected]

Marcelo Malzoni
[email protected]

NÚCLEO DE CONTEÚDO
Head de Conteúdo
Larissa Sant’Ana
[email protected]

Editora do Portal 
Júlia Fregonese
[email protected]

Produtores de Conteúdo
Bianca Alvarenga
Danielle Ruas 
Jéssica Chalegra
Marcelo Brandão
Victoria Pirolla

Head de Arte
Camila Nascimento
[email protected]

Revisão
Elani Cardoso

COMUNICAÇÃO E MARKETING
Coordenadoras
Nayara Manfredi
Paula Coutinho

TECNOLOGIA
Gerente

Ricardo Domingues


CONSUMIDOR MODERNO
é uma publicação da Padrão Editorial Ltda.
www.gpadrao.com.br
Rua Ceará, 62 – Higienópolis
Brasil – São Paulo – SP – 01234-010
Telefone: +55 (11) 3125-2244
A editora não se responsabiliza pelos conceitos emitidos nos artigos ou nas matérias assinadas. A reprodução do conteúdo editorial desta revista só será permitida com autorização da Editora ou com citação da fonte.
Todos os direitos reservados e protegidos pelas leis do copyright,
sendo vedada a reprodução no todo ou em parte dos textos
publicados nesta revista, salvo expresso
consentimento dos seus editores.
Padrão Editorial Ltda.
Consumidor Moderno ISSN 1413-1226

NA INTERNET
Acesse diariamente o portal
www.consumidormoderno.com.br
e tenha acesso a um conteúdo multiformato
sempre original, instigante e provocador
sobre todos os assuntos relativos ao
comportamento do consumidor e à inteligência
relacional, incluindo tendências, experiência,
jornada do cliente, tecnologias, defesa do
consumidor, nova consciência, gestão e inovação.

PUBLICIDADE
Anuncie na Consumidor Moderno e tenha
o melhor retorno de leitores qualificados
e informados do Brasil.

PARA INFORMAÇÕES SOBRE ORÇAMENTOS:
[email protected]

Rebeca Andrade – Ensinamentos e Aprendizados O futuro do entretenimento no Brasil NBA é a melhor experiência esportiva do mundo Grupo Boticário, em parceria com a Mercur, distribui gratuitamente produtos inclusivos.