Dois dos maiores nomes do mercado de Inteligência Artificial, OpenAI e NVIDIA, têm redefinido os limites da tecnologia. A empresas lançaram, em parceria, dois modelos de linguagem de código aberto: o gpt-oss-120b e o gpt-oss-20b. Disponibilizados sob a licença Apache 2.0, os modelos representam um marco na democratização da IA, combinando desempenho comparável aos modelos proprietários mais avançados com flexibilidade, segurança e acessibilidade sem precedentes.
Esses novos modelos de peso aberto foram projetados para permitir que desenvolvedores, startups, empresas, instituições governamentais e pesquisadores em qualquer lugar do mundo possam implementar soluções de IA de alto nível em suas próprias infraestruturas, locais ou na nuvem.
“A OpenAI mostrou ao mundo o que poderia ser construído com a IA da NVIDIA, e agora eles estão promovendo a inovação em software de código aberto”, comenta Jensen Huang, fundador e CEO da NVIDIA. “Os modelos gpt-oss permitem que desenvolvedores em todos os lugares construam sobre essa base de código aberto de última geração, fortalecendo a liderança tecnológica dos EUA em IA, tudo isso na maior infraestrutura de computação de IA do mundo.”
Open source: tendência de IA
O anúncio é especialmente relevante, uma vez que se tratam de modelos de Inteligência Artificial de código aberto. Desde o lançamento do ChatGPT, a OpenAI vem mantendo a tecnologia de seus modelos entre quatro paredes, comercializando assinaturas para uso de usuários e organizações. Já outras tecnologias, como a do DeepSeek, concorrente chinesa, vem apostando na tendência open source.
Segundo um estudo conduzido pela consultoria McKinsey, mais de 50% das organizações dos respondentes relatam utilizar tecnologias de IA de código aberto, frequentemente em conjunto com ferramentas proprietárias de empresas como OpenAI, Google e Anthropic. Além disso, as organizações que atribuem alta prioridade à IA são as que mais tendem a usar tecnologias de código aberto.
Há um motivo para essa tendência: custo. Segundo o estudo, 60% dos tomadores de decisão relataram custos de implementação mais baixos com IA de código aberto em comparação com ferramentas proprietárias semelhantes. Mas, além disso, por meio de modelos de código aberto, as organizações e seus profissionais são, geralmente, capazes de ter um entendimento mais profundo sobre a tecnologia, o que atrai interesse das comunidades de desenvolvedores. 81% dos desenvolvedores e tecnólogos entrevistados pela consultoria afirmaram que a experiência com ferramentas de código aberto é altamente valorizada em sua área.
Modelos pequenos, capacidades gigantes
Embora os modelos gpt-oss-120b e 20b tenham, respectivamente, 117 bilhões e 21 bilhões de parâmetros totais, suas arquiteturas otimizadas os tornam eficientes para inferência com menos memória. O gpt-oss-120b opera em uma única GPU de 80 GB, enquanto o 20b pode rodar localmente com apenas 16 GB de memória. A arquitetura utiliza o método “Mixture of Experts” (MoE), que ativa seletivamente apenas uma parte dos parâmetros por token (5,1 bi e 3,6 bi, respectivamente), garantindo eficiência e escalabilidade.
Ambos foram treinados com as técnicas mais recentes da OpenAI em pré e pós-treinamento, incluindo aprendizado por reforço e alinhamento com os modelos mais avançados da empresa, como o o3 e o o4-mini. Os dados usados foram de alta qualidade, com ênfase em ciência, tecnologia, programação e conhecimentos gerais, e tokenizados com o novo modelo “o200k_harmony”.
Desempenho que rivaliza com os melhores
Segundo a OpenAI, os modelos superam ou igualam modelos de ponta da própria empresa, como o o3-mini e o o4-mini, em tarefas como raciocínio, programação, matemática competitiva, uso de ferramentas e consultas em saúde. O gpt-oss-120b, por exemplo, supera o o4-mini no benchmark de saúde e nas avaliações matemáticas AIME 2024 e 2025.
Os modelos também foram otimizados para uso em fluxos agênticos, com destaque para a habilidade de seguir instruções, realizar chamadas de funções com poucos exemplos, e utilizar ferramentas externas como navegadores e ambientes de execução de código. São compatíveis com sistemas de saída estruturada, suporte para CoT (Chain of Thought) e permitem ajuste dinâmico de níveis de reflexão. Assim, equilibram latência e profundidade de raciocínio.
Segurança como prioridade
A OpenAI implementou uma robusta metodologia de segurança nos modelos, incluindo treinamentos adversariais e filtros para conteúdos sensíveis (como temas químicos, biológicos ou nucleares). Além disso, os modelos passaram por testes com ajustes finos em áreas críticas como biologia e cibersegurança, para ensinar o modelo a recusar prompts perigosos e defender-se de injeções de prompts.
Um diferencial relevante é que os gpt-oss não possuem supervisão direta sobre a linha de raciocínio. Isso, segundo a OpenAI, permite a pesquisadores identificar sinais de comportamento indesejado, além de contribuir para a criação de ferramentas próprias de monitoramento e alinhamento. No entanto, a empresa alerta que essa linha de raciocínio pode conter material inadequado, e não deve ser mostrada diretamente aos usuários finais.
Como parte de seu compromisso com a segurança da comunidade, a OpenAI também lançará um Desafio para Red Teams, oferecendo até US$ 500 mil em prêmios para pesquisadores que identificarem vulnerabilidades ou comportamentos perigosos nos modelos.
A força da colaboração com a NVIDIA
A parceria com a NVIDIA, hoje a empresa mais valiosa do mundo, avaliada em mais US$ 4 trilhões, revela a posição estratégica dos novos modelos. Treinados nas GPUs H100 da NVIDIA – vale lembrar que os chips de IA são considerados assets valiosos no desenvolvimento e treinamento de IA –, os modelos são otimizados para rodar na plataforma NVIDIA CUDA, com desempenho de inferência em centenas de milhões de GPUs ao redor do mundo. A integração com o ecossistema da NVIDIA inclui o suporte a microsserviços do NVIDIA NIM, o que facilita a implementação em ambientes corporativos com alto nível de privacidade e segurança.
Além disso, os modelos estão ajustados para o NVIDIA Blackwell, sistema de ponta que atinge até 1,5 milhão de tokens por segundo usando a arquitetura GB200 NVL72. Com suporte para inferência em 4 bits (NVFP4), é possível rodar LLMs de trilhões de parâmetros com menor consumo de energia e maior precisão.
A comunidade CUDA, que já soma mais de 6,5 milhões de desenvolvedores em 250 países, agora tem acesso facilitado aos modelos gpt-oss, otimizados para rodar em frameworks populares como llama.cpp, Hugging Face, vLLM, FlashInfer e bibliotecas da própria NVIDIA, como o TensorRT-LLM.
Disponibilidade dos modelos da OpenAI
Os modelos estão disponíveis gratuitamente para download no Hugging Face, com implementações de referência em PyTorch, Rust e Metal (da Apple). Ferramentas auxiliares, como um renderizador do prompt “harmony” e exemplos de uso com plataformas populares, também foram disponibilizadas em código aberto.
A Microsoft, por exemplo, apresentou versões otimizadas para GPU do gpt-oss-20b para Windows, ampliando ainda mais o alcance dos modelos para desenvolvedores em sistemas operacionais amplamente usados.
A OpenAI também fechou parcerias com plataformas como AWS, Azure, Databricks, Vercel, Cloudflare, LM Studio, Together AI e empresas de hardware como AMD, Groq e Cerebras, garantindo ampla compatibilidade e desempenho de ponta.
IA aberta como estratégia global
A OpenAI vê os gpt-oss como um passo estratégico para fomentar um ecossistema saudável de IA de código aberto. Os modelos permitem que organizações com recursos limitados, especialmente em mercados emergentes, tenham acesso a tecnologias de última geração sem os altos custos de soluções proprietárias.
“Com acesso a ferramentas potentes e acessíveis, pessoas de qualquer lugar do mundo podem desenvolver, inovar e criar novas oportunidades para si mesmas e para outrem. O amplo acesso a esses avançados open-weight models desenvolvidos nos EUA expande as possibilidades democráticas da IA”, frisa a empresa em nota.
CONAREC 2025
Tecnologia empática, Agentes de IA, conexão emocional, CX Super-Humano. Essas e outras tendências estarão presentes no CONAREC – o maior e mais relevante evento de Customer Experience da América Latina, que ocorre nos dias 9 e 10 de setembro, em São Paulo. Não perca! Clique aqui e saiba mais.





