Um projeto inédito de Inteligência Artificial (IA) tem ganhado corpo na América Latina e promete colocar a região no mapa global do desenvolvimento de grandes modelos de linguagem. Trata-se do Latam-GPT, iniciativa liderada pelo Centro Nacional de Inteligência Artificial (CENIA), organização sem fins lucrativos do Chile. Ela busca criar um modelo de código aberto treinado em idiomas, contextos e referências culturais latino-americanas.
A proposta tem o objetivo de desenvolver uma ferramenta capaz de rivalizar em escala com os modelos comerciais já existentes. Porém, com uma característica única e ser profundamente enraizada na realidade da região. Em uma entrevista concedida ao portal Wired, Álvaro Soto, diretor do CENIA, explica que a visão é de colaboração ampla e descentralizada.
“Este trabalho não pode ser realizado por apenas um grupo ou um país na América Latina: é um desafio que exige a participação de todos”, afirma. “O Latam-GPT é um projeto que busca criar um modelo de IA aberto, gratuito e, acima de tudo, colaborativo. Estamos trabalhando há dois anos com um processo bastante de baixo para cima, reunindo cidadãos de diferentes países que desejam colaborar. Recentemente, também vimos algumas iniciativas de cima para baixo, com governos se interessando e começando a participar do projeto.”
Um modelo para a região
Diferentemente das big techs que dominam o setor, como OpenAI, Google e Anthropic, a ideia não é competir diretamente com modelos globais. O Latam-GPT pretende ser específico para a América Latina e o Caribe, levando em conta aspectos como dialetos, história e cultura da região.
Até o momento, o projeto já consolidou 33 parcerias estratégicas com instituições latino-americanas e caribenhas. Com isso, já reuniu um acervo de mais de oito terabytes de textos, o equivalente a milhões de livros. Esse corpus foi usado para treinar um modelo de 50 bilhões de parâmetros, comparável ao GPT-3.5, com capacidade para lidar com tarefas complexas de raciocínio, tradução e associação de ideias.
A base de dados reflete a diversidade da região. São mais de 2,6 milhões de documentos coletados em 20 países da América Latina e na Espanha. O Brasil lidera o volume, com 685 mil documentos, seguido por México (385 mil), Espanha (325 mil), Colômbia (220 mil) e Argentina (210 mil).
Educação, cultura e ciência como prioridades
O projeto tem um olhar estratégico sobre a independência tecnológica da região. Para o executivo, depender exclusivamente de modelos desenvolvidos nos Estados Unidos, Europa ou China significa abrir mão da capacidade de moldar a IA às necessidades locais.
A educação, segundo Álvaro Soto para a Wired, será um dos focos centrais. Ele frisa que, se tivesse que escolher onde aplicar essas tecnologias, seria na educação, uma vez que aborda a causa raiz de muitos dos problemas enfrentados na região. Ele reforça ainda que essas ferramentas podem preparar os jovens para as novas habilidades exigidas pela economia digital, ao mesmo tempo em que valorizam as ciências sociais e o pensamento crítico.
Além disso, o projeto pretende avançar no registro e valorização da diversidade cultural latino-americana. Nesta primeira fase, o Latam-GPT inclui dados sobre povos ancestrais, como astecas e incas. A ideia é que, em versões futuras, também seja capaz de processar línguas indígenas.
Infraestrutura e próximos passos do Latam-GPT
Para sustentar esse desenvolvimento, o Latam-GPT conta com o apoio da Universidade de Tarapacá (UTA), no Chile, que abriga um dos maiores centros de supercomputação da região. O investimento projetado é de US$ 10 milhões, em um cluster com 12 nós, cada um equipado com oito GPUs NVIDIA H200 de última geração.
A primeira versão do Latam-GPT será lançada ainda este ano e deve evoluir conforme novos parceiros se unam à iniciativa. O plano inclui o desenvolvimento de modelos multimodais, capazes de processar não apenas texto, mas também imagens e vídeos. Além disso, terá versões adaptadas a setores específicos, como educação, saúde, agricultura e cultura.
Para Álvaro Soto, o sucesso do projeto será medido pela capacidade de criar uma Inteligência Artificial verdadeiramente enraizada na América Latina. Além disso, ele acredita que o sucesso significaria que o Latam-GPT desempenhou um papel importante no desenvolvimento da IA na região.
*Foto: DALL-E






