Nova geração de IA da OpenAI atinge pontuação inédita no teste ARC-AGI

OpenAI anunciou o modelo o3, que atingiu resultados expressivos no teste ARC-AGI, com pontuação de até 87,5%, marcando um avanço significativo na inteligência artificial adaptável. Desde 2022, os modelos de linguagem evoluíram rapidamente, com mais de 200 grandes modelos ativos e aplicações que vão da saúde à educação. O desempenho do o3 destaca estratégias como Cadeias de Pensamento, que permitem maior generalização e resolução de problemas complexos. No entanto, desafios como custos energéticos, inclusão digital e impactos socioeconômicos levantam reflexões importantes, especialmente diante da chegada do ARC-AGI-2, previsto para 2025.

OpenAI apresentou em 20 de dezembro de 2024 o modelo o3, com resultados expressivos no teste ARC-AGI, responsável por medir o grau de adaptabilidade de sistemas de inteligência artificial.

Esse teste propõe tarefas que parecem simples para humanos, mas historicamente complexas para a maioria das máquinas, como reconhecer padrões ocultos em pequenos conjuntos de dados.

Com uma configuração de custo de computação de até dez mil dólares, o modelo obteve 75,7% de acerto, subindo para 87,5% quando utilizou recursos mais robustos.

Em comparação, a versão GPT-4o alcançou apenas 5% no mesmo teste em 2024.

A trajetória dos modelos

A evolução dos modelos de IA foi acelerada desde 2022, quando o ChatGPT ganhou notoriedade como um dos primeiros sistemas conversacionais de grande visibilidade.

De lá para cá, o setor avançou de um único modelo popular para mais de 200 modelos de grande porte, mantidos por diversas empresas.

Incluindo os modelos menores presentes em plataformas como o Hugging Face, ultrapassamos 1,5 milhão de variantes mapeadas.

Esse crescimento exponencial se reflete em aplicações que vão da análise de prontuários médicos ao suporte personalizado para estudantes.

Desafios de acesso e custos

Apesar de suas promissoras funcionalidades, esses modelos demandam alta capacidade de processamento, gerando preocupações sobre impactos ambientais e acessibilidade em países em desenvolvimento.

A produção de GPUs e chips específicos requer mineração de metais e, quando descartados, tornam-se resíduos eletrônicos que precisam de tratamento.

Ainda há o debate sobre o custo das infraestruturas necessárias, pois poucas organizações possuem recursos para manter operações em larga escala sem comprometer metas de sustentabilidade ou inclusão digital.

A relevância do ARC-AGI

O ARC-AGI (Abstraction and Reasoning Corpus para Inteligência Artificial Geral) difere de outros benchmarks por apresentar tarefas intuitivas para humanos, mas que exigem raciocínio abstrato complexo das máquinas.

É um termômetro para avaliar se um modelo consegue extrapolar o conhecimento adquirido e aplicá-lo de formas criativas, algo essencial para a ideia de inteligência geral.

Entretanto, outros testes como SuperGLUE e MMLU também são utilizados para medir competências específicas, como interpretação de textos ou resolução de questões acadêmicas em várias disciplinas.

Aprendizado e cadeias de pensamento

Para atingir a marca de 75,7% no ARC-AGI, o3 recorre a métodos inspirados em buscas semelhantes às do AlphaZero, que analisava milhões de combinações possíveis de jogadas em jogos de tabuleiro.

A diferença é que, em vez de lances de xadrez, o3 se dedica à linguagem natural, combinando técnicas como “Cadeias de Pensamento”.

Essas cadeias permitem que o modelo divida um problema em etapas menores, testando e ajustando cada parte até formar uma resposta coerente, mesmo sem grandes quantidades de exemplos pré-formatados.

Perspectivas para 2025

Empresas de software veem oportunidades para soluções especializadas, como plataformas de atendimento ao cliente, ferramentas de análise de big data e sistemas de consultoria em saúde.

Em 2025, o ARC-AGI-2 deve elevar o nível de dificuldade, desafiando os limites atuais dos modelos de IA e incentivando parcerias internacionais para explorar novas abordagens de aprendizado.

Há também a discussão sobre o possível surgimento de uma inteligência artificial mais abrangente (AGI), algo que muitos profissionais não descartam diante do desempenho do o3.

Essa perspectiva se conecta a debates sobre a reorganização de profissões, exigindo novas habilidades em análise de dados e desenvolvimento de algoritmos.

Equilíbrio entre tecnologia e sustentabilidade

Os avanços rápidos em IA suscitam reflexões sobre o consumo de energia e a inclusão de diferentes economias no processo de inovação.

Grandes organizações falam em possíveis taxações para modelos que consomem muita energia, visando incentivar o uso de fontes limpas e infraestruturas otimizadas.

Além disso, há propostas de políticas públicas para diminuir a distância entre países centrais e nações em desenvolvimento, facilitando a adoção de soluções de IA em setores críticos como agricultura e educação.

Artigos Recentes

Rajesh Jha sai da posição executiva na Microsoft em 1º de julho e passará a atuar como conselheiro

Perplexity é proibida de rodar agentes de compra na Amazon

Rhoda levanta US$ 450 milhões e aposta em IA treinada com milhões de vídeos para tornar robôs mais versáteis

Nova geração de IA da OpenAI atinge pontuação inédita no teste ARC-AGI

A trajetória dos modelos

Desafios de acesso e custos

A relevância do ARC-AGI

Aprendizado e cadeias de pensamento

Perspectivas para 2025

Equilíbrio entre tecnologia e sustentabilidade

Os bytes essenciais da semana direto no seu inbox, sem fluflu

Artigo anterior

Onfly leva tecnologia brasileira de gestão de viagens ao México

Próximo artigo

Progic avança no mercado global com aquisição da startup Simplifica.CI

Nova geração de IA da OpenAI atinge pontuação inédita no teste ARC-AGI

A trajetória dos modelos

Desafios de acesso e custos

A relevância do ARC-AGI

Aprendizado e cadeias de pensamento

Perspectivas para 2025

Equilíbrio entre tecnologia e sustentabilidade

Os bytes essenciais da semana direto no seu inbox, sem fluflu

Artigo anterior

Próximo artigo

Artigos relacionados