Nova geração de IA da OpenAI atinge pontuação inédita no teste ARC-AGI

OpenAI anunciou o modelo o3, que atingiu resultados expressivos no teste ARC-AGI, com pontuação de até 87,5%, marcando um avanço significativo na inteligência artificial adaptável. Desde 2022, os modelos de linguagem evoluíram rapidamente, com mais de 200 grandes modelos ativos e aplicações que vão da saúde à educação. O desempenho do o3 destaca estratégias como Cadeias de Pensamento, que permitem maior generalização e resolução de problemas complexos. No entanto, desafios como custos energéticos, inclusão digital e impactos socioeconômicos levantam reflexões importantes, especialmente diante da chegada do ARC-AGI-2, previsto para 2025.

OpenAI apresentou em 20 de dezembro de 2024 o modelo o3, com resultados expressivos no teste ARC-AGI, responsável por medir o grau de adaptabilidade de sistemas de inteligência artificial.

Esse teste propõe tarefas que parecem simples para humanos, mas historicamente complexas para a maioria das máquinas, como reconhecer padrões ocultos em pequenos conjuntos de dados.

Com uma configuração de custo de computação de até dez mil dólares, o modelo obteve 75,7% de acerto, subindo para 87,5% quando utilizou recursos mais robustos.

Em comparação, a versão GPT-4o alcançou apenas 5% no mesmo teste em 2024.

A trajetória dos modelos

A evolução dos modelos de IA foi acelerada desde 2022, quando o ChatGPT ganhou notoriedade como um dos primeiros sistemas conversacionais de grande visibilidade.

De lá para cá, o setor avançou de um único modelo popular para mais de 200 modelos de grande porte, mantidos por diversas empresas.

Incluindo os modelos menores presentes em plataformas como o Hugging Face, ultrapassamos 1,5 milhão de variantes mapeadas.

Esse crescimento exponencial se reflete em aplicações que vão da análise de prontuários médicos ao suporte personalizado para estudantes.

Desafios de acesso e custos

Apesar de suas promissoras funcionalidades, esses modelos demandam alta capacidade de processamento, gerando preocupações sobre impactos ambientais e acessibilidade em países em desenvolvimento.

A produção de GPUs e chips específicos requer mineração de metais e, quando descartados, tornam-se resíduos eletrônicos que precisam de tratamento.

Ainda há o debate sobre o custo das infraestruturas necessárias, pois poucas organizações possuem recursos para manter operações em larga escala sem comprometer metas de sustentabilidade ou inclusão digital.

A relevância do ARC-AGI

O ARC-AGI (Abstraction and Reasoning Corpus para Inteligência Artificial Geral) difere de outros benchmarks por apresentar tarefas intuitivas para humanos, mas que exigem raciocínio abstrato complexo das máquinas.

É um termômetro para avaliar se um modelo consegue extrapolar o conhecimento adquirido e aplicá-lo de formas criativas, algo essencial para a ideia de inteligência geral.

Entretanto, outros testes como SuperGLUE e MMLU também são utilizados para medir competências específicas, como interpretação de textos ou resolução de questões acadêmicas em várias disciplinas.

Aprendizado e cadeias de pensamento

Para atingir a marca de 75,7% no ARC-AGI, o3 recorre a métodos inspirados em buscas semelhantes às do AlphaZero, que analisava milhões de combinações possíveis de jogadas em jogos de tabuleiro.

A diferença é que, em vez de lances de xadrez, o3 se dedica à linguagem natural, combinando técnicas como “Cadeias de Pensamento”.

Essas cadeias permitem que o modelo divida um problema em etapas menores, testando e ajustando cada parte até formar uma resposta coerente, mesmo sem grandes quantidades de exemplos pré-formatados.

Perspectivas para 2025

Empresas de software veem oportunidades para soluções especializadas, como plataformas de atendimento ao cliente, ferramentas de análise de big data e sistemas de consultoria em saúde.

Em 2025, o ARC-AGI-2 deve elevar o nível de dificuldade, desafiando os limites atuais dos modelos de IA e incentivando parcerias internacionais para explorar novas abordagens de aprendizado.

Há também a discussão sobre o possível surgimento de uma inteligência artificial mais abrangente (AGI), algo que muitos profissionais não descartam diante do desempenho do o3.

Essa perspectiva se conecta a debates sobre a reorganização de profissões, exigindo novas habilidades em análise de dados e desenvolvimento de algoritmos.

Equilíbrio entre tecnologia e sustentabilidade

Os avanços rápidos em IA suscitam reflexões sobre o consumo de energia e a inclusão de diferentes economias no processo de inovação.

Grandes organizações falam em possíveis taxações para modelos que consomem muita energia, visando incentivar o uso de fontes limpas e infraestruturas otimizadas.

Além disso, há propostas de políticas públicas para diminuir a distância entre países centrais e nações em desenvolvimento, facilitando a adoção de soluções de IA em setores críticos como agricultura e educação.

Total
0
Shares
Artigo anterior

Onfly leva tecnologia brasileira de gestão de viagens ao México

Próximo artigo

Progic avança no mercado global com aquisição da startup Simplifica.CI



Artigos relacionados