OpenAI anunciou o modelo o3, que atingiu resultados expressivos no teste ARC-AGI, com pontuação de até 87,5%, marcando um avanço significativo na inteligência artificial adaptável. Desde 2022, os modelos de linguagem evoluíram rapidamente, com mais de 200 grandes modelos ativos e aplicações que vão da saúde à educação. O desempenho do o3 destaca estratégias como Cadeias de Pensamento, que permitem maior generalização e resolução de problemas complexos. No entanto, desafios como custos energéticos, inclusão digital e impactos socioeconômicos levantam reflexões importantes, especialmente diante da chegada do ARC-AGI-2, previsto para 2025.
OpenAI apresentou em 20 de dezembro de 2024 o modelo o3, com resultados expressivos no teste ARC-AGI, responsável por medir o grau de adaptabilidade de sistemas de inteligência artificial.
Esse teste propõe tarefas que parecem simples para humanos, mas historicamente complexas para a maioria das máquinas, como reconhecer padrões ocultos em pequenos conjuntos de dados.
Com uma configuração de custo de computação de até dez mil dólares, o modelo obteve 75,7% de acerto, subindo para 87,5% quando utilizou recursos mais robustos.
Em comparação, a versão GPT-4o alcançou apenas 5% no mesmo teste em 2024.
A trajetória dos modelos
A evolução dos modelos de IA foi acelerada desde 2022, quando o ChatGPT ganhou notoriedade como um dos primeiros sistemas conversacionais de grande visibilidade.
De lá para cá, o setor avançou de um único modelo popular para mais de 200 modelos de grande porte, mantidos por diversas empresas.
Incluindo os modelos menores presentes em plataformas como o Hugging Face, ultrapassamos 1,5 milhão de variantes mapeadas.
Esse crescimento exponencial se reflete em aplicações que vão da análise de prontuários médicos ao suporte personalizado para estudantes.
Desafios de acesso e custos
Apesar de suas promissoras funcionalidades, esses modelos demandam alta capacidade de processamento, gerando preocupações sobre impactos ambientais e acessibilidade em países em desenvolvimento.
A produção de GPUs e chips específicos requer mineração de metais e, quando descartados, tornam-se resíduos eletrônicos que precisam de tratamento.
Ainda há o debate sobre o custo das infraestruturas necessárias, pois poucas organizações possuem recursos para manter operações em larga escala sem comprometer metas de sustentabilidade ou inclusão digital.
A relevância do ARC-AGI
O ARC-AGI (Abstraction and Reasoning Corpus para Inteligência Artificial Geral) difere de outros benchmarks por apresentar tarefas intuitivas para humanos, mas que exigem raciocínio abstrato complexo das máquinas.
É um termômetro para avaliar se um modelo consegue extrapolar o conhecimento adquirido e aplicá-lo de formas criativas, algo essencial para a ideia de inteligência geral.
Entretanto, outros testes como SuperGLUE e MMLU também são utilizados para medir competências específicas, como interpretação de textos ou resolução de questões acadêmicas em várias disciplinas.
Aprendizado e cadeias de pensamento
Para atingir a marca de 75,7% no ARC-AGI, o3 recorre a métodos inspirados em buscas semelhantes às do AlphaZero, que analisava milhões de combinações possíveis de jogadas em jogos de tabuleiro.
A diferença é que, em vez de lances de xadrez, o3 se dedica à linguagem natural, combinando técnicas como “Cadeias de Pensamento”.
Essas cadeias permitem que o modelo divida um problema em etapas menores, testando e ajustando cada parte até formar uma resposta coerente, mesmo sem grandes quantidades de exemplos pré-formatados.
Perspectivas para 2025
Empresas de software veem oportunidades para soluções especializadas, como plataformas de atendimento ao cliente, ferramentas de análise de big data e sistemas de consultoria em saúde.
Em 2025, o ARC-AGI-2 deve elevar o nível de dificuldade, desafiando os limites atuais dos modelos de IA e incentivando parcerias internacionais para explorar novas abordagens de aprendizado.
Há também a discussão sobre o possível surgimento de uma inteligência artificial mais abrangente (AGI), algo que muitos profissionais não descartam diante do desempenho do o3.
Essa perspectiva se conecta a debates sobre a reorganização de profissões, exigindo novas habilidades em análise de dados e desenvolvimento de algoritmos.
Equilíbrio entre tecnologia e sustentabilidade
Os avanços rápidos em IA suscitam reflexões sobre o consumo de energia e a inclusão de diferentes economias no processo de inovação.
Grandes organizações falam em possíveis taxações para modelos que consomem muita energia, visando incentivar o uso de fontes limpas e infraestruturas otimizadas.
Além disso, há propostas de políticas públicas para diminuir a distância entre países centrais e nações em desenvolvimento, facilitando a adoção de soluções de IA em setores críticos como agricultura e educação.