Amazon investiga falhas causadas por código com IA e convoca engenheiros para revisão interna

A Amazon reuniu recentemente um grande grupo de engenheiros para analisar uma sequência de falhas que afetaram seus sistemas de ecommerce e infraestrutura. O encontro foi convocado após diversos incidentes operacionais, alguns deles associados ao uso de ferramentas de programação baseadas em inteligência artificial.

A empresa identificou uma tendência de problemas nos últimos meses e decidiu aprofundar a análise técnica para entender as causas e reduzir o risco de novas interrupções. Segundo informações internas divulgadas pela imprensa internacional, parte desses incidentes envolve alterações de código realizadas com assistência de ferramentas de IA generativa.

Para quem trabalha com software, o episódio levanta uma discussão importante: até que ponto ferramentas de IA podem acelerar o desenvolvimento sem comprometer a estabilidade de sistemas críticos?

Incidentes recentes levantaram alerta dentro da empresa

Um dos casos mais visíveis aconteceu neste mês, quando o site e o aplicativo de compras da Amazon ficaram fora do ar por quase seis horas. Durante esse período, usuários não conseguiram finalizar compras nem acessar informações básicas, como preços de produtos ou detalhes da conta.

Segundo a empresa, o problema foi causado por uma implantação incorreta de código. A falha gerou um impacto considerável, afetando diferentes áreas da plataforma ao mesmo tempo.

Internamente, executivos classificaram alguns dos incidentes recentes como tendo um “alto raio de impacto”, expressão usada na engenharia de software para indicar que uma falha em um componente acabou se propagando por vários sistemas.

Uso de IA no desenvolvimento entrou no radar

Entre os fatores analisados pela empresa está o uso crescente de ferramentas de IA generativa para auxiliar na escrita e modificação de código.

De acordo com documentos internos, parte dos incidentes envolve mudanças feitas com ajuda dessas ferramentas, em um cenário onde as melhores práticas ainda não estão totalmente consolidadas.

Isso não significa necessariamente que a IA seja a causa direta das falhas. Porém, o uso recente e experimental dessas tecnologias pode introduzir novos tipos de risco operacional, principalmente em ambientes complexos e distribuídos como os da Amazon.

Como resposta imediata, a empresa passou a exigir que alterações de código feitas com assistência de IA recebam aprovação de engenheiros mais experientes antes de serem implementadas.

AWS também teve incidentes ligados a assistentes de código

Os problemas não se limitaram ao ecommerce.

A divisão de computação em nuvem da empresa, a Amazon Web Services (AWS), também registrou incidentes relacionados ao uso de ferramentas de programação com IA.

Em um dos casos, um recurso usado por clientes para estimar custos na plataforma ficou indisponível por cerca de 13 horas. O problema ocorreu após um assistente de programação baseado em IA realizar mudanças que acabaram recriando completamente o ambiente do serviço.

Segundo a empresa, o impacto desse episódio foi limitado e afetou apenas uma funcionalidade específica em determinadas regiões.

Menos engenheiros também entrou na discussão

Outro ponto que apareceu nas conversas internas foi o aumento no número de incidentes classificados como “Sev2”.

Na prática, são problemas que exigem resposta rápida da equipe de engenharia para evitar interrupções maiores no produto.

Alguns engenheiros relataram que esses eventos têm se tornado mais frequentes, especialmente após as rodadas de demissões realizadas pela empresa nos últimos anos.

Somente em janeiro, a Amazon eliminou cerca de 16 mil cargos corporativos.

A empresa, no entanto, nega que a redução de equipe esteja diretamente ligada ao aumento das falhas.

O dilema da IA no desenvolvimento de software

Para desenvolvedores e equipes de engenharia, o caso da Amazon ilustra um desafio que está se tornando comum na indústria.

Ferramentas de IA generativa estão acelerando a escrita de código, revisão e refatoração de sistemas. Ao mesmo tempo, elas introduzem um novo tipo de dependência tecnológica que ainda está sendo compreendido.

Em ambientes de produção com milhões de usuários e infraestrutura altamente distribuída, pequenas mudanças podem gerar efeitos inesperados.

Por isso, cada vez mais empresas estão adotando políticas de governança para o uso dessas ferramentas, incluindo revisão obrigatória de código, auditorias automatizadas e validações adicionais antes do deploy.

No fim das contas, a IA pode até escrever código rapidamente, mas a responsabilidade pela estabilidade do sistema ainda continua sendo humana.

Total
0
Shares
Artigo anterior

Nubank compra a Hyperplane: por que isso importa para dados e Machine Learning no setor financeiro

Próximo artigo

OpenAI compra Promptfoo: por que a segurança de agentes de IA virou prioridade de produto



Artigos relacionados