Andrej Karpathy se junta à Anthropic para liderar avanços em pré-treinamento de LLMs

Andrej Karpathy aceitou um convite da Anthropic para integrar a equipe de pré-treinamento da empresa, onde vai trabalhar em pesquisas que envolvem treinos em larga escala e o uso do Claude para acelerar esses processos; a companhia também contratou o especialista em cibersegurança Chris Rohlf para o frontier red team, reforçando esforços tanto na construção quanto na avaliação de modelos avançados.

Andrej Karpathy, pesquisador de destaque em IA conhecido por passagens na OpenAI e na Tesla, acaba de entrar para a equipe de pré-treinamento da Anthropic.

Ele escreveu: “I’ve joined Anthropic.”

Karpathy começou a trabalhar esta semana na Anthropic, integrando o time de pré-treinamento liderado por Nick Joseph.

O pré-treinamento é a fase que entrega o conhecimento e as capacidades centrais do modelo Claude e é uma das etapas mais caras e intensivas em computação.





Uma porta-voz da Anthropic afirmou que Karpathy vai montar uma equipe com foco em usar o Claude para acelerar pesquisas de pré-treinamento.

Karpathy é um dos poucos pesquisadores capazes de conectar teoria de LLMs com a prática de treinos em grande escala, e a contratação sinaliza que a Anthropic aposta em pesquisa assistida por IA, não só em pura capacidade de computação, para competir com rivais.

Sua trajetória inclui saída da OpenAI em 2017 para liderar projetos de direção autônoma na Tesla, retorno posterior à OpenAI por um ano e, em 2024, a criação da startup Eureka Labs voltada ao uso de assistentes de IA na educação.

Não está claro se ele continuará tocando a Eureka Labs depois dessa mudança.

Karpathy também ministra o curso online “Neural Networks: Zero to Hero” e mantém um canal no YouTube com aulas sobre redes neurais e modelos de linguagem.

Ele afirmou: “I remain deeply passionate about education and plan to resume my work on it in time.”

Além disso, a Anthropic contratou Chris Rohlf para seu frontier red team, a equipe responsável por submeter os modelos a testes rigorosos contra ameaças graves.

Rohlf tem mais de 20 anos de experiência em cibersegurança, passou pelo time conhecido como “The Paranoids” do Yahoo e trabalhou por seis anos no Meta.

Ele também atuou como fellow no Center for Security and Emerging Technology da Georgetown, onde trabalhou no projeto CyberAI.

Rohlf disse: “We have a real opportunity in front of us to dramatically improve cyber security with AI.”

Artigo anterior

Gemini 3.5 Flash: Google aposta em agentes autônomos em vez de chatbots

Próximo artigo

Como o padrão sidecar em Rust corrige a maior fraqueza da IA em Python



Artigos relacionados