A Anthropic Identifica Três Mudanças na Camada de Produto Por Trás da Queda de Qualidade do Claude Code, e Não um Problema de Modelo

Mensagem do Gate News, 23 de abril — A equipe de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code relatada pelos usuários no último mês se deveu a três mudanças independentes na camada de produto, e não a problemas de API ou do modelo subjacente. Os três problemas foram corrigidos em 7 de abril, 10 de abril e 20 de abril, respectivamente, com a versão final agora em v2.1.116.

A primeira mudança ocorreu em 4 de março, quando a equipe reduziu o nível de esforço de raciocínio padrão do Claude Code de “high” para “medium” para tratar picos ocasionais de latência extrema no Opus 4.6 sob alta intensidade de raciocínio. Após queixas generalizadas dos usuários sobre desempenho reduzido, a equipe reverteu a mudança em 7 de abril. O padrão atual agora é “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido em 26 de março. O sistema foi projetado para limpar registros antigos de raciocínio após a inatividade da conversa exceder uma hora, para reduzir custos de recuperação de sessão. Porém, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente, em vez de uma única vez, fazendo com que o modelo perdesse progressivamente o contexto de raciocínio anterior. Isso se manifestou como aumento da falta de memória, operações repetidas e invocações anormais de ferramentas. O bug também resultou em falhas de cache em toda solicitação, acelerando o consumo do limite de cota do usuário. Dois experimentos internos não relacionados mascararam as condições de reprodução, estendendo o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipe revisou o código problemático usando o Opus 4.7 e descobriu que o Opus 4.7 conseguia identificar o bug enquanto o Opus 4.6 não.

A terceira mudança foi lançada em 16 de abril junto com o Opus 4.7. A equipe adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento a interação com outros prompts degradou a qualidade de codificação. Avaliações estendidas revelaram uma queda de desempenho de 3% tanto no Opus 4.6 quanto no 4.7, levando a um rollback em 20 de abril.

Essas três mudanças afetaram grupos de usuários diferentes em momentos diferentes, e seu efeito combinado gerou uma queda de qualidade ampla e inconsistente, complicando o diagnóstico. A Anthropic afirmou que agora será necessário que mais funcionários internos usem a mesma versão pública de build que os usuários, executem conjuntos completos de avaliação do modelo para cada modificação no prompt do sistema e implementem períodos de rollout em etapas. Como compensação, a Anthropic redefiniu as cotas de uso de todos os usuários assinantes.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

As previsões financeiras da Intel superam as expectativas; a demanda por IA impulsiona a retomada das CPUs; após Chen Liwu assumir, a INTC já subiu 3 vezes

A receita do primeiro trimestre da Intel foi de US$ 13,6 bilhões, com EPS 0,29; a projeção para o segundo trimestre, no valor médio de US$ 14,3 bilhões, superou em muito as expectativas, com margem bruta de 41%. A demanda por data centers de IA impulsionou a virada da CPU, com os servidores Xeon entre os mais favorecidos. Chen Liwu lidera a transformação; o negócio IFS no primeiro trimestre somou US$ 5,4 bilhões, com crescimento de 16%, enquanto clientes externos como a Tesla acompanham de perto o uso de tecnologia da Intel na Terafab. Após o fechamento do pregão, as ações subiram cerca de 20%, atingindo uma máxima histórica; desde o ano passado, já acumularam alta de quase 3 vezes.

ChainNewsAbmedia8m atrás

Cognition AI Obtém Rodada de Financiamento com Avaliação de $25B em Negociações Iniciais

Mensagem do Gate News, 24 de abril — A Cognition AI, uma startup de codificação com IA, está em negociações iniciais para uma nova rodada de investimentos que, segundo fontes familiarizadas com o assunto, poderia mais do que dobrar sua avaliação para $25 bilhões. A empresa pretende levantar centenas de milhões de dólares ou mais conforme

GateNews1h atrás

A NEC Corporation se tornará o primeiro parceiro global da Anthropic no Japão

A NEC anuncia se tornar o primeiro parceiro global da Anthropic no Japão, e ambas as partes desenvolverão soluções de IA seguras e altamente especializadas em conhecimento do setor para indústrias altamente regulamentadas, como finanças, manufatura e governos locais, além de integrar a série Claude ao NEC BluStellar, com foco em transformação de gerenciamento orientada por dados e experiência do cliente. Ao mesmo tempo, introduzem o Claude Cowork e a integração com SOC para aprimorar a proteção de segurança cibernética. Para validar a eficácia, a NEC inicia o Zero Client Program para testar internamente, de forma abrangente, agentes de IA, e planeja promover a implantação do Claude globalmente, estabelecendo o maior CoE (Centro de Excelência) em engenharia nativa de IA do Japão.

ChainNewsAbmedia3h atrás

Brecha de Segurança da Vercel se Expande para Centenas de Usuários; Desenvolvedores de IA em Maior Risco

Mensagem do Gate News, 23 de abril — A Vercel revelou em 19 de abril que seu incidente de segurança, inicialmente descrito como afetando um "subconjunto limitado de clientes", se expandiu para uma comunidade de desenvolvedores muito mais ampla, especialmente aqueles que estão construindo fluxos de trabalho de agentes de IA. O ataque pode afetar centenas de usuários

GateNews5h atrás

OpenAI lança GPT-5.5: contexto de 12M, índice AA em primeiro lugar, Terminal-Bench 82,7% reescreve o benchmark de agentes

A OpenAI anunciou o GPT-5.5, com foco em trabalho orientado por agentes e processamento de conhecimento empresarial, e também lançou em sincronia no ChatGPT e no Codex. Os principais pontos incluem uma janela de contexto de 1200 milhões de tokens, AA Intelligence Index 60, superando o Claude Opus em 4,7 e o Gemini 3,1 Pro; os preços são de 5 dólares por 1 milhão de tokens de entrada e 30 dólares por 1 milhão de tokens de saída, com redução de tokens de saída de aproximadamente 40%, e custo real aumentando aproximadamente 20%.

ChainNewsAbmedia5h atrás

Cluster Protocol Levanta $5M para acelerar o CodeXero, IDE de IA nativo do navegador para EVM

Mensagem do Gate News, 23 de abril — A Cluster Protocol, uma empresa de infraestrutura de Web3 e deeptech de IA, anunciou que levantou $5 milhões em uma nova rodada de financiamento liderada pela DAO5, com participação da Paper Ventures, JPEG Trading e Mapleblock Capital, elevando o financiamento total para US$ 7,75 milhões. O capital wi

GateNews6h atrás
Comentário
0/400
Sem comentários