A Anthropic anunciou a 9 de abril a introdução formal da “Estratégia de Advisor” na plataforma Claude. Os programadores já podem, através da Messages API, fazer com que a Opus assuma o papel de consultora, em conjunto com Sonnet ou Haiku como executores, alcançando numa única chamada de API um desempenho intelectual próximo do da Opus, ao mesmo tempo que reduzem significativamente os custos. Esta funcionalidade está atualmente disponível numa versão de testes pública.

Mecanismo de funcionamento: o executor, quando se depara com um problema difícil, consulta automaticamente a Opus

O conceito central da Estratégia de Advisor é separar a inferência da execução. Depois de os programadores adicionarem a ferramenta advisor nas chamadas da Messages API, quando os agentes Sonnet ou Haiku, durante a execução de uma tarefa, se depararem com decisões difíceis, consultam automaticamente a Opus. Obtêm recomendações de planeamento e continuam a execução. Todo o processo é concluído dentro de uma única chamada de API, sem necessidade de o programador orquestrar adicionalmente.

Esta arquitetura é semelhante à divisão de trabalho entre consultores seniores e executores numa equipa — a Opus fica responsável pelas decisões estratégicas de alto nível, enquanto a Sonnet ou a Haiku ficam responsáveis pela operação prática; ambos colaboram no mesmo fluxo de trabalho.

Teste em situação real: melhor desempenho e custos mais baixos

De acordo com os dados de avaliação publicados pela Anthropic, no benchmark SWE-bench Multilingual, o desempenho da Sonnet com advisor da Opus foi superior em 2,7 pontos percentuais ao da utilização isolada de Sonnet. Além disso, o custo por tarefa diminuiu 11,9%.

A redução de custos deve-se ao facto de a maioria das tarefas continuar a ser tratada pela Sonnet ou pela Haiku, que são mais baratas. A Opus é chamada apenas nos pontos de decisão críticos, evitando os custos elevados de a utilizar ao longo de todo o processo.

Significado para os programadores

A Estratégia de Advisor oferece aos programadores que constroem AI agents uma nova opção de compromisso entre custo e desempenho. No passado, os programadores tinham de escolher entre “usar Opus durante todo o processo, mas com custos altos” ou “usar Sonnet durante todo o processo, mas pode falhar ao lidar com problemas complexos”. Agora é possível obter as vantagens de ambos com uma arquitetura híbrida.

A comunidade reagiu entusiasticamente: alguns programadores compararam-na à “linha de vida” de “ligar para pedir ajuda” do programa “Milionário” — os executores trabalham normalmente de forma independente e só quando surge um problema realmente difícil é que pedem ajuda aos especialistas.

Este artigo “A Anthropic lança a Estratégia de Advisor: Opus como consultora, com Sonnet para executar; melhoria de desempenho e redução de custos em 12%” foi publicado pela primeira vez em ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

A NEA explora a utilização de inteligência artificial na regulamentação nuclear

Notícias da indústria de IA

O Grupo de Trabalho da NEA sobre Novas Tecnologias reuniu-se para um workshop nos dias 25--26 de março, centrado em como a inteligência artificial pode ser aplicada à supervisão regulamentar e às operações internas no âmbito das autoridades nucleares. Resumo O workshop da NEA explorou aplicações reais de IA na regulamentação nuclear, com

Cryptonews26m atrás

A China vai testar 300+ robôs humanoides na meia-maratona de Pequim a 19 de abril

Notícias da indústria de IA

A segunda meia-maratona de robôs de Pequim conta com mais de 300 robôs humanoides de 70 equipas, competindo num percurso de 21 km. São destacados avanços no movimento autónomo, com 40% a operarem sem controlo. A China domina o mercado de robôs humanoides, apesar dos desafios de produção.

GateNews3h atrás

EUA procuram aumentar as importações de urânio da Namíbia para alimentar centrais nucleares orientadas por IA

Produtos de base Notícias da indústria de IA

Os EUA estão a considerar aumentar as importações de urânio da Namíbia para apoiar a energia nuclear para centros de dados de IA, enquanto a China domina o sector do urânio da Namíbia. O aumento dos preços do urânio está a reavivar o interesse pela mineração, apesar dos desafios no abastecimento de água na região árida.

GateNews3h atrás

Executivos da OpenAI Bill Peebles e Kevin Weil Saem numa Reestruturação de Liderança

Notícias da indústria de IA

Os executivos da OpenAI Bill Peebles e Kevin Weil anunciaram a sua saída, parte de uma série de mudanças de liderança à medida que a empresa descentraliza as suas operações. As suas partidas seguem-se a várias outras saídas de alto perfil e a uma mudança na estrutura da empresa.

GateNews4h atrás

A Zoom faz parceria com a World para adicionar deteção de deepfakes com reconhecimento facial

Notícias da indústria de IA

A Zoom fez parceria com o World, de Sam Altman, para lançar uma funcionalidade que deteta participantes reais em vez de deepfakes de IA durante chamadas de vídeo. O objetivo é combater a fraude por deepfakes em crescimento, com opções de verificação para anfitriões e participantes.

GateNews4h atrás

Relatórios de Bugs Gerados por IA Sobrecarregam a Equipa de Manutenção do cURL

Notícias da indústria de IA

Os relatórios de bugs gerados por IA estão a sobrecarregar o projecto cURL, com um aumento significativo nas submissões a causar tensão nos recursos. Os responsáveis estão a responder limitando o acesso a modelos de IA e a pausar os programas de recompensas por vulnerabilidades para gerir a vaga de entradas.

GateNews5h atrás

Comentar

0/400

Nenhum comentário