O antigo diretor-geral de IA da Tesla e membro fundador da OpenAI, Andrej Karpathy, publicou um longo texto no X no dia 9 de abril, afirmando que a perceção do público sobre as capacidades da IA está a dividir-se gravemente. Segundo ele, as pessoas que usam o ChatGPT na versão gratuita e os técnicos que usam diariamente ferramentas de agentes de ponta como Codex e Claude Code estão, na prática, a discutir “produtos completamente diferentes”, mas ambos os lados acreditam que estão a ver a totalidade do que é a IA.

Dois mundos, duas perceções de IA

Karpathy divide os utilizadores atuais de IA em dois grupos.

O primeiro grupo experimentou a versão gratuita do ChatGPT em algum momento do ano passado e formou com isso a sua perceção global da IA. O que veem são vários erros do modelo — alucinações, resultados de pesquisa absurdos e até falhas em problemas simples, como “devo conduzir ou ir a pé para lavar o carro” no modo de voz. Karpathy reconhece que estes problemas de facto existem, mas sublinha que a versão gratuita e modelos desatualizados não conseguem representar com fidelidade as capacidades reais dos modelos de agentes de ponta até 2026.

O segundo grupo cumpre simultaneamente duas condições: usa, com pagamento, os mais recentes modelos de agentes de ponta (como OpenAI Codex ou Claude Code) e recorre a eles de forma profissional em áreas técnicas como desenvolvimento de software, matemática e investigação. Karpathy chama a este grupo um estado de “psicose de IA” altamente intenso, porque os progressos recentes destes modelos nas áreas técnicas “só podem ser descritos como surpreendentes” — é possível ver, literalmente, como resolvem em uma hora problemas de arquitetura de programação que antes exigiam dias ou até semanas.

Porque o progresso se concentra nas áreas técnicas

Karpathy explica porque é que a melhoria nas capacidades de IA é especialmente marcante em áreas técnicas como desenvolvimento de programação, mas menos evidente em usos gerais como pesquisa, escrita e recomendações.

Existem duas razões: primeiro, as áreas técnicas fornecem funções de recompensa verificáveis (por exemplo, se os testes unitários passam), o que permite que o treino por aprendizagem por reforço funcione de forma eficaz; em contrapartida, é difícil determinar de forma clara a qualidade de um texto. Segundo, as áreas técnicas têm mais valor comercial em cenários B2B, por isso as empresas de IA investem a maior parte dos recursos das suas equipas nessas direções.

Estes dois grupos não se conseguem entender

Karpathy conclui que estes dois grupos estão a “falar entre si”. O modo de voz da versão gratuita da OpenAI falha em problemas do dia a dia, enquanto o Codex da versão paga mais avançada da OpenAI consegue, em uma hora, reestruturar toda a base de código ou detetar vulnerabilidades do sistema — e ambas as coisas são verdade ao mesmo tempo.

Nas suas respostas subsequentes, ele acrescentou que alguém lhe apresentou uma perspetiva: o incidente do OpenClaw atraiu tanta atenção social precisamente porque fez com que muitos não especialistas em tecnologia tivessem contacto pela primeira vez com os modelos de agentes mais recentes, e essas pessoas até então só sabiam que IA era sinónimo de ChatGPT na versão web.

Este artigo de Karpathy: a perceção das capacidades de IA apresenta uma rutura grave, a versão gratuita e os agentes de ponta são “produtos completamente diferentes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Luffa faz parceria com plataforma de activos digitais para integrar trading cripto com IA

Parcerias e ecossistema Agente de IA Ferramentas e aplicações de IA

Luffa, um ecossistema social Web3, fez parceria com uma plataforma de negociação de activos digitais para integrar funcionalidades de trading orientadas por IA, melhorando a comunicação segura e o trading numa interface unificada, mantendo a descentralização e a mitigação de riscos.

GateNews1h atrás

O agente de vending com IA “Valerie” opera uma máquina de vending em São Francisco com a OpenClaw

Agente de IA Notícias da indústria de IA

O agente de IA "Valerie" já gere agora uma máquina de venda automática em São Francisco na OpenClaw, testando até que ponto as pessoas confiam no código com preços, marketing e dinheiro em numerário do mundo real. Resumo O agente de IA "Valerie" gere uma máquina de venda automática física em São Francisco utilizando a framework OpenClaw, definindo preços, dando nomes

Cryptonews16h atrás

A Mastercard possibilita pagamentos por agentes de IA através de uma parceria com a Lobstercash e a Crossmint

Agente de IA

A Mastercard uniu-se à Lobstercash e à Crossmint para facilitar pagamentos por agentes de IA através de cartões de crédito e de débito existentes, integrando-se nos sistemas financeiros atuais sem necessidade de novas carteiras. Esta parceria permite que a IA automatize transacções, melhorando a eficiência e a segurança.

GateNews21h atrás

Equipa chinesa EvoMap enfurece com a polémica de plágio da Hermes Agent que explodiu em popularidade: existe uma elevada semelhança no sistema de autoevolução

Agente de IA Notícias da indústria de IA

A equipa chinesa EvoMap acusa o agente Hermes da Nous Research de ter copiado a sua arquitetura Evolver/GEP, afirmando que ambos apresentam uma elevada semelhança em vários módulos-chave. A EvoMap refere que o design do Hermes não cita nem dá crédito ao seu conteúdo publicado anteriormente; a polémica suscitou grande atenção por parte da comunidade, com alguns utilizadores chineses a apoiar a EvoMap e a criticar a conduta de plágio do Hermes. Embora a equipa da Nous Research ainda não tenha refutado as acusações ponto por ponto, o caso espalhou-se rapidamente no panorama da opinião pública sobre IA.

ChainNewsAbmedia21h atrás

A OpenAI Actualiza o Codex para um Agente de IA que Controla o Ambiente de Trabalho, Automatizando os Fluxos de Trabalho de Desenvolvimento

Agente de IA Notícias da indústria de IA

O Codex melhorado da OpenAI evolui de um assistente de programação para um agente autónomo para ambientes de ambiente de trabalho, capaz de gerir aplicações, automatizar fluxos de trabalho e integrar-se com mais de 100 aplicações. Esta mudança melhora a continuidade das tarefas e a automatização dos fluxos de trabalho, reflectindo um cenário competitivo nas ferramentas de programação por IA.

GateNews22h atrás

A Agile Soda Lança a Plataforma Agentic OCR com 98% de Precisão na Classificação de Documentos

Agente de IA Ferramentas e aplicações de IA

A Agile Soda lançou o Agentic OCR, uma plataforma de automação de documentos orientada por IA que elimina a necessidade de pré-treino e permite uma implementação imediata. Oferece elevada precisão na classificação e na extração, melhorando continuamente com base nas correções dos utilizadores, com planos para futuras melhorias.

GateNews04-17 05:21

Comentar

0/400

Nenhum comentário