GPT-5.4 Pro salta para 150 de QI no teste MESNA Noruega enquanto a OpenAI quebra o seu próprio recorde

Faça CryptoSlate ser preferido em

O mais recente modelo GPT-5.4 Pro da OpenAI já alcançou uma pontuação de QI superior a 99,96% de todos os seres humanos, dando aos mercados um sinal fresco de que os ganhos de capacidade em IA estão a começar a ultrapassar o ruído habitual do ciclo de produto.

A GPT-5.4 Pro da OpenAI atinge 150 em testes públicos de QI à medida que os mercados entram em mais uma semana com foco macro

O ranking público do TrackingAI coloca agora a OpenAI GPT-5.4 Pro numa pontuação de QI de 150, um salto acentuado face ao valor 136 que a o3 da OpenAI apresentou no teste da Mensa Norway no ano passado.

A subida chega num momento em que a atenção do mercado se estreitou em torno do Irão, energia, fragilidade laboral e do próximo indicador de inflação. Isso coloca uma questão diferente para a semana à frente: com que rapidez a inteligência das máquinas está a acumular, e quando é que essa aceleração começará a sobrepor-se ao posicionamento económico?

Porque é que isto importa: Uma passagem de 136 para 150 num benchmark amplamente compreendido comprime uma mudança complexa de capacidade num sinal simples. Para as empresas, esse sinal alimenta diretamente decisões sobre automatização, orçamentos de software e planeamento de headcount. Para os mercados, acrescenta mais uma variável ao lado das taxas, da inflação e das expectativas de crescimento.

A OpenAI apresentou o GPT-5.4 como o seu modelo de fronteira mais capaz e eficiente para trabalho profissional, com codificação, utilização de ferramentas e utilização de computador mais fortes, e uma janela de contexto de até 1 milhão de tokens. No mesmo anúncio, a OpenAI disse que o GPT-5.4 atingiu um novo estado da arte no GDPval e excedeu o desempenho humano no OSWorld-Verified.

Estes benchmarks são separados de um teste público de QI, mas a direção do percurso está alinhada. A capacidade está a subir em sistemas de medição diferentes, e esse aumento está a ficar suficientemente rápido para influenciar orçamentos, planos de contratação, design de fluxos de trabalho e gastos com software.

Uma pontuação de 150 num benchmark público estilo QI comprime uma mudança de capacidade mais ampla num único sinal portátil. O número é fácil de compreender mesmo antes de a metodologia ser debatida.

O resultado anterior da o3 na Mensa estabeleceu o benchmark e os seus limites. A janela de contexto de um milhão de tokens da GPT-4.1 mostrou como a OpenAI estava a alargar a utilidade do modelo em código e tarefas documentais com horizontes longos, enquanto a nossa análise do crescente ciclo de capital da OpenAI ligou o progresso do modelo à expansão do hardware, a ciclos de financiamento e à procura de infraestruturas.

No conjunto, esses desenvolvimentos colocam a pontuação mais recente de QI dentro de um contexto comercial e económico mais vasto. Uma subida de 136 para 150 num benchmark público é impressionante por si só. Uma subida de 136 para 150 enquanto a OpenAI aprofunda a utilização de ferramentas, a utilização de computador, a produtividade empresarial e infraestruturas intensivas em capital tem implicações mais amplas.

Os benchmarks públicos de QI são limitados, mas a curva de capacidade continua a subir

Os testes estilo QI público continuam a ser instrumentos imperfeitos para medir modelos de fronteira. O TrackingAI executa um benchmark público ao estilo da Mensa e também mantém um teste privado offline mais exigente.

Os testes estilo QI comprimem uma fatia estreita do desempenho cognitivo num único número, obscurecendo a variação entre tipos de raciocínio, gestão de contexto, criatividade e resolução de problemas no mundo real.

Tanto para a IA como para os humanos, as pontuações são sensíveis ao desenho do teste, à exposição ao treino e à familiaridade com padrões, o que faz com que sejam um substituto ruidoso para a capacidade geral.

Um QI de 150 situa-se no extremo superior da distribuição, muitas vezes associado a indivíduos como Albert Einstein ou Richard Feynman. Em termos práticos, implica abstração muito rápida, forte reconhecimento de padrões e capacidade de navegar problemas complexos em múltiplos passos com orientação limitada.

A plataforma reporta pontuações como médias móveis de conclusões recentes, e a metodologia levanta questões familiares sobre estrutura de prompts, reprodutibilidade, contaminação do conjunto de treino e familiaridade com o formato. Essas preocupações já eram visíveis quando a o3 chegou a 136, e continuam ativas agora que a GPT-5.4 Pro se posiciona em 150.

Leitura recomendada

As pontuações da o3 da OpenAI em Mensa Norway, superando 98% da população humana

O modelo o3 da OpenAI atinge QI ao nível da Mensa em testes independentes.

17 de abril de 2025 · Liam ‘Akiba’ Wright

Mesmo com esses limites, o padrão mais amplo tornou-se mais difícil de ignorar. Um único resultado isolado num benchmark pode ser explicado como uma idiossincrasia. Um conjunto de ganhos em testes públicos estilo QI, testes de programação, utilização de navegador, navegação de desktop e desempenho em trabalho de conhecimento carrega mais peso analítico.

O mais recente ranking do TrackingAI coloca a GPT-5.4 Pro no topo do seu quadro público de QI, à frente de todos os modelos Cluade, Gemini, Qwen e Grok, oferecendo um benchmark público externo e legível que se mapeia rapidamente para o debate mais amplo sobre capacidade.

Poucas pessoas precisam de uma compreensão detalhada sobre o desenho dos benchmarks para perceber que 150 está numa faixa rara e que os investidores não precisam de aceitar todas as premissas por trás de um teste estilo QI para reconhecer que uma subida desta dimensão sugere aceleração em vez de deriva.

Gráfico intitulado “Resultados de Testes de QI de IA” mostrando as pontuações médias de QI da Mensa Norway para grandes modelos de IA numa curva em sino, com as variantes GPT-5.4 da OpenAI traçadas perto da extremidade superior da faixa.

Os compradores empresariais também não precisam de acreditar que QI equivale a inteligência geral para ver que sistemas com melhor reconhecimento de padrões, melhor utilização de ferramentas e melhor gestão de tarefas com horizontes longos estão a avançar para um território economicamente útil, indo muito além da resolução de puzzles.

Isto aponta para sistemas que conseguem pesquisar, planear, verificar, navegar e produzir trabalho real em contextos alargados. Nesse cenário, a pontuação de QI funciona menos como um número de novidade e mais como um sinal da densidade do raciocínio de fronteira.

Existe também valor competitivo no próprio ranking. Uma posição de liderança num benchmark público reforça o posicionamento da OpenAI na corrida pela liderança visível em capacidade, especialmente num momento em que a diferenciação dos modelos está a tornar-se mais difícil de discernir apenas pelas notas de arquitetura.

A liderança em benchmarks comprime a complexidade numa hierarquia simples. Oferece aos programadores um sinal, aos compradores empresariais um fio narrativo e aos investidores outro substituto para onde a fronteira de capacidade se encontra atualmente.

Briefing Diário CryptoSlate

Sinais diários, zero ruído.

Principais manchetes que mexem no mercado e contexto entregues todas as manhãs numa leitura concisa.

5 minutos de digestão 100k+ leitores

Endereço de email

Obter o briefing

Grátis. Sem spam. Cancele a qualquer momento.

Oops, parece que houve um problema. Tente novamente, por favor.

Está subscrito. Bem-vindo a bordo.

A subida do benchmark da OpenAI está a começar a coincidir com a semana económica que vem

A semana que vem continua a depender de fatores macro. O calendário do Bureau of Labor Statistics deixa claramente delineadas as próximas divulgações importantes: as minutas do FOMC da reunião de 17 a 18 de março, devidas a 8 de abril; o Índice de Preços no Consumidor de março, devidos a 10 de abril; e o Índice de Preços no Produtor de março, devidos a 14 de abril.

Esse calendário mantém as taxas, a inflação e a ansiedade com o crescimento em primeiro plano, mas por baixo dessa superfície, está a tomar forma uma segunda via económica, e a OpenAI está perto do seu centro.

O crescimento de capacidade em IA de fronteira cruza cada vez mais a alocação de capital. Um modelo que sobe mais em testes públicos de raciocínio e, ao mesmo tempo, melhora em programação, pesquisa e utilização de computador altera a forma como as empresas pensam sobre a reformulação de fluxos de trabalho. Altera o que os compradores de software esperam de copilots e agentes. Altera a rapidez com que as empresas passam da experimentação para a implementação.

Jack Dorsey publicou recentemente que a Block está a passar “de hierarquia para inteligência”, usando IA para assumir o trabalho de coordenação anteriormente tratado por camadas de gestão à medida que a empresa se reorganiza em torno de colaboradores individuais, indivíduos diretamente responsáveis e player-coaches

O crescimento de capacidade também altera quais tarefas podem ser retiradas das estruturas de custo do trabalho e atribuídas ao software. Esses efeitos passam primeiro por canais mais estreitos, incluindo fluxos de trabalho de documentos, fluxos de trabalho de folhas de cálculo, apoio ao cliente, tarefas de pesquisa, automação de navegação, operações internas, geração de código e ciclos de verificação.

A orientação comercial da OpenAI reforça essa interpretação. Nos materiais do lançamento do GPT-5.4, a empresa descreveu desempenho mais forte no trabalho profissional, melhor pesquisa com ferramentas, utilização nativa de computador e ganhos em trabalho de conhecimento avaliado por benchmark em ocupações que se mapeiam diretamente para a economia dos EUA.

Isso coloca o crescimento da capacidade de IA dentro de uma questão de mercado familiar, em que o fluxo de gastos segue para onde estes sistemas continuarem a melhorar a este ritmo.

A resposta vai além da receita de subscrição do modelo, passando pela procura de cloud, chips, centros de dados, networking, energia, licenças de software e pressupostos de produtividade do trabalho. O crescente ciclo de capital da OpenAI já reflete parte dessa estrutura, e o ganho do benchmark acrescenta um sinal público mais simples por cima.

É essa sobreposição que dá ao resultado mais recente relevância mais ampla durante uma semana com peso macro. Os mercados já conhecem a configuração do CPI. Os mercados já sabem que os preços do petróleo podem alimentar expectativas de inflação. Os mercados já sabem que as minutas da Fed serão analisadas quanto ao tom de política.

Mas o crescimento da inteligência em si começa a comportar-se como uma variável macro? Ganhos de capacidade mais rápidos podem alterar os planos de gastos das empresas, intensificar a pressão competitiva em funções do trabalho de escritório, apoiar maiores investimentos em infraestruturas e reforçar o argumento para despesas de capital ligadas à IA mesmo num ambiente de crescimento nominal mais lento.

Quando o TrackingAI mostra a GPT-5.4 Pro a 150, o número encaixa num mercado que já vê a OpenAI como mais do que um laboratório. É uma empresa de plataforma, uma empresa de implementação, um cliente de infraestruturas e um gerador de sinais para setores adjacentes.

O próximo teste está em dois lugares ao mesmo tempo. Um é metodológico; os benchmarks públicos estilo QI continuarão a atrair escrutínio, e devem. O outro é económico; os mercados decidirão, passo a passo, se saltos de capacidade deste tamanho merecem ser precificados ao lado de dados do trabalho, expectativas de taxas e tendências de gastos com capital.

A mais recente subida de benchmark da OpenAI aproxima essa decisão. A pontuação é compacta, legível e fácil de circular. A sua relevância mais profunda vem do mesmo lugar do impulso mais amplo do produto por parte da empresa; a fronteira continua a subir, e a pegada económica dessa subida está a tornar-se mais difícil de manter numa categoria separada.

Mencionado neste artigo

OpenAI Anthropic Google X Sam Altman

Publicado em

Destaque EUA Tecnologia Cultura IA Comunidade

Contexto

Cobertura relacionada

Troque categorias para aprofundar ou obter um contexto mais amplo.

Notícias locais EUA      Categoria principal de IA      Notícias de comunicados Press Releases Newswire  

Análise

Empregos nos EUA esmagam previsões, mas uma fraqueza laboral escondida pode manter o Bitcoin sob pressão

Uma forte impressão de emprego com manchete fez com que os cortes de taxas fossem empurrados para mais longe, mas sinais laborais mais fracos deixam o Bitcoin exposto ao próximo teste de dados.

4 horas atrás

Aos poucos, os “compradores permanentes” do Bitcoin começam a vender à medida que aumentam as pressões da dívida e do dinheiro

À medida que os detentores de tesouraria vendem para cobrir necessidades de dívida e liquidez, uma das narrativas institucionais mais fortes do Bitcoin começa a fissurar.

1 dia atrás

Derivados de Bitcoin acendem aviso quando o mercado de $46B recua da recuperação do cessar-fogo no Irão

Análise · 1 dia atrás

Os EUA libertam biliões para bancos enquanto admitem em silêncio que a falha central do SVB nunca desapareceu

Banca · 1 dia atrás

A história do refúgio seguro do Bitcoin rompe-se com o choque da guerra a reviver um risco de $10.000 se o petróleo atingir $150 por barril

Análise · 2 dias atrás

A CFTC processa 3 estados numa tentativa de redefinir os mercados de previsão cripto como produtos federais

Regulação · 2 dias atrás

Tecnologia

A Ripple impulsiona uma blockchain mais privada para bancos e adiciona verificações de código de IA à medida que crescem os receios de que possa deixar o preço do XRP para trás

A Ripple pretende revolucionar a blockchain institucional com recursos aprimorados de privacidade e segurança com IA na XRPL.

6 dias atrás

Análise

Os vencedores cripto da IA não são moedas de IA, à medida que os agentes começam a gastar autonomamente

O crescimento de agentes de IA cria uma pergunta simples, com grandes implicações para a cripto: como é que o software paga?

1 semana atrás

O reset da IA já está em curso com despedimentos a acelerar e um grupo a ser atingido com mais força

IA · 3 semanas atrás

A cripto pode proteger-nos contra a crescente teia de agentes económicos de IA?

IA · 4 semanas atrás

A IA está a contratar mais programadores seniores enquanto apaga silenciosamente os empregos que os criam

IA · 4 semanas atrás

Um dos maiores mineradores de Bitcoin dos EUA tem em vista a venda de todo o seu lote de 53.000 BTC

Mineração · 1 mês atrás

ADI Chain anuncia ADI Predictstreet como parceiro de mercado de previsões para a FIFA World Cup 2026

Apoiado pela ADI Chain, o ADI Predictstreet vai estrear no maior palco do futebol como parceiro oficial do mercado de previsões da FIFA World Cup 2026.

2 dias atrás

A bolsa BTCC nomeada Parceira Regional Oficial da Seleção Nacional da Argentina

A BTCC fez parceria com a Associação de Futebol da Argentina através da Copa do Mundo FIFA 2026, ligando a presença de longa data da bolsa no setor cripto com uma das seleções nacionais mais condecoradas do futebol.

3 dias atrás

Encrypt vai chegar à Solana para impulsionar mercados de capitais encriptados

PR · 5 dias atrás

Ika vai chegar à Solana para impulsionar mercados de capitais sem bridging

PR · 5 dias atrás

O lançamento do mainnet TxFlow L1 marca uma nova fase para finanças on-chain multiaplicação

PR · 5 dias atrás

A BYDFi marca 6º aniversário com celebração de um mês, construída para a fiabilidade

PR · 5 dias atrás

Aviso legal

As opiniões dos nossos autores são exclusivamente as deles e não refletem a opinião da CryptoSlate. Nenhuma das informações que lê na CryptoSlate deve ser tomada como aconselhamento de investimento, nem a CryptoSlate endossa qualquer projeto que possa ser mencionado ou ligado neste artigo. A compra e a negociação de criptomoedas devem ser consideradas uma atividade de alto risco. Por favor, faça a sua própria diligência antes de tomar qualquer ação relacionada com o conteúdo deste artigo. Por fim, a CryptoSlate não assume qualquer responsabilidade caso perca dinheiro a negociar criptomoedas. Para mais informações, veja os avisos legais da nossa empresa.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar