Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (pretraining mais pós-treinamento), enquanto o Google, supostamente, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como um motivo central pelo qual as empresas chinesas têm dificuldades para alcançar o ritmo no desenvolvimento de IA.
Zhang descreveu uma “cultura de benchmarking” dentro da Seed, em que os líderes de equipe são avaliados com base nas pontuações de benchmarks que eles supervisionam, e todos os membros se concentram em aumentar os números. No entanto, ele observou que isso não se traduz em uma melhor experiência do usuário na prática. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA no papel, eles ficam aquém no uso real. O objetivo da Seed é alcançar desempenho de primeira linha global, mas Zhang declarou que não acredita que a equipe tenha atingido isso, nem que tenha alcançado a meta de liderança doméstica.
No fim de 2024, a Seed se via em igualdade com o GPT-4o, mas após o lançamento do DeepSeek, a equipe reconheceu que a lacuna permanecia. Quando Zhang entrou, todo o grupo estava mudando urgentemente para aprendizado por reforço para lidar com a deficiência.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
聯發科 conquista grande pedido da Google do 8º TPU! ASIC acelera e impulsiona ações de três grupos relacionados
A MediaTek já entrou na cadeia de fornecimento de chips de treinamento do 8º geração de TPU do Google, responsável pelo design do I/O Die, e adotou a tecnologia de processo N3P da TSMC e o empacotamento CoWoS-S, mostrando que ela atingiu um nível de design de AI ASIC de ponta. Espera-se que, neste ano, a receita do segmento ASIC ultrapasse 1 bilhão de dólares, e que o volume de envio de TPU chegue a ter potencial de chegar a dezenas de milhões de unidades até 2027; a cadeia de fornecimento de Taiwan, como King Yuan Electronics, Jing Ce e Hon Hai, também será beneficiada, e o mercado está gradualmente se voltando para o futuro de divisão de trabalho, colaboração e integrações de chiplets e heterogêneas.
ChainNewsAbmedia8m atrás
A RE:AI da Singtel faz parceria com a Mistral AI para desenvolver infraestrutura de IA em Singapura
Mensagem do Gate News, 27 de abril — O Singtel Group anunciou que a RE:AI, sua unidade de infraestrutura digital com sede em Singapura, firmou parceria com a Mistral AI para apoiar capacidades de IA para indústrias em Singapura.
A parceria terá como foco o desenvolvimento conjunto de infraestrutura e soluções de IA para os setores de serviços financeiros
GateNews34m atrás
He Yi's YZi Labs Invests in Chinese AI Large Language Model Company
Gate News message, April 27 — He Yi, alongside Changpeng Zhao's family office YZi Labs, has invested in a Chinese artificial intelligence large language model company, she disclosed during a private KOL gathering at the Hong Kong Web3 Carnival. The specific name of the invested company was not discl
GateNews38m atrás
OpenAI faz parceria com a MediaTek e a Qualcomm para desenvolver processador de smartphone de IA; Foxconn Connector deve iniciar a produção em 2028
Mensagem do Gate News, 27 de abril — A OpenAI está colaborando com a MediaTek e a Qualcomm para desenvolver processadores de smartphones, segundo análise da cadeia de suprimentos do analista da Tianfeng International Securities Ming-Chi Kuo. Foxconn Connector (Luxshare Precision) atuará como o único parceiro de design de sistema e
GateNews44m atrás
MiniMax-W Listada em Hong Kong Cai Mais de 14%, Zhipu Cai Mais de 6% no Lançamento do Modelo da DeepSeek
Mensagem de Notícias do Gate, 27 de abril — A MiniMax-W listada em Hong Kong caiu mais de 14% durante o pregão, enquanto a Zhipu caiu mais de 6% na mesma sessão.
A queda ocorreu após o lançamento, pela DeepSeek, de um novo modelo na sexta-feira e seu anúncio de ofertas promocionais por tempo limitado em
GateNews54m atrás
Cofundadores da Gentrace, Doug Safreno e Vivek Nair, se juntam à Anthropic após encerramento da ferramenta de avaliação de IA
Mensagem do Gate News, 27 de abril — Doug Safreno, cofundador e CEO da plataforma de avaliação e observabilidade de IA Gentrace, anunciou no X que se juntou à Anthropic. A Gentrace, que ajudou empresas a testar e monitorar a qualidade da saída de LLM, garantiu $8 milhão em financiamento da Série A liderado pela Matrix
GateNews1h atrás