Mensaje de Gate News, 24 de abril — El ingeniero de OpenAI, Clive Chan, ha presentado objeciones detalladas al capítulo de recomendaciones de hardware en el informe técnico V4, calificándolo de “sorprendentemente mediocre y propenso a errores” en comparación con la versión V3 aclamada. La guía de hardware de V3, que incluía sesiones de Q&A que se convirtieron en el tema de discusión más popular en la conferencia académica ISCA, ofreció recomendaciones específicas alineadas con los estándares de interconexión de la industria. En cambio, V4 es mucho más vaga.
Chan cuestionó sistemáticamente tres recomendaciones clave. Sobre el consumo de energía, el informe sugiere que la optimización del software permite que los chips ejecuten cómputo, almacenamiento y comunicación al mismo tiempo al máximo, y recomienda que los fabricantes de chips reserven margen adicional de potencia. Chan sostiene que esto es contraproducente: la potencia total del chip está limitada por restricciones físicas del proceso, así que reservar más margen de potencia solo reduce la frecuencia de operación, disminuyendo en última instancia el rendimiento computacional. En cuanto a la transferencia de datos de GPU a GPU, el informe aboga por un modelo pull—en el que las GPU obtienen activamente los datos—en lugar de un modelo push, citando la alta sobrecarga de notificaciones en las operaciones push. Chan lo refuta, argumentando que en realidad el pull es más lento y que sería preferible mejorar las capacidades de los adaptadores de red. Sin embargo, ambos podrían estar hablando de capas diferentes del problema: el informe aborda la sobrecarga del mecanismo de notificación, mientras que Chan se refiere a la latencia de transmisión en sí.
Sobre las funciones de activación, el informe recomienda reemplazar SwiGLU por funciones más simples para reducir la carga computacional. Chan no ve mérito en ello, señalando que Sonic MoE ya ha demostrado un rendimiento óptimo usando SwiGLU. Chan sospecha que DeepSeek pudo haber “debilitado deliberadamente esta sección.”
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Cohere adquiere la firma alemana de IA Aleph Alpha y asegura $600M inversión para la expansión europea
Mensaje de Gate News, 24 de abril: la empresa canadiense de IA Cohere anunció planes para adquirir la firma alemana de IA Aleph Alpha para reforzar su presencia en Europa. Schwarz Group, un patrocinador de Aleph Alpha, planea invertir $600 millones en la ronda de financiación Serie E de Cohere.
Se espera que la ronda de financiación cierre en 202
GateNewsHace13m
Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show
Gate News message, April 24 — Chinese automakers showcased advanced in-car AI systems at the Beijing Auto Show on April 24, as the country accelerates its AI Plus strategy and seeks greater independence from foreign semiconductors.
Xpeng demonstrated voice-controlled parking that allows drivers to
GateNewsHace53m
Ex ingeniero de Seed de ByteDance: la iteración de la IA de ByteDance tarda seis meses frente a los tres meses de Google
Mensaje de Gate News, 24 de abril — Zhang Chi, ex ingeniero del equipo Seed de ByteDance y profesor asistente actual en la Universidad de Pekín, reveló en el podcast "Into Asia" que ByteDance requiere aproximadamente seis meses para completar un ciclo completo de entrenamiento de preentrenamiento de modelos de lenguaje a gran escala (pretraining
GateNewshace1h
Naver lanza la beta de AI Tab mientras Google Gemini entra en el mercado de búsquedas de Corea del Sur
Mensaje de Gate News, 24 de abril — Naver anunció el inicio de una beta cerrada para AI Tab, su nueva función de búsqueda conversacional, tras el lanzamiento de Gemini en Chrome por parte de Google en Corea del Sur.
AI Tab aparecerá junto a las pestañas de búsqueda existentes de Naver, ofreciendo a los usuarios un espacio dedicado para consultas conversacionales
GateNewshace1h
La contratación de ingeniería en IA en India se dispara un 59,5% y se expande más allá de los centros tecnológicos
El Informe sobre el Mercado Laboral de la IA de LinkedIn 2026, publicado el 24 de abril, descubrió que la contratación de ingeniería de IA en India aumentó un 59,5% interanual, marcando el ritmo más rápido entre los mercados estudiados por la plataforma.
El crecimiento estuvo impulsado por una expansión de la demanda más allá de los centros tecnológicos establecidos. Ciudades, incluidas
CryptoFrontierhace2h
Banco Commonwealth reduce 120 empleos en medio de la expansión de la IA
Commonwealth Bank of Australia anunció que recortará aproximadamente 120 empleos mientras el mayor banco del país revisa sus puestos y amplía el uso de inteligencia artificial, según Bloomberg. Los recortes incluyen 43 puestos en Bankwest en Australia Occidental, con seis posiciones afectadas por la automatización. Esto es
CryptoFrontierhace2h