Noticias de Gate News. 10 de abril. Hoy, la plataforma global de evaluación autorizada de IA LMArena (plataforma de evaluación de modelos de IA basada en pruebas a ciegas con participación de millones de usuarios) actualizó el ranking especializado Code Arena. GLM-5.1 ocupa el primer lugar entre los modelos de código abierto a nivel global y el tercero a nivel mundial.
GLM-5.1 no solo hereda las capacidades de codificación SOTA de código abierto de la generación anterior, sino que también logra un avance en tareas de largo alcance (Long-Horizon Task), consiguiendo: construir un escritorio Linux desde cero en 8 horas; 655 iteraciones para superar el cuello de botella de optimización de las bases de datos vectoriales; y 1000 rondas de optimización de llamadas a herramientas para ajustarse a cargas reales de modelos de aprendizaje automático.
Cabe destacar que, bajo los mismos criterios de evaluación del ranking METR, GLM-5.1 es el único modelo de código abierto que alcanza un trabajo continuo de nivel de 8 horas, y es, a nivel global, uno de los pocos modelos que cuentan con esta capacidad, además de Claude Opus 4.6.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
NEA explora el uso de la inteligencia artificial en la regulación nuclear
El Grupo de Trabajo de la NEA sobre Nuevas Tecnologías convocó un taller los días 25 y 26 de marzo, centrado en cómo la inteligencia artificial puede aplicarse a la supervisión regulatoria y a las operaciones internas dentro de las autoridades nucleares.
Resumen
El taller de la NEA exploró aplicaciones reales de IA en la regulación nuclear, con
Cryptonewshace1h
China probará 300+ robots humanoides en el medio maratón de Pekín el 19 de abril
El segundo medio maratón de robots de Pekín presenta más de 300 robots humanoides de 70 equipos compitiendo en un recorrido de 21 km. Se destacan avances en el movimiento autónomo, con un 40% operando sin control. China domina el mercado de robots humanoides, a pesar de los desafíos de producción.
GateNewshace4h
EE. UU. busca aumentar las importaciones de uranio de Namibia para impulsar plantas nucleares impulsadas por IA
Estados Unidos está considerando aumentar las importaciones de uranio desde Namibia para respaldar la energía nuclear de los centros de datos de IA, ya que China domina el sector del uranio de Namibia. Los precios crecientes del uranio están reavivando el interés por la minería, a pesar de los desafíos del suministro de agua en la región árida.
GateNewshace4h
Ejecutivos de OpenAI Bill Peebles y Kevin Weil se van en una reorganización de liderazgo
Los ejecutivos de OpenAI, Bill Peebles y Kevin Weil, anunciaron su salida, como parte de una serie de cambios de liderazgo mientras la empresa descentraliza sus operaciones. Sus partidas siguen a otras salidas de alto perfil y a un cambio en la estructura de la empresa.
GateNewshace5h
Zoom se asocia con World para añadir detección de deepfakes mediante reconocimiento facial
Zoom se ha asociado con World, de Sam Altman, para lanzar una función que detecta participantes reales frente a deepfakes de IA durante videollamadas. Esto busca combatir el aumento del fraude mediante deepfakes, con opciones de verificación para anfitriones y participantes.
GateNewshace5h
Los informes de fallos generados por IA abruman al equipo de mantenimiento de cURL
Los informes de fallos generados por IA están abrumando el proyecto cURL, con un aumento significativo en las presentaciones que está provocando una tensión de recursos. Los responsables están respondiendo limitando el acceso a modelos de IA y pausando los programas de recompensas por vulnerabilidades para gestionar la avalancha.
GateNewshace6h