GLM-5.1 ocupa el primer lugar en la lista de código de LMArena que se ha publicado como código abierto, y es el tercero a nivel mundial.

Noticias de Gate News. 10 de abril. Hoy, la plataforma global de evaluación autorizada de IA LMArena (plataforma de evaluación de modelos de IA basada en pruebas a ciegas con participación de millones de usuarios) actualizó el ranking especializado Code Arena. GLM-5.1 ocupa el primer lugar entre los modelos de código abierto a nivel global y el tercero a nivel mundial.

GLM-5.1 no solo hereda las capacidades de codificación SOTA de código abierto de la generación anterior, sino que también logra un avance en tareas de largo alcance (Long-Horizon Task), consiguiendo: construir un escritorio Linux desde cero en 8 horas; 655 iteraciones para superar el cuello de botella de optimización de las bases de datos vectoriales; y 1000 rondas de optimización de llamadas a herramientas para ajustarse a cargas reales de modelos de aprendizaje automático.

Cabe destacar que, bajo los mismos criterios de evaluación del ranking METR, GLM-5.1 es el único modelo de código abierto que alcanza un trabajo continuo de nivel de 8 horas, y es, a nivel global, uno de los pocos modelos que cuentan con esta capacidad, además de Claude Opus 4.6.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

NEA explora el uso de la inteligencia artificial en la regulación nuclear

El Grupo de Trabajo de la NEA sobre Nuevas Tecnologías convocó un taller los días 25 y 26 de marzo, centrado en cómo la inteligencia artificial puede aplicarse a la supervisión regulatoria y a las operaciones internas dentro de las autoridades nucleares. Resumen El taller de la NEA exploró aplicaciones reales de IA en la regulación nuclear, con

Cryptonewshace1h

China probará 300+ robots humanoides en el medio maratón de Pekín el 19 de abril

El segundo medio maratón de robots de Pekín presenta más de 300 robots humanoides de 70 equipos compitiendo en un recorrido de 21 km. Se destacan avances en el movimiento autónomo, con un 40% operando sin control. China domina el mercado de robots humanoides, a pesar de los desafíos de producción.

GateNewshace4h

EE. UU. busca aumentar las importaciones de uranio de Namibia para impulsar plantas nucleares impulsadas por IA

Estados Unidos está considerando aumentar las importaciones de uranio desde Namibia para respaldar la energía nuclear de los centros de datos de IA, ya que China domina el sector del uranio de Namibia. Los precios crecientes del uranio están reavivando el interés por la minería, a pesar de los desafíos del suministro de agua en la región árida.

GateNewshace4h

Ejecutivos de OpenAI Bill Peebles y Kevin Weil se van en una reorganización de liderazgo

Los ejecutivos de OpenAI, Bill Peebles y Kevin Weil, anunciaron su salida, como parte de una serie de cambios de liderazgo mientras la empresa descentraliza sus operaciones. Sus partidas siguen a otras salidas de alto perfil y a un cambio en la estructura de la empresa.

GateNewshace5h

Zoom se asocia con World para añadir detección de deepfakes mediante reconocimiento facial

Zoom se ha asociado con World, de Sam Altman, para lanzar una función que detecta participantes reales frente a deepfakes de IA durante videollamadas. Esto busca combatir el aumento del fraude mediante deepfakes, con opciones de verificación para anfitriones y participantes.

GateNewshace5h

Los informes de fallos generados por IA abruman al equipo de mantenimiento de cURL

Los informes de fallos generados por IA están abrumando el proyecto cURL, con un aumento significativo en las presentaciones que está provocando una tensión de recursos. Los responsables están respondiendo limitando el acceso a modelos de IA y pausando los programas de recompensas por vulnerabilidades para gestionar la avalancha.

GateNewshace6h
Comentar
0/400
Sin comentarios