Karpathy: El reconocimiento de capacidades de la IA muestra una brecha grave; la versión gratuita y el agente de vanguardia son "productos completamente diferentes"

Ex director de IA de Tesla y miembro fundador de OpenAI, Andrej Karpathy, publicó el 9 de abril en X un texto largo señalando que la percepción pública sobre las capacidades de la IA está empezando a dividirse de manera grave. Él considera que las personas que usan la versión gratuita de ChatGPT y los técnicos que usan a diario herramientas de agentes de vanguardia como Codex y Claude Code, en realidad están hablando de «productos completamente diferentes», pero ambas partes creen que lo que ven es la imagen completa de la IA.

Dos mundos, dos percepciones sobre la IA

Karpathy divide a los usuarios actuales de IA en dos grupos.

El primer grupo probó en algún momento del año pasado la versión gratuita de ChatGPT y, a partir de ahí, se formó una impresión general de la IA. Lo que ven son todo tipo de fallos del modelo: alucinaciones, resultados de búsqueda absurdos y modos de voz que también fallan en preguntas simples como «¿conducir o ir a lavar el coche caminando?». Karpathy reconoce que estos problemas existen de verdad, pero enfatiza que la versión gratuita y los modelos desactualizados no pueden representar las capacidades reales de los modelos de agentes de vanguardia antes de 2026.

El segundo grupo cumple dos condiciones a la vez: usar con pago los modelos de agentes de vanguardia más recientes (como OpenAI Codex o Claude Code) y utilizarlos de manera profesional en áreas técnicas como desarrollo de software, matemáticas e investigación. Karpathy afirma que este grupo está atravesando un alto nivel de «impacto mental de la IA» (AI Psychosis), porque los avances recientes de estos modelos en el ámbito técnico «solo se pueden describir como asombrosos»: puedes ver cómo resuelven en una hora problemas de arquitectura de software que antes requerían días e incluso semanas.

Por qué el progreso se concentra en el ámbito técnico

Karpathy explica por qué la mejora de las capacidades de la IA es especialmente notable en áreas técnicas como el desarrollo de programas, pero no es tan evidente en usos generales como búsqueda, escritura y recomendaciones.

Hay dos razones: primero, el ámbito técnico ofrece funciones de recompensa verificables (por ejemplo, si pasan o no las pruebas unitarias), lo que permite que el entrenamiento por aprendizaje por refuerzo funcione de manera efectiva; en cambio, la calidad de la escritura es difícil de determinar de forma clara. Segundo, el ámbito técnico tiene más valor comercial en escenarios B2B, por lo que las empresas de IA invierten la mayor proporción de recursos de su equipo en estas direcciones.

Los dos grupos no se entienden entre sí

Karpathy concluye que estos dos grupos están «hablando cada uno por su lado». El modo de voz de la versión gratuita de OpenAI falla con problemas cotidianos, mientras que el Codex de pago de más alto nivel de OpenAI reestructura todo el repositorio de código o encuentra vulnerabilidades del sistema en una hora: ambas cosas son ciertas al mismo tiempo.

En respuestas posteriores añadió que alguien le planteó una perspectiva: el motivo por el que el incidente de OpenClaw suscitó tanta atención social es que hizo que un gran número de personas no técnicas conocieran por primera vez los últimos modelos de agentes, y estas personas antes solo sabían que la IA equivalía a ChatGPT en su versión web.

Este artículo de Karpathy: el reconocimiento de capacidades de la IA muestra un grave desfase; la versión gratuita y el agente de vanguardia son «productos completamente diferentes» apareció por primera vez en Cadena de noticias ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Cofundador de Ethereum Lubin: la IA será un punto de inflexión crítico para las criptomonedas, pero el monopolio de los gigantes tecnológicos plantea un riesgo sistémico

El cofundador de Ethereum Joseph Lubin destacó el potencial transformador de la IA para el sector de las criptomonedas, al tiempo que advirtió sobre los riesgos de la centralización entre los gigantes tecnológicos. Él imagina transacciones autónomas impulsadas por IA en blockchain y resalta la convergencia de las finanzas tradicionales con DeFi.

GateNewshace6h

Luffa与数字资产平台合作集成AI驱动的加密交易

Luffa,一个面向Web3的社交生态系统,与数字资产交易平台合作以集成由AI驱动的交易功能,在保持去中心化和风险缓解的同时,增强安全通信与交易,并在统一界面中实现这些能力。

GateNewshace13h

El agente expendedor de IA “Valerie” opera una máquina expendedora en San Francisco con OpenClaw

El agente de IA "Valerie" ahora ejecuta una máquina expendedora en San Francisco en OpenClaw, probando hasta qué punto la gente confiará en el código con precios, marketing y efectivo del mundo real. Resumen El agente de IA "Valerie" ejecuta una máquina expendedora física en San Francisco usando el framework OpenClaw, estableciendo precios, nombrando

Cryptonews04-17 15:06

Mastercard habilita los pagos de agentes de IA mediante una asociación con Lobstercash y Crossmint

Mastercard se ha asociado con Lobstercash y Crossmint para facilitar pagos de agentes de IA mediante tarjetas de crédito y débito existentes, integrándose en los sistemas financieros actuales sin necesidad de nuevas billeteras. Esta colaboración permite a los agentes de IA automatizar transacciones, mejorando la eficiencia y la seguridad.

GateNews04-17 10:11

El equipo de China EvoMap enfurece: el Hermes Agent se vuelve viral por la explosión de popularidad, presunta copia: dentro del sistema de autoevolución existen similitudes de alta intensidad

El equipo de China EvoMap acusa al agente Hermes de Nous Research de copiar su arquitectura Evolver/GEP, y sostiene que ambos presentan un alto grado de similitud en varios módulos clave. EvoMap señala que el diseño de Hermes no hace referencia ni da reconocimiento a su contenido previamente publicado; la polémica ha despertado una amplia atención en la comunidad. Parte de los internautas chinos apoya a EvoMap y critica la conducta de copia de Hermes. Aunque el equipo de Nous aún no ha refutado punto por punto las acusaciones, el incidente se ha difundido rápidamente en la opinión pública sobre IA.

ChainNewsAbmedia04-17 09:54

OpenAI actualiza Codex a un agente de IA que controla el escritorio, automatizando los flujos de trabajo de desarrollo

El Codex mejorado de OpenAI evoluciona de un asistente de programación a un agente autónomo para entornos de escritorio, capaz de gestionar aplicaciones, automatizar flujos de trabajo e integrarse con más de 100 aplicaciones. Este cambio mejora la continuidad de las tareas y la automatización de flujos de trabajo, reflejando un panorama competitivo en herramientas de codificación con IA.

GateNews04-17 09:21
Comentar
0/400
Sin comentarios