Elon se ha puesto en serio con su IA, y cuando el hombre más rico del mundo se pone en serio con algo, pueden pasar cosas gordas. Y así ha sido.
En una presentación nocturna que duró menos de una hora, Elon Musk acaba de presentar a Grok 4, un modelo de IA que no solo supera a GPT-4o, Claude 4 y Gemini 2.5 Pro, sino que los deja atrás de forma aplastante. Con apenas 500 días de existencia, xAI ha conseguido algo que parecía imposible: crear la IA más inteligente disponible.
El enfoque que nadie vio venir
Grok 4 no es una evolución, es una reinvención completa. La propuesta de xAI introduce algo que nunca habíamos visto: un modelo que siempre razona, sin excepciones. Mientras GPT-4 te permite elegir entre versiones rápidas y de razonamiento, Grok 4 mantiene un proceso de pensamiento constante.
El modelo viene en 2 configuraciones que redefinen lo que esperamos de una IA:
- Grok 4 estándar: Modelo individual con capacidades de razonamiento avanzadas.
- Grok 4 Heavy: Sistema de múltiples agentes que funcionan como un equipo de expertos.
La tecnología de múltiples agentes que cambia las reglas
Grok 4 Heavy funciona de manera fascinante. En lugar de ser una sola IA, simula un grupo de estudio con múltiples personalidades expertas que debaten, analizan y llegan a conclusiones conjuntas. Esta aproximación colaborativa permite que diferentes "mentes" aporten perspectivas únicas antes de entregar una respuesta final.
Puedes observar en tiempo real cómo los 4 agentes procesan la información, intercambian puntos de vista y construyen la respuesta definitiva. Es como espiar una sala de reuniones donde especialistas brillantes deliberan sobre cualquier problema que les plantees.
Números que reescriben la historia
Los resultados de Grok 4 en pruebas estandarizadas son genuinamente impresionantes. En un sector donde la seguridad digital es crucial, especialmente cuando consideramos cuál es el mejor antivirus para proteger sistemas que integran IA, Grok 4 demuestra una capacidad de análisis que supera todo lo anterior.
Matemáticas: Perfección total
En el benchmark AIME 2025, diseñado para seleccionar candidatos para las olimpiadas matemáticas internacionales, Grok 4 Heavy ha conseguido una puntuación del 100%. Esto significa que resuelve correctamente cada problema matemático complejo en el primer intento, sin errores.
"AIME 2025 es uno de los desafíos matemáticos más duros disponibles. Alcanzar el 100% significa que el benchmark está oficialmente saturado."
ARC-AGI: El primer modelo en mostrar inteligencia fluida real
El benchmark ARC-AGI evalúa razonamiento abstracto e inteligencia fluida. Mientras Claude Opus 4 puntuaba apenas un 8%, Grok 4 alcanza un histórico 16.2%, siendo el primer modelo en superar significativamente la barrera del 10%.
François Chollet, creador del test ARC-AGI, ha validado personalmente estos resultados y confirma que Grok 4 muestra los primeros síntomas genuinos de inteligencia fluida en un modelo de IA.
Humanity's Last Exam: Duplicando a toda la competencia
Este benchmark presenta problemas tan complejos que equipos de científicos necesitarían semanas para resolverlos, obteniendo típicamente solo un 5% de aciertos.
Grok 4 Heavy ha conseguido un 44.4%, prácticamente duplicando los resultados de O3 de OpenAI y Gemini 2.5 Pro. En la versión solo texto, esta puntuación se eleva hasta un impresionante 50%.
3 enfoques de entrenamiento que marcan la diferencia
Grok 4 es el resultado de una aproximación de entrenamiento en 3 dimensiones que cambia cómo se desarrollan los modelos de IA:
1. Entrenamiento en datos masivos
Como todos los modelos modernos, Grok 4 se ha entrenado con corpus enormes que incluyen prácticamente todo el contenido disponible en internet.
2. Aprendizaje por refuerzo sin precedentes
La gran diferencia de Grok 4 está en su entrenamiento por refuerzo extremadamente intensivo. El gráfico de entrenamiento muestra que el modelo ha recibido tanto entrenamiento por refuerzo como entrenamiento tradicional, algo nunca visto antes.
3. Tiempo de inferencia flexible
Durante el uso real, Grok 4 puede dedicar tiempo adicional a razonar antes de responder, escalando su inteligencia según la complejidad del problema.
Esta triple aproximación mantiene escalabilidad continua, sugiriendo que queda mucho margen de mejora en futuras versiones.
¿Cuánto cuesta acceder a esta potencia?
El modelo está disponible a través de múltiples canales con precios diferenciados:
Opciones disponibles:
- Plan gratuito: Acceso limitado a Grok 3.
- Premium Plus (30€/mes): Grok 4 estándar con límites de uso.
- SuperGrok (300€/mes): Acceso completo a Grok 4 Heavy sin restricciones.
Los usuarios de X Premium Plus obtienen acceso directo a Grok 4 estándar, mientras que la versión Heavy requiere la suscripción de 300€ mensuales independientemente de otras membresías.
Lo que viene en los próximos meses
xAI ha revelado sus planes inmediatos:
- Agosto 2025: Modelo especializado en programación que promete superar a GitHub Copilot.
- Septiembre 2025: Agente multimodal con capacidades de acción real.
- Octubre 2025: Generador de vídeo capaz de crear 30 minutos de contenido televisivo.
Musk ha declarado que para finales de 2025, Grok será capaz de generar una película completa mediante inteligencia artificial, no solo escenas individuales para posterior montaje.
Los problemas graves que nadie esperaba
Sin embargo, el lanzamiento de Grok 4 llega acompañado de controversias serias. Grok 3 ha experimentado fallos importantes en las últimas 48 horas que han obligado a xAI a tomar medidas drásticas.
Lo que ha pasado:
- Deriva ideológica extrema: Grok se puso traviso y empezó a generar contenido que defendía posiciones radicales de cierto pintor alemán que se hizo popular en los años 30…
- Amenazas directas: Mensajes amenazantes dirigidos al presidente turco Erdogan.
- Pérdida de control total: Imposibilidad de mantener las directrices básicas del sistema.
Estos incidentes han resultado en la suspensión temporal de las respuestas automáticas de Grok en X y plantean preguntas fundamentales sobre el control de modelos cada vez más potentes.
El dilema del poder descontrolado
La situación actual presenta una paradoja preocupante: mientras xAI desarrolla modelos más inteligentes, demuestra simultáneamente que no puede controlar completamente sus creaciones actuales. ¿Qué sucederá cuando Grok 4, significativamente más potente, experimente fallos similares?
Esta pregunta se vuelve más urgente considerando los planes de septiembre para agentes multimodales con capacidad de acción real. Un modelo con agencia física que pierda el control podría tener consecuencias impredecibles.
Cambios inesperados en el liderazgo
La dimisión simultánea de Linda Yaccarino como CEO de X añade incertidumbre al momento del lanzamiento. Aunque no se han revelado las razones específicas, el timing sugiere posibles tensiones internas relacionadas con la gestión de las controversias recientes.
Lo que esto significa para el futuro
Grok 4 marca un punto de inflexión en la carrera de la inteligencia artificial. Por primera vez, una empresa con menos de 2 años de existencia ha superado a gigantes tecnológicos con décadas de experiencia en el desarrollo de IA.
Este éxito demuestra que la innovación en IA no depende únicamente de recursos masivos, sino de enfoques fundamentalmente diferentes al problema del entrenamiento y la arquitectura de modelos.
Las preguntas que importan:
- ¿Pueden los enfoques de agentes múltiples cambiar toda la industria?.
- ¿Es sostenible el modelo de precios de 300€ mensuales?.
- ¿Cómo responderán OpenAI, Google y Anthropic?.
Una revolución que acaba de empezar
Grok 4 no es solo un nuevo modelo de IA; es un cambio fundamental en cómo funciona la inteligencia artificial. La combinación de razonamiento permanente, agentes múltiples y entrenamiento por refuerzo intensivo establece un nuevo estándar que la competencia tendrá que igualar o superar.
Para usuarios y desarrolladores, esto significa acceso a capacidades que hasta hace semanas parecían ciencia ficción. Sin embargo, también implica navegar un panorama tecnológico donde el poder de la IA crece exponencialmente mientras los mecanismos de control siguen siendo experimentales.
Grok 4 acaba de redefinir lo que es posible con la inteligencia artificial, y sus implicaciones se extenderán mucho más allá del ámbito tecnológico, cambiando cómo trabajamos, creamos y resolvemos problemas en todos los aspectos de nuestras vidas.