Hoy toca hablar de una revolución en el mundo de la inteligencia artificial que va a cambiar por completo cómo interactuamos con la tecnología. Y es que, igual que necesitamos un buen antivirus gratis para proteger nuestros equipos, ahora más que nunca, también tenemos que estar al día con las herramientas de IA que nos facilitan la vida digital.
Señoras y señores, Google acaba de soltar una auténtica bomba: Gemini 2.5 Pro. Y por si os lo estáis preguntando: sí, ahora mismo estamos ante el modelo de inteligencia artificial más bestia del mercado. Google se ha coronado literalmente haciendo el modelo más potente que existe sobre la faz de la tierra, con bastante diferencia de todos los que tenemos disponibles actualmente.
El rey de los benchmarks
Vamos a hablar claro: los números no mienten y las puntuaciones de Gemini 2.5 Pro son acojonantes. En el Humanity Last Exam, esa prueba que supuestamente iba a ser insuperable para los LLMs, Gemini 2.5 ya puntúa con casi un 19%. ¿Y sabéis qué? La mejor puntuación hasta ahora la tenía OpenAI con su O3 Mini, que se quedaba en un 14%.
Vale, es cierto que OpenAI tiene modelos no liberados que podrían llegar al 25,2%, pero como eso no está en el mercado, a día de hoy Gemini 2.5 Pro es el rey absoluto que podemos probar y usar.
Y no os penséis que es solo en esta prueba. Si miramos otros benchmarks como GPA Diamond, puntúa con un impresionante 84%. Y en el ARC Polyglot alcanza un 74%, que es muchísimo más que el 60% que teníamos hasta ahora.
La revolución del contexto largo
Pero donde Gemini 2.5 Pro revienta la pana es en los benchmarks de contexto largo. Estamos hablando de un brutal 91% (o un 83% con un millón de tokens), mientras que otros modelos como OT3 Mini apenas llegan al 36%.
Y esto es tremendamente importante, porque cada vez necesitamos más que nuestras IAs manejen cantidades enormes de información. Imaginad procesar PDFs completos, transcripciones de videos de una hora, o toda la documentación de un proyecto. Ahí es donde Google siempre ha estado a la delantera y ahora ha dado un salto cuántico.
El benchmark que realmente importa
Ya sabéis que a mí el benchmark que más me importa es el del uso diario. Seamos pragmáticos y hablemos de cómo nos sirve este modelo en la vida real.
Google ha estado probando Gemini 2.5 Pro (bajo el nombre en código "Nébula") en el Chatbot Arena, donde usuarios reales hacen pruebas a ciegas sin saber qué modelo están usando. ¿Y sabéis qué ha pasado? No solo ha superado a todos los demás, sino que lo ha hecho con el mayor salto de diferencia de la historia de esta prueba.
Ha superado con más de 40 puntos al modelo de Grock, que era el que mejor funcionaba hasta ahora, y está casi 50 puntos por encima de GPT 4.5 Preview. Eso es una locura. Normalmente los saltos entre modelos son de dos o tres puntos, no de cuarenta. Es como si estuviéramos comparando un Ferrari con un Seat Panda.
¿Cómo probarlo?
Tenéis dos maneras muy sencillas de probar esta bestia:
- La aplicación de Gemini: Si pagáis por Gemini Advanced, simplemente id a vuestro interface, subid arriba a los modelos y elegid "2.5 Pro Experimental". Si no os sale aún, no os preocupéis, lo hará pronto.
- Google AI Studio: Esta es la opción gratuita e ilimitada. Solo necesitáis una cuenta de Google. La interfaz es menos amigable porque está pensada para desarrolladores, pero funciona perfectamente. Buscad el modelo "2.5 Pro Experimental" y listo.
Lo más impresionante es que, a pesar de su potencia, el modelo es sorprendentemente rápido, más que GPT 4.5. Puede que Google haya conseguido crackear algo para hacer que el modelo sea mejor sin necesariamente hacerlo más grande.
¿De verdad se nota tanta diferencia?
A ver, seamos sinceros: para el uso cotidiano que le damos la mayoría, es difícil notar diferencias enormes entre un modelo u otro. Son todos tremendamente buenos. Yo he estado codificando con diferentes modelos y algunas veces resuelve mejor uno, otras veces otro.
La realidad es que para la mayoría de casos tenemos suficiente inteligencia artificial, utilices el que utilices: GPT-4, Claude 3.7, Grock o Gemini. Es complicado encontrar una situación en la que te sientas realmente limitado.
Pero aquí entran las preferencias y la practicidad. Si ya estás pagando por Gemini y lo tienes integrado en tu Gmail, ¿para qué pagar ChatGPT? Recuerda que dentro de Gemini ya tenemos Canvas, búsqueda por internet, Research, los Gems (equivalentes a los GPTs)... Google se está convirtiendo en una alternativa completamente válida a ChatGPT en todos los aspectos.
La prueba del algodón
Le he puesto a prueba con algo realmente complicado: procesar un vídeo de noticias de IA de unos 40 minutos y hacer un resumen completo. Un vídeo de 38 minutos ocupó unos 600.000 tokens (de su millón disponible), y le pedí que hiciera un resumen en bullet points.
¿El resultado? Alucinante. Ha procesado perfectamente todo el contenido, identificando cada noticia, clasificándolas por temas, e incluso detectando los timestamps correctos. Os puedo garantizar que esta tarea no había manera de hacerla bien con ningún otro modelo de IA, ni siquiera con Claude u OpenAI.
La carrera armamentística continúa
Sin ninguna duda, estamos en un punto en que la carrera armamentística de inteligencia artificial se ha disparado. Google lo está haciendo muy bien, y no me voy a echar una medalla más (bueno, sí que me la voy a echar): hace meses que llevo diciendo que no desconfiéis de Google, que llevaban trabajando muchísimos años en esto y que estaban cocinándolo en la retaguardia.
Para mí, este año podía ser el año de Google y sin ninguna duda lo han petado. También han sacado la opción de generación de imágenes multimodal nativa con sus modelos Flash, aunque ChatGPT lo hace bastante mejor en ese apartado.
¿Qué pasará cuando salga GPT-5? ¿Qué veremos con DeepSeek R2? La batalla está más caliente que nunca.
Gemini promete dar mucha guerra
Google ha dado un golpe en la mesa con Gemini 2.5 Pro. Es un modelo superpotente que os animo a probar, ya sea gratis en AI Studio o integrado en vuestro ecosistema de Google.
Lo increíble es cómo está evolucionando todo esto. Hace un año estábamos alucinando con GPT-4, y ahora tenemos modelos que lo superan por goleada. Es como comparar los primeros móviles con un iPhone 15 Pro Max.
¿Es Gemini la mejor IA del momento? Los números dicen que sí. La experiencia de usuario dice que sí. Ahora la pelota está en el tejado de OpenAI y Anthropic. Que tiemblen, porque Google ha vuelto para quedarse.