OpenAI no da tregua a Google: anuncia o3 y o3 mini tras del lanzamiento del modo de pensamiento de Gemini

Ser Noticia 20 diciembre 2024

La competencia entre OpenAI y otras compañías en el ámbito de la inteligencia artificial (IA) es una guerra sin cuartel. El lanzamiento de ChatGPT en noviembre de 2022 supuso un punto inflexión en esta industria, que se ha vuelto mucho más competitiva. Desde ese entonces, Google ha estado tratando de recuperar su liderazgo, pero la firma liderada por Sam Altman no le ha dado respiro.

En los últimos años hemos visto cómo el gigante del buscador y la “startup” respaldada por Microsoft han medido sus fuerzas lanzamiento tras lanzamiento. Google presentó esta semana el “Modo de pensamiento de Gemini 2.0 Flash”, una apuesta que, por fin, parecía estar a la altura del modelo o1 de OpenAI. Pues bien, acaban de aparecer en escena los nuevos modelos o3 y o3 mini de OpenAI.

OpenAI presenta sus nuevos modelos de razonamiento

Lo último de los creadores de ChatGPT es capaz de ofrecer un nivel de razonamiento más avanzado que la versión inicial. Al igual que el modelo o1 que conocimos en septiembre de este año, el nuevo modelo pasará algo de tiempo “pensando” la respuesta. No será tan rápido como las versiones GPT, pero su ventaja es que será capaz de resolver problemas más complejos en varios pasos.

Ciertamente, los modelos de razonamiento son ideales para todo. De hecho, el ámbito de la IA está creciendo tanto que hay alternativas orientadas a casos de uso. Por ejemplo, si buscamos un modelo de respuestas rápidas para impulsar un chatbot de atención al cliente, no elegiríamos o3, sino algo como GPT-4o mini. Si lo que buscamos en precisión en física y matemática, puede que o3 sea la elección correcta.

Una forma interesante de analizar el alcance y las posibilidades de un modelo es contemplarlo a la luz de los benchmarks. Durante la presentación, OpenAI ha presentó dos puntos de referencia de programación. Como podemos ver en las imágenes, o3 mejora a o1 en 22,8 puntos porcentuales en SWE-Bench Verified. En este punto de referencia alcanza 71.7 puntos en frente a los 84.9 del modelo anterior.

En Codeforces, o1 alcanza una puntuación de 1891 y o3 de 2727. Como decimos, estos modelos son útiles para muchas tareas complejas. Si nos enfocamos en puntos de referencia de matemáticas, en el American Invitational Mathematics Exam 2024, o1 registra una puntuación del 83.3%. o3, por su parte, presume de un 96.7%, fallando a una única pregunta.

Cabe señalar que la decisión de llamar al modelo o3 en lugar de o2 parece no tener que ver con un salto en sus capacidades (o de un movimiento motivado por el marketing). En realidad, según The Information, se debe a evitar problemas de marcas registradas. OpenAI habría decidido saltarse un número porque o2 es una marca registrada de un proveedor de telecomunicaciones británico.

OpenAI tiene un problema muy serio con Sora: Google le acaba de adelantar por la derecha con su IA de vídeo

Tendremos que esperar para acceder al nuevo modelo de razonamiento insignia de OpenAI, o3, como a su modelo más pequeño y rápido, o3 mini. De momento, los investigadores de seguridad pueden apuntarse en una lista de esperar para probar el modelo. La firma espera lanzarlos al público más adelante, pero no está claro cuándo acabarán llegando (y si bajo qué suscripciones).

Imágenes | Xataka con DALL·E 3

En Xataka | Apple no puede ofrecer ChatGPT en China. Más que un problema, eso es una bendición

source

Relacionado

Ser Noticia 20 diciembre 2024

OpenAI no da tregua a Google: anuncia o3 y o3 mini tras del lanzamiento del modo de pensamiento de Gemini

OpenAI presenta sus nuevos modelos de razonamiento

Me gusta esto:

Relacionado

Read Next

🚨⚡️ #Portada_EDOMEX Isaac Montoya destaca avances sustanciales en el primer trimestre de gobierno #Toluca 🚨⚡️

China ha respondido a EEUU poniendo la industria de los chips global contra las cuerdas. Esta es su estrategia

El tiempo en Semana Santa 2025: las mejores webs y apps para saber qué tiempo vas a tener en tus vacaciones

Shopify se pone dura con el uso de IA para sus empleados: si no la usas "el estancamiento es inevitable"

Amazon rompe su techo en España: ya supera los 8.000 millones en ingresos y consigue ser rentable

El Bombardier Global 8000 se prepara para entrar en servicio: será el avión civil más rápido del mundo desde el Concorde

Tras la crisis de ventas en China, los coches de lujo se volcaron en EEUU: los aranceles les han devuelto a la dura realidad

Cada vez sabemos más sobre por qué tenemos hambre o sed. Y el principal sospechoso es nuestro cerebro

Hemos logrado que los lobos gigantes vuelvan tras 10.000 años extintos. El problema es que "vuelvan" quizá no sea la palabra correcta

La Lista Robinson ha sido supuestamente hackeada. De ese “supuestamente” dependen los datos de más de 600.000 personas

🚨⚡️ #Portada_EDOMEX Isaac Montoya destaca avances sustanciales en el primer trimestre de gobierno #Toluca 🚨⚡️

China ha respondido a EEUU poniendo la industria de los chips global contra las cuerdas. Esta es su estrategia

El tiempo en Semana Santa 2025: las mejores webs y apps para saber qué tiempo vas a tener en tus vacaciones

Shopify se pone dura con el uso de IA para sus empleados: si no la usas "el estancamiento es inevitable"

Amazon rompe su techo en España: ya supera los 8.000 millones en ingresos y consigue ser rentable

El Bombardier Global 8000 se prepara para entrar en servicio: será el avión civil más rápido del mundo desde el Concorde

Tras la crisis de ventas en China, los coches de lujo se volcaron en EEUU: los aranceles les han devuelto a la dura realidad

Cada vez sabemos más sobre por qué tenemos hambre o sed. Y el principal sospechoso es nuestro cerebro

Hemos logrado que los lobos gigantes vuelvan tras 10.000 años extintos. El problema es que "vuelvan" quizá no sea la palabra correcta

La Lista Robinson ha sido supuestamente hackeada. De ese “supuestamente” dependen los datos de más de 600.000 personas

Israel-Palestina: Israel no puede negarse a garantizar la entrega y distribución de ayuda humanitaria

Gaza, desperdicio de alimentos, derechos de las personas con discapacidad… Las noticias del miércoles

Acusación de genocidio en Gaza, Yemen, migrantes muertos… Las noticias del martes

OpenAI presenta sus nuevos modelos de razonamiento

Me gusta esto:

Relacionado

Read Next

🚨⚡️ #Portada_EDOMEX Isaac Montoya destaca avances sustanciales en el primer trimestre de gobierno #Toluca 🚨⚡️

China ha respondido a EEUU poniendo la industria de los chips global contra las cuerdas. Esta es su estrategia

El tiempo en Semana Santa 2025: las mejores webs y apps para saber qué tiempo vas a tener en tus vacaciones

Shopify se pone dura con el uso de IA para sus empleados: si no la usas "el estancamiento es inevitable"

Amazon rompe su techo en España: ya supera los 8.000 millones en ingresos y consigue ser rentable

El Bombardier Global 8000 se prepara para entrar en servicio: será el avión civil más rápido del mundo desde el Concorde

Tras la crisis de ventas en China, los coches de lujo se volcaron en EEUU: los aranceles les han devuelto a la dura realidad

Cada vez sabemos más sobre por qué tenemos hambre o sed. Y el principal sospechoso es nuestro cerebro

Hemos logrado que los lobos gigantes vuelvan tras 10.000 años extintos. El problema es que "vuelvan" quizá no sea la palabra correcta

La Lista Robinson ha sido supuestamente hackeada. De ese “supuestamente” dependen los datos de más de 600.000 personas

Google ya tiene una IA que "razona". Y hay un padre, un hijo, un mono y comida que lo demuestran

Meta da el primer paso en Talavera: 20,6 millones de euros para el suelo de su próximo mega centro de datos en España

Publicaciones relacionadas

Israel-Palestina: Israel no puede negarse a garantizar la entrega y distribución de ayuda humanitaria

Gaza, desperdicio de alimentos, derechos de las personas con discapacidad… Las noticias del miércoles

Acusación de genocidio en Gaza, Yemen, migrantes muertos… Las noticias del martes