...

Logo Pasino du Havre - Casino-Hôtel - Spa
in partnership with
Logo Nextory

o1 de OpenAI es una inteligencia artificial capaz de razonar al nivel de estudiantes de doctorado

• Sep 15, 2024, 8:00 AM
4 min de lecture
1

OpenAI ha lanzado una nueva serie de modelos que, según afirma, "pueden resolver problemas más difíciles" que sus anteriores modelos de inteligencia artificial generativa (GenAI).

La empresa californiana anunció el jueves el lanzamiento de una versión preliminar de esta serie, denominada oficialmente 'o1-preview' y 'o1-mini'. El nombre en clave del modelo es 'Strawberry'.

OpenAI afirma que, en sus pruebas, los nuevos modelos obtuvieron resultados similares a los de estudiantes de doctorado en tareas exigentes de física, química y biología, y obtuvieron buenos resultados en matemáticas y codificación.

La empresa detrás de ChatGPT explicó que probó el modelo en un examen clasificatorio para la Olimpiada Matemática Internacional (IMO), una competición matemática de secundaria.

Tuvo diez horas para resolver seis problemas algorítmicos difíciles y se le permitieron 50 envíos por problema. El modelo 'o1' resolvió el 83% de los problemas, mientras que GPT-4o sólo resolvió el 13%, según OpenAI.

¿Cuáles son los inconvenientes?

La empresa señala que no dispone de todas las funciones principales de ChatGPT, como la navegación por Internet en busca de información y la carga de archivos e imágenes. Tampoco tiene funciones de análisis de imágenes, que se han desactivado a la espera de pruebas adicionales.

Otro inconveniente es que es muy caro. El nuevo modelo cuesta unas tres veces más que el GPT-4o para la entrada y cuatro veces más caro para la salida. El 'o1-preview' cuesta 15 dólares (13,50 euros) por 1 millón de tokens de entrada y 60 dólares (54 euros) por 1 millón de tokens de salida. Los tokens son datos en bruto y 1 millón de tokens equivale a unas 750.000 palabras.

Por el momento no es gratuito para los usuarios, pero la empresa afirma que está planeando ofrecer 'o1-mini' a todos los usuarios gratuitos de ChatGPT. OpenAI también dijo en un documento técnico que los comentarios de los probadores fueron que o1 tiende a alucinar (inventar cosas) más que GPT-4o. Tampoco admite tanto no tener respuesta a una pregunta.

El cofundador y consejero delegado de OpenAI, Sam Altman, dijo en un post en X que "o1 sigue teniendo fallos, sigue siendo limitado y sigue pareciendo más impresionante en el primer uso que después de pasar más tiempo con él".

o1 usa una cadena de pensamiento similar a los humanos

OpenAI afirmó que el modelo funciona "de forma similar a como un humano puede pensar durante mucho tiempo antes de responder a una pregunta difícil", y añadió que "o1 utiliza una cadena de pensamiento cuando intenta resolver un problema".

OpenAI no mostró exactamente cómo funcionaba este razonamiento de "cadena de pensamiento", en parte debido a la ventaja competitiva. Pero sí mostró "resúmenes generados por modelos" de las cadenas de pensamiento.

Colaboración con Gobiernos, no europeos

OpenAI afirmó que, para avanzar en su compromiso con la seguridad de la IA, había formalizado recientemente acuerdos con los Institutos de Seguridad de la IA de EE.UU. y Reino Unido, que incluían la concesión a dichos institutos de acceso anticipado al modelo antes de su publicación.

OpenAI no mencionó la colaboración con los Gobiernos europeos.


Today

Volkswagen niega tener planes para recortar 30.000 empleados de su plantilla como se rumoreaba
• 9:21 AM
3 min
A principios de este mes, Oliver Blume, Consejero Delegado, comunicó a los empleados que la empresa debía poner fin a un compromiso de protección del empleo de tres décadas de antigüedad que habría prohibido los despidos hasta 2029.
Read the article
¿Las tensiones en Oriente Medio provocarán otra crisis de los precios de la energía en Europa?
• 9:10 AM
3 min
¿Las tensiones en Oriente Próximo provocarán otra sacudida de los precios en Europa? El analista energético Yousef Alshammari comparte con 'Euronews Business' sus perspectivas sobre los precios del petróleo.
Read the article
¿Qué capitales tienen el transporte público mejor y peor valorado de Europa?
• 8:00 AM
9 min
El descontento con el transporte público en las capitales se dejó sentir más en el sur de Europa y en algunas zonas de los Balcanes. ¿Cuál es la situación de su ciudad?
Read the article
La Europol detiene a 51 personas relacionadas con ciberdelincuencia a gran escala
• 12:30 AM
1 min
Europol detiene a 51 personas relacionadas con Ghost, una plataforma utilizada por los ciberdelincuentes para el tráfico de drogas y el blanqueo de dinero a gran escala.
Read the article
Un donante mundial de vacunas comprará 500.000 inyecciones de mpox para África
• 12:19 AM
4 min
Las vacunas deberían llegar a finales de este año, según la alianza de vacunas Gavi.
Read the article