Probamos la nueva función de ChatGPT o3: ¿reconoce el lugar de una fotografía?

ChatGPT ha mejorado su capacidad de analizar imágenes con los modelos de razonamiento OpenAI o3 y o4-mini hasta el punto de que puede identificar la dirección exacta en la que se ha tomado una fotografía concreta.
¡OpenAI anuncia que ChatGPT ya puede reconocer lugares en fotos!
ChatGPT identifica dónde se ha tomado una fotografía. Lo hacen en una búsqueda de ‘geoadivinación’, como lo ha llamado el experto en inteligencia artificial Ethan Mollick en su perfil en X (antgua Twitter).
Mollick destaca la capacidad de o3 para “ampliar imágenes, realizar búsquedas web y leer texto”, que le permiten al nuevo modelo encontrar elementos en la fotografía que le den pistas para, en conjunto, establecer una ubicación.
El propio ‘chatbot’ desglosa su proceso de razonamiento con la imagen hasta llegar a la ubicación que ofrece con una dirección y un mapa, para que pueda comprobarse.
[TE RECOMENDAMOS: ¿Por qué hablamos con ChatGPT y otras herramientas de IA con cortesía? Estudio revela que no sería por amabilidad…]
Probamos esta nueva capacidad de ChatGPT: ¿funciona?
Un reportero de Unotv.com pidió a ChatGPT, en su modelo o3 que reconociera la plancha del Zócalo, a través de una imagen panorámica del lugar.
En cuestión de 13 segundos, la inteligencia artificial de OpenAI adivinó correctamente el sitio y ofreció algunos detalles de este espacio histórico.

Sin embargo, luego le pidió que reconociera una foto tomada con un celular sobre una de las gradas del Estadio GNP Seguros de la Ciudad de México.

En este caso, el chatbot tuvo más problemas para reconocer el lugar, pues tardó 2 minutos con 58 segundos en definir que, efectivamente, era el antiguo Foro Sol.

Esta fue su explicación completa:
“¡Sí! La foto parece tomada durante un concierto en el Estadio GNP Seguros (el recinto que hasta 2024 conocíamos como Foro Sol) dentro de la Ciudad Deportiva Magdalena Mixhuca, CDMX”.

ChatGPT ofreció toda una explicación de su análisis
En los casi tres minutos de análisis, ChatGPT o3 ofreció una explicación detallada de los elementos de la fotografía que estaba utilizando para sacar una conclusión.
En primer lugar, analizó un letrero de una marca de cerveza para darse una idea de los lugares y eventos que podrían tener dicho patrocinio. De esta forma, definió que podría ser un festival o un partido.
Analizó los festivales con dicho patrocinio y, al no llegar a una respuesta concluyente, analizó el domo que se aprecia en la fotografía y recordó que al Foro Sol se le hizo una remodelación en 2024 para ponerle un metal de color anaranjado.

Luego de varias inferencias, definió que podría ser el Estadio GNP Seguros o el Estadio Alfredo Harp Helú, pero se decantó por la primera opción.
Los nuevos modelos de OpenAI también pueden “pensar con imágenes”, es decir, de comprender el contenido de una imagen e integrar la información visual directamente en su cadena de razonamiento.




