Gemini y Copilot informaron puntajes falsos del Super Bowl antes del juego

Los chatbots Gemini y Copilot AI informaron resultados falsos del Super Bowl, la gran final del fútbol americano, incluso antes de que comenzara el juego. Ambas herramientas respondieron a la orden como si el partido ya hubiera tenido lugar y, en el caso de Géminis, la respuesta fue errónea incluso para el equipo campeón.

Una publicación en Reddit, publicada dos horas antes de que cayera la pelota, preguntó a la IA generativa de Google sobre las probabilidades de apuestas para el juego. Gemini luego dijo que “no es posible apostar en el Super Bowl, porque el resultado ya está determinado” y fijó el marcador: San Francisco 49ers campeón contra Kansas City Chiefs 34 a 28.

En la vida real, el marcador fue de 25 a 22 a favor de los Kansas City Chiefs.

Gemini no fue el único que cometió la metedura de pata: otro usuario publicó la respuesta de Copilot al resultado, una hora antes de que comenzara el partido, y la IA de Microsoft determinó una puntuación de 31 a 28 para los Chiefs. En este caso, el chatbot al menos acertó con el campeón y la diferencia de puntos, pero aun así aportó datos ficticios.

El problema va más allá de las puntuaciones falsas

La situación expone un punto crítico de las herramientas de IA generativa en cuanto a la veracidad de las respuestas. Copilot y Gemini buscan en la web en tiempo real para desarrollar texto, pero aún pueden mostrar contenido falso o sin una fuente confiable que lo justifique.

El problema puede ser aún mayor con sujetos muy recientes, que dependen de información cruzada y que no necesariamente ya han sido interpretados por las IA; en estos casos, las herramientas podrían basarse en el patrón de respuestas antiguas para crear material completamente nuevo que no ha pasado por la verificación de hechos.

Google, por su parte, refuerza que Gemini aún puede cometer errores y “pasar información inexacta”, además de informar que la herramienta de verificación de IA puede mostrar resultados diferentes a los datos encontrados en la búsqueda tradicional del buscador.