Claude 3.7 Pokémon: inteligencia artificial desafía Twitch en vivo

Anthropic ha puesto en marcha un experimento que combina inteligencia artificial y videojuegos clásicos a través de Twitch. El pasado martes por la tarde, la empresa lanzó el stream «Claude Plays Pokémon«, en el que su modelo Claude 3.7 Sonnet juega a Pokémon Rojo, una entrega emblemática de 1996 que sigue siendo utilizada como banco de pruebas para evaluar capacidades de razonamiento y toma de decisiones en inteligencia artificial.

A diferencia de otros retos más simples utilizados en el desarrollo de IA, Pokémon Rojo exige un conjunto variado de habilidades, como resolver puzles, evaluar riesgos y planificar movimientos en tiempo real. Claude 3.7 Sonnet ha logrado superar obstáculos que su predecesor Claude 3.5 Sonnet no pudo, como avanzar por Pallet Town al inicio, y ha obtenido tres medallas de líder de gimnasio, evidenciando una mejora en su capacidad de razonamiento paso a paso.

El stream presenta en una pantalla el pensamiento lógico del modelo y, en paralelo, la partida del juego en tiempo real, lo que ha atraído alrededor de mil espectadores activos en el chat de Twitch. Durante la transmisión, se han registrado situaciones en las que la IA se encontró con problemas clásicos del juego, como intentar atravesar una pared rocosa o confundir a personajes no jugables al buscar al Profesor Oak, que solucionó eventualmente con estrategias de rodeo.

Este ejercicio público parte de una tendencia creciente entre empresas tecnológicas, que utilizan títulos antiguos y conocidos como Pokémon para testar avances en inteligencia artificial general en condiciones que van más allá de operaciones simples de cálculo. El formato del stream recuerda al fenómeno social «Twitch Plays Pokémon» de 2014, donde miles de usuarios controlaban de forma colectiva el juego, aunque en este caso el protagonismo recae en una IA individual.

Claude 3.7 Sonnet opera conectado a un emulador que envía comandos básicos de movimiento y acción, habiendo completado hasta 35.000 acciones en rondas de prueba anteriores, con pausas para corregir errores. David Hershey, responsable de IA aplicada en Anthropic y creador del stream, busca mediante este método no solo demostrar avances técnicos, sino generar interacción y transparencia sobre las capacidades y limitaciones actuales de la inteligencia artificial.

- Publicidad -

Mientras tanto, no existe confirmación de que otras grandes empresas como Google u OpenAI estén desarrollando streams similares con Pokémon en Twitch, aunque sí se realizan comparativas de modelos en otros ámbitos. La experiencia con Claude 3.7 Sonnet evidencia que, aun cuando los sistemas han avanzado, persisten retos en la navegación y velocidad de toma de decisiones que son esenciales para una IA con razonamiento completo.

Queda por ver cómo estos experimentos públicos influirán en la evolución de la inteligencia artificial y en la percepción del público sobre sus potenciales aplicaciones futuras.

Secciones

Popular esta semana

Xbox Game Pass amplía su catálogo con 12 nuevos juegos y destaca la apuesta por experiencias variadas

Death Stranding 2 prepara su llegada a PC con una actualización centrada en el desafío y la inmersión audiovisual

PlayStation Portal incorpora modo 1080p de alta calidad y otros cambios para fortalecer su propuesta de juego remoto

Crimson Desert divide a la crítica: un debut tan ambicioso como irregular

Crimson Desert: un gigante ambicioso que apunta al cielo… pero aún pisa en falso

Anthropic desafía la inteligencia artificial con Claude 3.7 jugando Pokémon rojo en Twitch y revela avances y retos en razonamiento paso a paso

Deja una respuesta Cancelar la respuesta

Lo + leído

Guía completa de Resident Evil Requiem: todo lo que debes saber antes de empezar

RTX 3060: NVIDIA reactiva producción y prevé envíos entre el 10 y el 20 de marzo para paliar la escasez de memoria

Xbox inicia una nueva era con Asha Sharma al frente tras la salida de Phil Spencer

Activision presionó a Infinity Ward para desarrollar una campaña en Call of Duty sobre una hipotética invasión de Israel por parte de Irán

Netflix abandona la compra de Warner Bros y HBO por inviabilidad económica; Paramount se hace con el estudio

Te puede interesar...

Marathon presenta su sistema de facciones, clave para la estrategia, narrativa y progresión con un reinicio estacional

Pokémon Pokopia supera los 2,2 millones de copias y demuestra la fortaleza de la saga en Switch 2

«Super Mario Galaxy: La película» muestra su tráiler final antes del estreno en cines

Ubuntu 26.04 LTS mejora la experiencia con sudo mostrando asteriscos al introducir la contraseña

Crimson Desert desvela sus requisitos de PC: exigirá un SSD, 16 GB de RAM y 135 GB de almacenamiento

Forza Horizon 6 muestra su primer gameplay… y las reacciones no están siendo precisamente entusiastas

Nvidia alcanza ingresos récord históricos por la IA mientras el gaming representa ya solo el 11% de su facturación

Starfield da el salto a PS5: un insider filtra su llegada el 7 de abril por 50 euros

Síguenos en redes sociales

¡Tu cuenta ha sido activada correctamente!