DQN, la IA que presume vencer algunos videojuegos

Vida y estilo Calendario 01 dic 2021 Iván González

En el año 2017 el CEO de Tesla y SpaceX, Elon Musk, comentó en una conferencia ante los gobernadores de Estados Unidos que “la inteligencia artificial (IA) es el principal riesgo que corre nuestra civilización”, añadiendo que “la gente debería estar muy preocupada, ya que, si comenzamos a reaccionar hasta que veamos a robots corriendo por las calles matando humanos, será demasiado tarde. 

Pero no todos piensan como Musk, Mark Zuckerberg, creador de Facebook, y estandarte de momentos de la generación Millennial, fue cuestionado poco después por un usuario, durante una sesión de preguntas y respuestas en su cuenta de Facebook, quien dijo:

“Recientemente observé una entrevista de Elon Musk y su mayor temor fue por el futuro de la IA. ¿Qué piensas de la IA y cómo podría afectar al mundo?”. Quizá el usuario amarraba navajas, pero Zuckerberg indicó que las declaraciones de Musk son irresponsables.

De acuerdo con Zuckerberg, quienes están en contra de la IA no entienden o se niegan a entender los beneficios que pueden aportar al mundo. Zuckerberg (como muchos) creen que la IA puede salvar vidas y prevenir accidentes. 

Es un hecho que la IA ocupará en nuestro probablemente muy cercano futuro, pero, ¿realmente estamos conscientes de lo que eso significa para nosotros? Los avances tecnológicos siempre traen consigo nuevos dilemas morales, sus creadores deben medir el daño que pueden causarle a la humanidad y no perder de vista el más mínimo detalle para determinar si vale la pena lanzar sus proyectos y descubrimientos al público en general. Quizá el mayor miedo por parte de Elon Musk sea que vivamos un futuro parecido a la cinta Terminator en donde Skynet encabeza al ejército de las máquinas en la saga de estas películas. 

Por otra parte, la Inteligencia Artificial ha llegado a muchos sectores y destaca en los videojuegos. En los últimos años esta herramienta ha servido de gran ayuda para crear títulos sorprendentes y complejos en cuanto al nivel de dificultad, pero, ¿crear un sistema para vencer a todos los jugadores del mundo y todos los juegos posibles de la empresa Atari? 

Hablamos de DQN, la abreviatura para Deep Q Networks, creado por una de las subsidiarias de Google, DeepMind, que ha sido capaz de ganar a una decena de expertos en 49 juegos distintos de Atari. La compañía, especializada en IA fue creada en 2011 por Demis Hassabis, Shane Legg y Mustafa Suleyman. Comprada el año pasado por Google, ha presentado a este algoritmo/IA que es capaz de aprender a jugar con tan solo observar los videojuegos. 

"Es la primera vez que alguien ha construido un sistema único de aprendizaje que puede aprender directamente de la experiencia y gestionar una amplia gama de tareas difíciles" - Demis Hassabis, co-fundador de DeepMind y VP de Google. 

Eso sí, hay que decir que este algoritmo no entiende las reglas del juego, sino que utiliza una capacidad de red neuronal para analizar las acciones que reportan mayor puntuación y realizarlas sistemáticamente. 

Como todo en la vida DQN no es perfecto. Resulta que el único juego en donde DQN no resultaba vencedora era en un juego llamado La venganza de Moctezuma (y no nos referimos a la expresión popular).  

Este sistema ya había resultado campeón en otros juegos de Atari como pinball, Tetris y más, en los cuales tenía resultados hasta 25 veces más altos que los jugadores humanos, entonces, ¿qué tenía La venganza de Moctezuma que lo hacía tan difícil para esta máquina? Incluso de jugar durante semanas, la Inteligencia Artificial no lograba anotar ni un punto. 

Lo más extraño de esta experiencia es que la respuesta para la investigación en torno a DQN estaba en donde menos se esperaba: en los bebés. Todo tiene que ver con el proceso de aprendizaje que sistemas de Inteligencia Artificial como DQN utilizan en este tipo de juegos. Por ejemplo, en videojuegos como pinball, DQN realizó múltiples intentos de prueba y error, a través de los cuales fue descartando las posibilidades de movimiento que le hacían perder puntos.  

Algo así como “si me muevo a la izquierda gano puntos, pero si me muevo a la derecha, no”. Luego, conforme avanzan los intentos y la IA memoriza sus posibilidades, comienza a encontrar las mejores fórmulas para triunfar. En juegos como La venganza de Moctezuma, por su parte, un simple error en la prueba causa que el personaje muera, por lo que no hay oportunidad de aprender las claves con base en la repetición y absorción de información, que es la clave de la Inteligencia Artificial.  

Fue ahí cuando los investigadores de Deepmind recordaron que los bebés suelen mirar por más tiempo las fotografías de imágenes que no conocen o no han visto antes que las que ya conocen, demostrando que hay algo en la simple sensación de novedad que emociona a los bebés. 

Ellos aprovecharon esto y agregaron a DQN la capacidad de emocionarse y sentir atracción por la novedad, así que cada vez que aparecía algo nuevo en la pantalla, esto llamaba su atención y lo hacía adquirir las recompensas, como las monedas y otros premios de este tipo de juegos, permitiéndole convertirse en jugador estrella también de este tipo de juegos. 

De momento en Google creen que esta IA está todavía muy lejos de poder ser verdaderamente independiente, puesto que el dominio y la estructura de los juegos está cerrada y es un entorno controlado y conceptual, pero que otro tipo de entornos no sabrían cómo la inteligencia artificial podría considerar las múltiples variables. 

Otras compañías que avanzan en el campo de la creación de una inteligencia artificial que pueda sustituir al humano son IBM con su TrueNorth, un chip que emula el cerebro humano y el de la Cornell University quienes han dado vida a Robo Brain, una inteligencia artificial que aprende de Internet. 

Foto: pixabay 

  El mundo de los videojuegos en un sólo lugar, da click AQUÍ

 

En circuloplussanborns.com/, utilizamos cookies para proporcionar y mejorar nuestros servicios.

Esto nos ayuda a ofrecerte la mejor experiencia posible. Al utilizar nuestro sitio, usted acepta usarlos. Aprenda más

Círculo Plus Sanborns