Una màquina supera els humans en un joc de curses de cotxes

La Sophy, desenvolupada per científics de Sony, va guanyar els millors jugadors del món de Gran Turismo, un simulador de curses de Fórmula 1.
01/04/2022
4 min

Hi ha dos camps que la intel·ligència artificial usa recurrentment per demostrar els seus últims avenços. Un és el dels jocs: començant amb els escacs i altres de tradicionals i continuant amb els d’ordinador, que cada vegada requereixen més habilitat, tal com passa amb els d’estratègia. En aquest àmbit, ja hi ha diversos programes que han demostrat que poden superar els humans. L’altre camp és el dels vehicles autònoms, que ja han passat de la teoria a la realitat i cada vegada són més a prop de començar a omplir ciutats de tot el món. Un estudi publicat recentment a la revista Nature ajunta ambdues coses i presenta una xarxa neuronal capaç, per primera vegada, de vèncer els humans en un joc que simula de manera molt realista una cursa de Fórmula 1.

Una trajectòria brillant

El 10 de febrer del 1996 és una data gravada amb lletres d’or als annals de la intel·ligència artificial. Va ser el dia que l’ordinador d’IBM anomenat Deep Blue va guanyar Garri Kaspàrov, el campió mundial d’escacs. Molts veien impossible que un software fos capaç de superar una persona en un joc que requereix un nivell important de raonament. Però allò només va ser el principi. En els darrers vint-i-cinc anys s’han fet passos de gegant en aquest camp, des d’un programa capaç de vèncer en una sèrie de jocs de destresa pels quals no havia estat entrenat (DeepMind jugant als arcades clàssics d’Atari, el 2013) fins a un altre que va derrotar el millor jugador de go, un joc en el qual, a diferència dels escacs, hi ha massa opcions per avaluar a cada pas i, per tant, depèn més de la intuïció i l’experiència (AlphaGo, el 2016). Això va obrir una nova era en el combat intel·lectual entre humans i màquines.

El 2019, els programes d’intel·ligència artificial havien millorat tant que ja eren capaços d’enfrontar-se a múltiples jugadors a l’StarCraft, un conegut joc d’estratègia en temps real, i acabar guanyant-los tots després d’aprendre partida a partida. Això demostrava que els ordinadors no tan sols poden processar dades a més velocitat que nosaltres, sinó que poden copiar els nostres processos de raonament per dissenyar estratègies quan no hi ha prou dades que permetin treure conclusions. Malgrat això, quedaven moltes àrees que encara no es poden imitar amb xips. Una d’elles era la conducció de cotxes de Fórmula 1, que depèn de molts factors que van més enllà de la qualitat de la màquina que es condueix. Les habilitats dels pilots, que inclouen reflexos, intuïció i capacitat d’arriscar-se, a part de conèixer bé les reaccions específiques del vehicle, semblaven difícils de reproduir, sobretot per la necessitat de prendre decisions ràpides mentre s’interacciona amb altres persones en situacions extremes.

Sophy al volant

Un grup de científics de Sony acaben de publicar un article on expliquen que van entrenar una xarxa neuronal (uns circuits artificials que imiten com interaccionen les neurones al cervell) perquè jugués al Gran Turismo, una simulació molt realista de curses de Fórmula 1. Els investigadors van dissenyar algoritmes específics i la van fer jugar una sèrie de partides. A més, la van programar perquè “jugués net”, és a dir, perquè tingués un cert sentit de l’ètica del joc, i la van convertir en una experta de les lleis físiques que determinen la interacció simulada entre el cotxe i la pista. Després d’entrenar aquesta xarxa neuronal i de batejar-la amb el nom de Gran Turismo Sophy, els investigadors la van fer competir contra quatre dels principals jugadors a escala mundial, cosa que no havia fet abans cap programa (sí que s’havia aconseguit, per exemple, fer temps rècord en una volta ràpida si no hi havia altres cotxes).

Durant les curses, la Sophy no es limitava a aprofitar els coneixements avançats de física per triar la millor manera d’entrar en un revolt, sinó que trobava immediatament alternatives adequades quan els altres conductors li bloquejaven el camí que hauria preferit. Es van adonar que fins i tot havia après ràpidament trucs propis de conductors experts sense que ningú els hi hagués ensenyat, cosa que cap intel·ligència artificial havia fet mai abans. Al final, la Sophy va aconseguir guanyar tots els jugadors.

Naturalment, el Gran Turismo és només una simulació, no un cotxe real, però tot i això aquests resultats fan pensar als autors que xarxes neuronals d’aquesta mena es podrien implementar en vehicles autònoms, que fins ara han depès més de programes predictius clàssics (és precomputen una sèrie de trajectòries possibles i s’usen models per triar la millor) i menys de les capacitats de raonament pròpies de les xarxes neuronals. La cosa més important és que algoritmes com els de la Sophy permeten que la xarxa neuronal aprengui i sigui cada vegada millor: els resultats presentats a l’article són només de la primera temporada que ha jugat al Gran Turismo. Per tant, s’espera que, si continua per aquest camí, anirà trobant millors trucs i estratègies.

Abans de provar-ho en un circuit de Fórmula 1, on hi ha moltes més variables que les que es poden considerar en un joc d’ordinador, les xarxes neuronals com la Sophy podrien jugar un paper important en situacions quotidianes menys complexes, com la conducció de camions de repartiment o, fins i tot, de taxis.

Salvador Macip és investigador de la Universitat de Leicester i la UOC

stats