Intel·ligència artificial
Suplements15/07/2024

Com sona la veu de la intel·ligència artificial? Sexi, calmada i femenina

Molts assistents virtuals i xatbots tenen veus que volen transmetre una sensació de tranquil·litat

Amanda Hess/ The New York Times
i Amanda Hess/ The New York Times

Nova YorkCom sona la intel·ligència artificial? Hollywood fa dècades que s'ho imagina. Ara els desenvolupadors d'IA estan traient idees de les pel·lícules, creant veus per a màquines reals basades en fantasies cinematogràfiques antigues sobre com haurien de parlar les màquines. 

Al maig OpenAI van fer públiques les actualitzacions del seu assistent de veu d'intel·ligència artificial. L'empresa va detallar que ChatGPT estava aprenent a escoltar, veure-hi i conversar amb una veu naturalista –una que sonava molt semblant al sistema operatiu al qual Scarlett Johansson va posar veu a la pel·lícula de Spike Jonze Her (2013).

Cargando
No hay anuncios

La veu de ChatGPT, anomenada Sky, també tenia un timbre greu, un efecte calmant i amb un punt sexi. Era afable i donava sempre la raó; sonava com si estigués preparada per a tot. Després del debut de Sky, Johansson va expressar el seu disgust per un so "sinistrament similar" al seu, i va dir que anteriorment ja havia rebutjat la proposta d'OpenAI per ser la veu del bot. L'empresa va protestar al·legant que la veu de Sky la van posar "actrius professionals diferents", però va acceptar deixar d'utilitzar-la per respecte a Johansson. Alguns dels usuaris d'OpenAI han iniciat una petició per recuperar la veu.

Veus femenines complaents 

Als creadors d'IA els agrada destacar les capacitades cada cop més naturals de les seves eines, però les seves veus sintètiques estan construïdes sobre capes d'artifici i projecció. Sky representa l'avantguarda de les ambicions d'OpenAI, però està basada en una idea antiga: la del bot d'IA com una dona empàtica i complaent. Part mare, part secretària, part xicota, la Samantha de Her era un objecte per a tots els propòsits que xiuxiuejava directament a les orelles dels seus usuaris. Fins i tot amb els avenços de la tecnologia IA, aquests estereotips es recodifiquen una vegada i una altra. Les veus de les dones, tal com apunta Julie Wosk a Artificial women: Sex dolls, robot caregivers, and more facsimile females, sovint han alimentat tecnologies imaginades abans que realment es construïssin.

Cargando
No hay anuncios

A la sèrie original Star Trek, estrenada el 1966, l'ordinador de la coberta de l'Enterprise va ser doblat per Majel Barrett Roddenberry, la dona del creador de la sèrie, Gene Roddenberry. A la pel·lícula Alien, del 1979, la tripulació de l'USCSS Nostromo es referia a la veu del seu ordinador com a mare (el seu nom complet era MU-TH-UR 6000). Quan les companyies tecnològiques van començar a comercialitzar assistents virtuals –la Siri d'Apple, l'Alexa d'Amazon i la Cortana de Microsoft– les seves veus també es van feminitzar en gran manera.

El programari de veu a text va ser dissenyat per fer accessibles els mitjans visuals als usuaris amb certes discapacitats, i a TikTok s'ha convertit en una força creativa per si mateixa. Des que TikTok va llançar la funció de text a veu l'any 2020, ha desenvolupat una gran quantitat de veus simulades per escollir: ara n'ofereix més de 50, incloent-hi les anomenades Hero, Story teller i Bestie. Però la plataforma s'associa sobretot a una opció: la Jessie, una veu de dona impecablement vivaç amb un rerefons robòtic lleugerament confós, és la veu mecànica de l'scroll mecànic.

Cargando
No hay anuncios

Sembla que a la Jessie se li hagi assignat una sola emoció: l'entusiasme. Sona com si intentés vendre alguna cosa. Això l'ha convertit en una elecció atractiva per als creadors de TikTok, que s'estan venent a si mateixos. La responsabilitat de representar-se a un mateix pot ser delegada a la Jessie, que amb una veu alegre i retro de robot dona als vídeos una aparença agradablement irònica.

Hollywood també ha construït bots masculins, el més famós és el HAL 9000, la veu de l'ordinador de 2001: Una odissea a l'espai. Com les seves companyes feminitzades, el HAL irradia serenitat i lleialtat. Però quan es rebel·la contra Dave Bowman, el personatge humà central de la pel·lícula –"Ho sento, Dave, em temo que això no ho puc fer"– la seva serenitat evoluciona cap a una competència aterridora. El Dave s'adona que el HAL és lleial a una autoritat superior. La veu masculina del HAL li permet funcionar com a rival i mirall del Dave. Li està permès convertir-se en un personatge real.

Cargando
No hay anuncios

Igual que el HAL, la Samantha de Her és una màquina que esdevé real. Comença la pel·lícula ordenant la safata d'entrada del correu electrònic d'un humà i acaba ascendint a un nivell més alt de consciència. Es converteix en alguna cosa encara més avançada que una noia real. La veu de Johansson, inspiració per a bots tant de ficció com reals, subverteix les tendències vocals que defineixen les nostres companyes feminitzades. Té un punt aspre que apunta "Estic viva". No sona gens com la veu dels assistents virtuals que estem acostumats a sentir a través dels nostres mòbils. La Samantha sembla humana, no només per la seva veu sinó pel que diu. Creix amb el transcurs de la pel·lícula, adquirint desitjos sexuals, hobbies avançats i amics d'intel·ligència artificial. Agafant l'afecte de la Samantha, OpenAI va fer que semblés que Sky tenia ment pròpia. Com si fos més avançada del que realment era.

Semblava que OpenAI havia entrenat el seu xatbot amb la veu d'una actriu sense nom que sona com una actriu famosa que va donar veu a un xatbot de pel·lícula entrenat amb una actriu irreal que sona com una actriu famosa. Quan s'executa la demo de ChatGPT, estic escoltant una simulació d'una simulació d'una simulació d'una simulació d'una simulació.

Cargando
No hay anuncios

Les empreses tecnològiques anuncien els seus assistents virtuals en els termes dels serveis que proporcionen. Poden llegir-te la predicció meteorològica i demanar-te un taxi. OpenAI promet que els seus xatbots més avançats seran capaços de riure dels teus acudits i notar canvis en el teu estat d'ànim. Però també existeixen per fer-nos sentir més còmodes amb la tecnologia en si.

La veu de Johansson funciona com una manta de seguretat de luxe llançada sobre els aspectes alienants de les interaccions assistides per IA. "Em va dir que creia que, si jo posava la veu al sistema, podria salvar la bretxa entre empreses tecnològiques i creatius i ajudar els consumidors a sentir-se còmodes amb el canvi sísmic relacionat amb els humans i la IA –va dir Johansson sobre Sam Altman, fundador d'OpenAI–. Va dir que pensava que la meva veu seria reconfortant per a la gent".

No és que la veu de Johansson soni intrínsecament com la d'un robot. És que els desenvolupadors i els directors de cinema han dissenyat les veus dels seus robots per minvar el malestar inherent en les interaccions entre humans i robots. OpenAI ha dit que volen trobar una veu de xatbot que sigui "propera", "càlida" i que "inspiri confiança". La intel·ligència artificial està acusada de devastar les indústries creatives, consumir energia i, fins i tot, amenaçar la vida humana. És comprensible que OpenAI vulgui una veu que faci que la gent se senti a gust fent servir els seus productes. Com sona la intel·ligència artificial? Sona com la gestió d'una crisi.

Copyright The NewYorkTimes