La voce di Watson

Gli esseri artificiali sono da sempre stati dotati di coscienza e di un corpo, infatti cercando di dare una risposta a che cos’è la coscienza, emergono come leitmotiv della storia umana i numerosi tentativi di riprodurre la vita attraverso strumenti artificiali. Tutto ebbe inizio con Pigmalione, l’eroe di Ovidio che, innamoratosi della statua di una ideale figura femminile da lui scolpita (Galatea), ottenne dalla dea Venere che questa prendesse vita…
Il regista Stanley Kubrick (1928-1999) fu probabilmente il primo a proporre un essere artificiale, privo di corpo ma dotato di coscienza in 2001: Odissea nello spazio (1968).
Nel 1967 Kubrick stava ancora cercando una voce maschile per il suo Hal 9000. Era molto scontento dei provini di attori del calibro di Nigel Davenport (1928-2013) e Martin Balsam (1919-1996).

Kubrick non capiva in che modo HAL avrebbe dovuto esprimersi: con quale voce? Con quale accento? Negli anni Kubrick ha più volte spiegato quanto fosse difficile trovare un buon interprete per la voce di HAL:

Abbiamo avuto un po’ di difficoltà a decidere esattamente come dovesse essere HAL e Marty  sembrava un po’ troppo colloquiale e americano, ma Rain aveva il tipo di semplice accento del centro della sponda atlantica che abbiamo ritenuto fosse giusto per la parte

Alla fine venne scelta la voce dell’attore canadese Dougal Rain (1928-2018) per il suo accento. Le sue battute vennero registrate tutte in 10 ore suddivise in due giorni con Kubrick seduto vicino che gli spiegava le scene e gli leggeva le parti.
Nel 2009 il team di linguisti, ingegneri e gli esperti di marketing della Ogilvy, come Kubrick, si trovavano in difficoltà su quale voce avrebbe avuto Watson, sapendo però di doversi discostare da quella di HAL.
Il team IBM-Ogilvy si aspettava che le persone avrebbero associato la voce di Watson con quella di HAL, ma speravano anche di comunicare al grande pubblico che un giorno avremmo interagito con i computer con il linguaggio naturale.

Speech synthesis

Dal momento che non è possibile registrare ogni possibile parola o frase di una persona,
tanto più in un gioco come Jeopardy! in cui le domande toccano qualsiasi argomento,
si decise di utilizzare un motore di sintesi vocale (TTS, text to speech) che fosse in grado di dare la voce a Watson.

Jeopardy!, come afferma il sound designer Andy Aaron , è stato un problema di sintesi vocale molto impegnativo perché, sebbene le risposte siano brevi, vi erano un gran numero di possibili errori di pronuncia. E le risposte di Watson dovevano essere accurate, in quanto gli errori di pronuncia potevano invalidare la risposta.
Molti membri del team, fra cui Raul Fernandez, hanno trascorso più di un anno a creare un database di pronunce corrette, utilizzando l’alfabeto fonetico internazionale (IPA), per ridurre gli errori il più vicino possibile allo zero.

I ricercatori hanno intervistato 25 doppiatori, alla ricerca dei fonemi per costruire la voce di Watson. Ad un certo punto, come ci racconta il giornalista Stephen Baker,  si pensò di utilizzare una voce che ricordava quella di un bambino, ma l’idea venne respinta. In particolare Michael Picheny, ricercatore in IBM per 35 anni nel campo Speech Recognition, sostenne  che “non volevamo che la voce suonasse iper-entusiasta”.
Al di là della pronuncia corretta, c’era la sfida di quello che i linguisti chiamano prosodia, la capacità di aggiungere stress, intonazione o emozioni alla lingua parlata.
Alla fine il team di marketing Ogilvy e i dirigenti IBM decisero che Watson avrebbe risposto alle domande con una voce maschile amichevole e con un tono uniforme che non sarebbe cambiato con il flusso del gioco diversamente dall’avatar. La voce non doveva esprimere frustrazione, tanto meno rimpianto nelle risposte sbagliate date.

Sitografia

[1] How did supercomputer Watson beat Jeopardy champion Ken Jennings? Experts discuss
[2] ,The inside story of how the Jeopardy-winning supercomputer was born, and what it wants to do next,
[3] ,Computer Wins on ‘Jeopardy!’: Trivial, It’s Not,
[4] Why Watson Wagered $947, and Other Intel on the Jeopardy Supercomputer
[5] Joshua Davis Creates the Face of Watson, IBM’s Jeopardy Supercomputer
[6] Ken Jennings vs. Watson ‘Jeopardy’ Liveblog
[7] Mind vs. Machine
[8] Q&A: ‘Final Jeopardy’ author Stephen Baker on Watson, IBM, the future of e-books and the fate of humanity
[9] The Final Night Of IBM’s Jeopardy Challenge: How Did Watson Do?
[10] How Watson “sees,” “hears,” and “speaks” to play Jeopardy!
[11] The buzzer factor: did Watson have an unfair advantage?
[12] How I Beat IBM’s Watson at Jeopardy (3 Times!)
[13] My Puny Human Brain
[14] Building the Team That Built Watson

Bibliografia

Videografia

[1] Supercomputer: Watson(IBM computing system) – Documentary
[2] The Face of Watson
[3] The Man Who Taught IBM Watson To Speak