Kinect: l’occhio della macchina

Nell’estate del 1956, presso il Dartmouth College di Hannover, si tenne la prima conferenza sull’intelligenza artificiale (AI) e la prima generazione di ricercatori riteneva fattibile l’utilizzo del computer per risolvere problemi legati al linguaggio naturale o alla visione umana come ad esempio la produzione e la comprensione del linguaggio (NLP/NLU) o il riconoscimento di oggetti (Computer Vision).

L’occhio della macchina

Nel 1966 Marvin Minsky propose ad una decina dei suoi studenti di trascorrere l’estate a programmare un computer che fosse in grado di utilizzare una videocamera per descrivere gli oggetti della scena. Dal “Summer Vision Project” di Minsky ad oggi i ricercatori hanno riflettuto a lungo su quali sensori dovrebbero avere i robot (cams, laser, sonar) e di come elaborare l’enorme quantità di dati raccolti durante la localizzazione e mappatura simultanea (SLAM) di ambienti sconosciuti.
Nel 2008 i progressi in questo campo erano davvero lenti tanto che in un’analisi dell’argomento, la SLAM veniva definita una “delle sfide fondamentali della robotica […] [ma] sembra che quasi tutte le strategie attuali non possano eseguire una mappatura coerente delle grandi superfici, in particolare a causa dell’aumento del costo del calcolo e delle incertezze che diventano proibitive quando lo scenario si allarga”.
Percepire un’area ed elaborarne simultaneamente tutti i dati risultanti è sempre stato un problema spinoso, almeno fino a quando non è arrivato un device da 149,99 dollari.

Project Natal: Kinect

Il 12 maggio 2015 Microsoft mostrava ufficialmente XBox 360 su MTV e sei mesi dopo l’avrebbe lanciata sul mercato, ma allo stesso tempo stava facendo un lavoro di incubazione per il futuro di Xbox, cercando di capire come potrebbero essere i prossimi anni e guardando cosa avevano in cantiere gli altri produttori di tecnologia.
Nel 2006 PrimeSense, startup fondata a Tel Aviv (Israele) nel 2005 da 5 amici tutti ingegneri, presentò al Game Developers Conference (GDC) un sistema di controllo per i videogames che incorporava telecamere in grado di mappare il corpo umano e di rilevare i movimenti della mano. All’evento partecipò anche Alex Kipman, ingegnere di Microsoft responsabile dell’incubazione hardware, che ne comprese subito il potenziale per la console Xbox 360.
Due anni dopo, mentre un team di Microsoft sperimentava su quello che potrebbe essere l’equivalente del controller Wii per Xbox, Kudo Tsunoda, Darren Bennett si unirono ad un secondo team con Kipman per lavorare al proprio progetto di tracciamento dello scheletro dell’utente utilizzando un approccio ibrido fra il rilevamento della profondità, machine learning e la tecnologia di PrimeSense.
Il nuovo team realizzò una demo che convinse Microsoft ad abbandonare il progetto di un controller Wii, e durante le festività natalizie del 2008 il team che lavora al controller venne assorbito dal team di Kipman e il lavoro iniziò ufficialmente all’inizio del 2009.

Nasce così Kinect, all’epoca con il nome in codice Natal, dal nome della città brasiliana da cui proveniva Kipman e finalmente il 1 giugno 2009, durante la conferenza E3, Microsoft annunciò Project Natal per la console Xbox 360, poi rivelandone il vero nome solo a giugno del 2010.

“You Are the Controller” con questo slogan, Microsoft lanciò il Kinect con l’obbiettivo di immergere il giocatore nei giochi, rimuovendo il controller e sostituirlo con il corpo umano, consentendo alle persone di diventare, in sostanza, i propri controller. Al contrario della Wii di Nintendo che doveva rilevare solo i dati provenienti dai due controllers, il Kinect era in grado di monitorare fino a 20 joints (articolazioni) per giocatore e se un giocatore si spostava, coprendone un altro, il Kinect era in grado di ipotizzarne i movimenti. Per raggiungere questo risultato, Microsoft ha analizzato il modo di muoversi, di comportarsi e di vestirsi di persone di età diverse , con diverso aspetto fisico e sesso.
Partendo da questi dati, si è fatto il training di un modello di machine learning dei movimenti che compie lo scheletro e a far sì che il Kinect fosse in grado di riconoscerli e analizzarli a 30 fps.

Microsoft scelse un prezzo di lancio per il Kinect di soli 149,99 dollari in modo che i consumatori fossero ben disposti ad acquistarlo, nonostante avesse bisogno del Xbox 360 per funzionare. Per aumentare l’entusiamo per il nuovo device, nel 2010 Microsoft organizzò un tour nei centri commerciali degli Stati Uniti, allestendo grandi stand dove le persone potessero giocarci e testarlo.
Il Kinect venne messo in vendita il 18 novembre 2010 in America, il 30 novembre in Europa e l’8 dicembre in Giappone.

Tutti pazzi per il Kinect!

L’uscita di Kinect suscitò un grande interesse non solo tra i gamers, ma anche tra i developers e nella comunità scientifica: in particolare nel campo della robotica, della realtà virtuale (VR), della realtà aumentata (AR),  speech recognition, body motion tracking, pose estimation, hand tracking e gestures.
Siggraph è uno dei convegni più popolari incentrati sulla Computer Graphics (CG) e durante l’edizione di agosto del 2011 a Vancouver, un team Microsoft e di ricercatori usò il Kinect per fare  “slam”. In un video dimostrativo, una persona afferrava un Kinect e lo puntava all’interno di un ufficio arredato con sedie, pianta in vaso, scrivania con computer e monitor.

Dal video vediamo che in tempo reale il Kinect traccia una mappa tridimensionale della stanza e di tutti gli oggetti che contiene, compreso un impiegato. Come riportato dal blog Endgadget, in un post successivo al Siggraph, “il Kinect ha portato la percezione 3D al grande pubblico e inoltre ha permesso ai ricercatori di ottenere un prodotto di consumo e impazzire letteralmente”.

Il Kinect divenne in breve tempo un device per makers, scienziati e artisti tanto che al CES di Las Vegas Steve Balmer, allora amministratore delegato di Microsoft, confermò che al 31 dicembre 2010 risultavano vendute in tutto il mondo 8 milioni di Kinect. Detendo così il record del Guinness dei primati di device di consumo più velocemente venduto di tutti i tempi.

Project Durango: Kinect One

Sebbene la prima versione del Kinect (V1) fosse prevista solo per Xbox 360, a partire dal primo febbraio 2012 Microsoft ne rese disponibile una versione solo per computer che avevano installato il sistema operativo Windows 7 o 8.
Nel novembre del 2013 venne rilasciata una nuova versione del Kinect (V2), sviluppata per la nuova console Xbox One, che era differente dalla precedente sia nel hardware che nella forma. Questo nuovo device, nato come progetto Durango, era dotato di una telecamera time-of-flight (TOF) ad alta risoluzione per la lettura della profondità, di una telecamera RGB e microfoni direzionali.

Microsoft, avendo compreso il forte interesse anche al di fuori del mondo gaming,  decise di rilasciare nel 2014 anche una versione venduta stand-alone per computer con l’adattatore ufficiale per collegarlo alla porta USB 3.0

Killed by Microsoft

Ascoltare musica sul proprio Zune, fare una chiamata con il proprio Windows Phone, correre usando la propria Microsoft Band. Oggi non possiamo più farlo, peerché questi sono solo alcuni dei prodotti o servizi uccisi da Microsoft nel corso degli ultimi anni. E sono talmente tanti che qualcuno ha deciso di creare un  cimitero online, un po’ come quello di Google, con tutti i prodotti e servizi killed by Microsoft.
Nel 2017 il Kinect aveva già venduto 35 milioni di unità tra la versione Xbox 360 e Xbox One, ma Microsoft il 25 ottobre annuciò che ne avrebbe cessato la produzione. Unendosi così ai prodotti di consumo che Microsoft aveva già ucciso, ma cos’era successo?

Uno dei problemi principali era che molti dei giochi avvincenti, ad esempio quelli d’azione, erano giocabili esclusivamente con il classico controller Xbox, il che significava che la maggior parte dei giochi Kinect usciti da terze parti erano titoli sportivi, di ballo o comunque orientati alla famiglia.

L’eredità del Kinect

È facile liquidare Kinect come un progetto fallito, ma la realtà è che la ricerca e l’hardware hanno aiutato Microsoft a far progredire altrove i suoi prodotti.
Il wearable device HoloLens è un visore per la realtà aumetata (AR) che utilizza molte delle tecnologie Kinect sviluppate per il rilevamento della profondità.
Oggi accediamo al nostro laptop utilizzando la fotocamera  con Windows Hello che riconosce i dati biometrici del nostro volto, questo è possibile anche grazie alle conoscenze apprese per la creazione del Kinect.
Nel novembre del 2013 Apple ha comprato l’azienda israeliana PrimeSense per 360 milioni di dollari, annunciando in seguito un nuovo sistema di riconoscimento facciale “Face id” per l’iPhone X, che non era altro che un Kinect in miniatura. A febbraio del 2019 Microsoft ha annunciato, durante il Mobile World Congress di Barcellona, il nuovo Azure Kinect e a marzo 2020 l’ha lanciato sul mercato.
Azure Kinect è un kit di sviluppo che unisce il meglio delle prime versioni di Kinect con  l’infrastruttura del cloud computing e l’AI di Microsoft, sebbene il Kinect fosse orientato ai giochi, questo nuovo device è destinato a settori come la logistica, la robotica o l’assistenza sanitaria.

Sitografia