Skip to main content

Oltre la TV: l'interfaccia di Xbox One - articolo

Il Digital Foundry esamina interfaccia e comandi vocali next-gen di Xbox One... e Kinect.

"Xbox on".

Non abbiamo l'abitudine di parlare con le nostre console. Ci sembra strano, se non addirittura sciocco. Non ci piace il ritardo con cui i comandi vocali vengono registrati in confronto alla classica pressione sui tasti, e non siamo sicuri che il sistema possa funzionare. Che senso ha, tra l'altro, accendere le nostre console con un comando vocale se poi dobbiamo comunque impugnare il controller? E quanto può essere utile il controllo vocale, vista la necessità di utilizzare come sempre dei telecomandi per TV e altri apparecchi?

Ciò che era un accessorio con Kinect è diventato una componente fondamentale nell'interazione con Xbox One, e da quel che abbiamo visto alla Gamescom la tecnologia ha poco in comune con quella di Xbox 360. Il controllo vocale di Xbox One funziona e sembra veramente utile. Il sistema dovrebbe essere più veloce dell'utilizzo del joypad per alcune funzioni, ma in una situazione ideale ci troveremo a utilizzare entrambi. La separazione di Xbox dal resto dei componenti del sistema, poi, sembra ormai lasciata alle spalle.

"Funzionerà con ogni TV, ogni amplificatore e ogni sistema AV”, dichiara Albert Penello, direttore del product planning di Xbox. “Quando diciamo 'Xbox On' possiamo accendere tutto il sistema e controllarlo con la voce”.

Penello paragona l'integrazione tra Xbox One e gli altri apparecchi ai telecomandi universali Harmony, con la differenza dell'utilizzo della voce per i comandi. Per accendere tutto sarà sufficiente dire due parole, senza impugnare il controller e gli altri telecomandi. Xbox One sarà sempre attiva. Anche in standby, la console dovrebbe riattivarsi completamente prima che l'immagine compaia sullo schermo della vostra HDTV. I giorni in cui il boot della console implica l'attesa del caricamento dell'OS sono ora un ricordo del passato.

Tre cose sono necessarie al funzionamento di questa tecnologia. Prima di tutto il riconoscimento vocale di Kinect deve funzionare, e non si tratta di cosa da poco vista la quantità di linguaggi supportati con i relativi accenti. In secondo luogo, Xbox One deve sapere esattamente quali dispositivi si trovino nella stanza in modo da poter comunicare con loro tramite infrarossi. Infine, e questo è forse il fattore più importante, i segnali IR proiettati dalla console devono essere sempre registrati dall'hardware designato.

"Il controllo vocale su Xbox One funziona e sembra veramente utile"

La schermata iniziale di Xbox One. Microsoft ha mantenuto il design di Xbox 360 ma punta a rendere l'esperienza più semplice ed elegante.

Nello spazio riservato alla stampa, Albert Penello non ha avuto vita facile nella dimostrazione. La quantità di rumore di sottofondo è immensa: l'ambiente della Gamescom non è paragonabile a quello di un soggiorno e Penello deve sforzarsi di far giungere i comandi in maniera chiara a Kinect.

"L'ambiente è innaturalmente rumoroso qui, perciò dovrò più o meno urlare a Kinect”, ha spiegato.

L'integrazione con i sistemi casalinghi è avviato da una semplice procedura, ma le istruzioni di Penello arrivano chiaramente alla TV nella sala della presentazione. Il tutto avviene senza che nella stanza sia visibile un qualsiasi tipo di IR Blaster convenzionale.

"Xbox mute. Xbox unmute. Xbox volume up. Xbox volume down."

"Non c'è nessun cavo”, sottolinea David Dennis, manager della divisione PR di Xbox. “Kinect trasmette in infrarosso i codici alla TV".

La demo audio mostra sia la validità che le pecche del controllo vocale di altri apparecchi. Controlli come mute e riattivazione dell'audio sono funzioni con i soli stati on e off che ben si adattano alla tecnologia. La calibrazione del volume opera invece su una scala e richiede la pressione ripetuta di un tasto o la regolazione di una manopola, funzioni che il controllo vocale non può replicare senza una monotona ripetizione. Abbassare il volume al livello desiderato in questo modo richiederebbe molto, molto tempo.

Ciò che impressiona è che ogni comando vocale registrato da Kinect viene trasmesso perfettamente all'altro apparecchio nella stanza. Il sistema funziona così bene perché Kinect è l'IR Blaster. Microsoft ha potenziato il sensore del nuovo Kinect con un trasmettitore IR in grado di rilevare l'ambiente anche nell'oscurità. Il risultato è che la tecnologia funziona irradiando l'intera stanza di luce infrarossa. Gli strumenti di debug di Kinect permettono di vedere ciò che il sensore IR rileva, un bagno totale di luce infrarossa dell'intera stanza. È difficile immaginare una situazione in cui questa soluzione possa non funzionare.

Interfaccia e personalizzazione

Penello ha dimostrato poi l'interfaccia utente, sottolineando che si tratta di una versione finale.

"Tutto gira su kit reali, sull'hardware praticamente finale. Non c'è un PC nascosto da qualche parte, né cavi celati. Tutto ciò che sto mostrando gira su questo sistema che vedete".

"Gli strumenti di debug di Kinect permettono di vedere ciò che il sensore IR rileva, un bagno totale di luce infrarossa dell'intera stanza"

Ecco come Kinect percepisce la stanza. Il sistema irradia totalmente l'ambiente, assicurando la corretta trasmissione dei codici agli altri apparecchi.

"Il software è ancora incompleto. Non è una demo né qualcosa che abbiamo assemblato solo per la presentazione, ma è ciò che i nostri sviluppatori stanno utilizzando per il testing interno. La cattiva notizia è che lo sviluppo è ancora in corso, per cui durante le dimostrazioni accade sempre qualche imprevisto”.

Da ciò che abbiamo potuto vedere, l'interfaccia utente sembra molto vicina a essere completa ed è molto diversa da quella tutt'altro che esaltante vista nel coverage di Wired. Gli unici dati di debug che vediamo derivano dai comandi vocali: le istruzioni vengono mostrate nell'angolo in alto a destra insieme a un numero compreso tra 0 e 1. I comandi di Penello sono tutti associati a un fattore di 0,96 o 0,97 che ci viene detto essere (in secondi) il tempo necessario al processing del comando vocale.

"Abbiamo raffinato l'interfaccia di Xbox 360 a lungo. Con Xbox One abbiamo provato a realizzarne una più semplice ed elegante. Questa è la schermata home, dove vengono mostrati gli ultimi titoli che ho lanciato e, a destra, lo store dove cercare giochi, film, musica e applicazioni”, esordisce Penello, prima che nuovi contenuti compaiano nelle caselle.

”Il sistema mi ha appena registrato. Kinect percepisce che sto parlando al sistema e scarica immediatamente il mio profilo da Xbox Live, connettendomi. Come vedete tutto è cambiato e sono comparse le applicazioni più recenti che ho utilizzato".

I dati di riconoscimento e profilo sono separati. Il nuovo Kinect impara a riconoscere fattezze e volto in una sequenza di calibrazione eseguita in locale. Gli elementi personalizzati dell'interfaccia sono invece immagazzinati nel cloud e trasferiti tramite Xbox Live. È possibile anche selezionare degli elementi preferiti da tenere sulla schermata principale per facilitare la navigazione.

"Dopo aver loggato nel sistema, la console vi riconoscerà e personalizzerà l'interfaccia. Non sarà più necessario avere un'unità di memoria con i salvataggi e il resto come con Xbox 360”, dice Penello. “Tutto ciò di cui avrete bisogno con Xbox One sarà il vostro Xbox Live ID, salvataggi e impostazioni vi seguiranno ovunque andiate"

"Il sistema può gestire sei utenti registrati da Kinect, che potrà caricarne profili e dati collegati come liste di amici, Achievements e feed social”

Giochi, applicazioni, media e altro ancora. La possibilità di mettere in evidenza strumenti e contenuti dovrebbe permettere una navigazione più facile su Xbox one.

Tutto questo funziona con più utenti collegati in simultanea al sistema. Kinect può tracciare indipendentemente sei persone.

Ecco come Kinect gestisce i comandi vocali di più utenti

"Avere più di un utente su Xbox 360 è abbastanza complicato. Forse qualcuno di voi ha amici o compagni che vogliono giocare senza rovinare i vostri Achievements o il Gamescore”, prosegue Penello. “È molto difficile passare da un utente all'altro. Su Xbox One possiamo invece avere fino a sei persone loggate contemporaneamente nel sistema e utilizzando Kinect possiamo riconoscervi, sapere chi sta parlando e fornire un'esperienza su misura per quella determinata persona”.

La dimostrazione non va come previsto: David Dennis impartisce ordini a Kinect mentre Albert Penello parla ai giornalisti, e il sensore non è sicuro da chi stiano arrivando i comandi e di quali dati occuparsi. Dopo aver provato senza successo tramite la gestione della lista utenti, i due provano qualcosa di diverso.

"Xbox go to Achievements", dice Penello.

"Xbox go to Achievements", ripete Dennis.

Entrambi sono loggati su Xbox One e riescono ad accedere ai propri dati individuali come Achievements, liste amici e altro. Uno dei due potrebbe lanciare Forza Motorsport 5 o qualsiasi altro gioco con un comando vocale e il sistema preparerebbe i suoi salvataggi durante il caricamento. In caso di acquisto tramite digital delivery, i giochi sono accessibili tramite comando vocale o controller. Nel caso di copia fisica del gioco, sarà ovviamente necessario mettere il disco nel lettore ottico.

Ciò che ci ha veramente impressionato della presentazione è la capacità di Kinect di distinguere i due e caricare i relativi contenuti. Come funziona il sistema? Kinect riconosce i comandi vocali, ma di certo non può distinguere individualmente le voci. Il sensore utilizza invece altri dati per determinare di chi sia la voce registrata.

"Kinect riconosce i nostri scheletri, i nostri volti. Può vedere la mia faccia e sentirmi parlare, e visto che mi sente e vede il mio scheletro può isolarmi tra gli altri utenti”, spiega Penello.

"Gli strumenti di sviluppo mostrerebbero due scheletri, quello di Albert mentre parla e il mio in silenzio”, aggiunge Dennis.

"C'è un altro piccolo trucco all'opera. Nel joypad è presente un piccolo LED che associa i controller agli utenti e che mostra che David ha il numero due mentre io il numero uno. Combinando le quattro cose, ossia chi parla, posizione degli utenti, provenienza del suono e controller, Kinect determina l'utente attivo".

"Insieme al rilevamento dello scheletro e all'input sonoro, gli emettitori IR nei controller di Xbox One permettono all'OS di isolare i comandi vocali dei vari utenti”.

Lo strumento di debug di Kinect dà un'idea dei dati che il sensore è in grado di rilevare. Tra questi espressioni facciali, attività nel sistema e quale controller stiano utilizzando i vari utenti.

"Xbox go to Marble Maze."

Penello dimostra poi come si possa caricare un gioco semplicemente parlando. Teoricamente, tramite i comandi vocali avremmo potuto accendere tutti i nostri sistemi audio/video e caricare un gioco prima ancora di arrivare a sederci sul divano.

"Anche se Marble Maze è solo una piccola demo, immaginate che sia qualcosa di eccezionale come Ryse o Dead Rising. Serve solo a testare alcune cose”, ha spiegato Penello.

"Una caratteristica degli Achievements è che indicano il compimento di un'azione particolare ma non il modo in cui sono stati ottenuti. Xbox One registra sempre gli ultimi cinque minuti di gameplay, per cui immaginate di eseguire qualcosa di sensazionale che vorreste mostrare agli altri… tutto ciò che dovrete dire sarà 'Xbox registra' e il sistema comprimerà gli ultimi 30 secondi di buffer realizzando un video che potrete condividere con gli amici”.

Applicazioni e upload dei video

Ed è proprio ciò che ha fatto Penello, mostrando la qualità del video registrato e riprodotto sullo schermo. La demo Marble Maze gira a 60 fotogrammi al secondo mentre il video è bloccato chiaramente a 30fps con un comprensibile calo di qualità. Tenendo però presente la media delle piattaforme disponibili, si tratta comunque di un risultato superiore a YouTube. Sarà interessante verificare se i video dovranno passare per un'ulteriore encoding dal lato server o se verrà utilizzato lo stream originale di Xbox One.

"Come notate sono ancora nel gioco. Visualizzerò il video, mi ci vorrà un secondo per caricarlo, dopodiché lo porterò nell'editor per correggerlo, salvarlo e uploadarlo. Poi tornerò al gioco”, dice Penello.

"Xbox go to Marble Maze. Vedrete che tornerò immediatamente al gioco proprio nel punto in cui ero. Questo è solo un modo per registrare video, potrei farlo manualmente... Xbox snap upload. E ora l'app di upload compare sulla destra dello schermo. Sto ancora giocando e potrei registrare manualmente fino a cinque minuti di gameplay da editare in seguito”.

"L'upload implica la condivisione del video con gli amici, la registrazione nei feed e tutto il resto”, aggiunge Dennis.

La comparsa dell'app di upload sulla destra di Marble Maze riduce in orizzontale la finestra in cui viene mostrato il gameplay. Ci è stato detto che gli sviluppatori potranno scegliere come posizionare le finestre.

"Affiancare applicazioni al gameplay o ad altre app funziona esattamente come detto, senza nessun impatto sulle prestazioni"

Un esempio di applicazione, in questo caso Twitch, affiancata al gameplay. Nella dimostrazione avvenuta alla Gamescom l'azione è stata compressa orizzontalmente a sinistra per fornire spazio all'applicazione di upload dei video. Microsoft afferma che gli sviluppatori possono scegliere il modo in cui vengono disposte le app.

"Xbox unsnap"

Microsoft afferma che il caricamento delle app è immediato e da ciò che abbiamo visto non c'è effettivamente impatto sulle prestazioni. La fluidità è impressionante, ma il passaggio da un gioco all'altro è una questione totalmente diversa. La maggior parte della RAM di sistema è utilizzata per il gioco è non c'è modo di gestire in maniera volante 5GB di dati, per cui in questo caso assistiamo a dei tempi di caricamento.

"Xbox go to Reflex"

Ci vogliono alcuni secondi prima che Xbox One esegua il comando. Penello spiega che il tempo è sufficiente a cancellarlo in caso qualcuno tenti di bloccare il gioco lanciandone vocalmente un altro. Probabilmente è la soluzione migliore per il sistema, ma resta il fatto che il controllo vocale potrebbe essere utilizzato per rendere la vita difficile a un altro utente. L'app Reflex, comunque, rivela altri segreti di Kinect che ci impressionano.

La demo Reflex: Kinect e gli shooter in soggettiva

"Abbiamo realizzato Reflex per testare l'utilizzo del nuovo Kinect in uno sparatutto in soggettiva, quindi anche in questo caso parliamo di una demo e non di un vero gioco. Volevamo studiare il movimento delle persone, il loro modo di interagire e come rilevarlo, oltre che verificare la precisione del nuovo sensore”, spiega Penello.

"Questo è un generico shooter in soggettiva che abbiamo messo insieme per motivi di testing. Potreste notare che il nostro personaggio verrà colpito da cose che non posso vedere e per questo attivo la visuale a raggi X. Facendo un veloce movimento con la testa potrò vedere tutti i personaggi nascosti nel gioco, e vedrete che quel movimento è veloce come la pressione di un tasto. L'altra cosa da notare, che in questa demo non è neanche ottimizzata al massimo, è che posso selezionare delle cose con le mie mani (cosa che non dimostrerò) ma anche usare la mia voce… Fire missiles... la voce funziona come un altro tasto con cui eseguire alcune azioni".

Anche se la dichiarazione sulla velocità di Kinect equivalente a quella della pressione di un tasto è da prendere con le molle, non possiamo negare che il sistema sembri veloce. Molto veloce. In effetti, molto più veloce di quanto visto nella demo di Kinect Sports Rivals che abbiamo giocato prima della presentazione.

"L'FPS dimostrativo Reflex è impressionante: la risposta di Kinect è più veloce rispetto a qualsiasi altra sua applicazione vista in passato"

Ecco il mondo visto dal nuovo sensore di Kinect. La risoluzione di 512x424 non è un aumento enorme rispetto ai 320x240 dell'originale. Microsoft dichiara però un raggio operativo da 0,8 a 4,2 metri, un angolo di visuale orizzontale di 70°, 20 millisecondi di latenza verso il software e 14 di tempo di esposizione totale. La latenza è migliorata e Kinect è chiaramente più preciso: il tracking di un utente seduto è ora possibile.

"L'ultima cosa è la capacità di rilevare l'energia cinetica. Ora sono in piedi, ma questa demo funzionerebbe lo stesso se fossi seduto, e capirebbe se alzassi il controller come uno scudo o se mi spostassi. Tutte queste cose possono accadere simultaneamente e istantaneamente”, prosegue Penello.

Il lancio dei missili mette in mostra una nuova caratteristica di Xbox, il “magic moment”. Gli sviluppatori possono inserire questi momenti nel gioco e far salvare in automatico il video di gameplay che pensano sia importante e condivisibile.

"Se c'è un boss e lo sviluppatore sa che il giocatore dovrà fare qualcosa di veramente figo per finirlo, il gioco può essere impostato in modo che registri automaticamente quel momento”, spiega Penello. “Ed è proprio ciò che è successo ora, il lancio dei missili tramite la mia voce è un'operazione flaggata come magic moment che viene quindi registrata".

Microsoft ha migliorato radicalmente le liste amici rispetto a Xbox 360. La lista ora è estesa e può gestire dei preferiti, inoltre è possibile seguire qualcuno o essere seguiti come accade su Twitter e all'occorrenza è possibile anche bloccare un utente. La condivisione dei video è una parte fondamentale di ciò e suggerisce dei requisiti di banda molto alti, il che potrebbe spiegare come mai queste caratteristiche siano riservate agli abbonati Gold di Xbox Live.

Snap App: possibilità e limiti

Ma il nostro campo è la tecnologia, e siamo rimasti impressonati dalle applicazioni e dalla funzione Snap. La domanda è: come funziona e quali sono i suoi limiti?

"Abbiamo parlato dei tre sistemi operativi di Xbox One. Un OS molto piccolo è solamente il layer di codice, poi abbiamo il layer delle applicazioni in modo che le app nell'OS possano girare indipendentemente dai giochi”, dice Penello.

"Ecco perché si può usare Snap e passare da un'applicazione all'altra senza compromettere la giocabilità. Il gioco impiega la maggior parte delle risorse della console. OS e applicazioni girano in una parte totalmente separata e non si influenzano. Due giochi non possono girare in simultanea perché a loro viene dedicata la maggior parte delle risorse, ma è possibile avere fino a quattro applicazioni attive in background. Il passaggio è istantaneo, come avete potuto vedere”.

L'interfaccia sembra risiedere nella RAM anche durante il gameplay, quindi è possibile aprirla e calibrare le impostazioni mentre si gioca?

"La dashboard più avanzata e le quattro applicazioni residenti contemporaneamente in memoria spiegano perché 3GB della RAM di Xbox One sia riservata al sistema"

I messaggi di sistema sono stati riscritti su Xbox One, ma nel software di test l'audio è identico a quello di Xbox 360.

"Sono le applicazioni a venire associate. Non si può fare con l'interfaccia utente”, risponde David Dennis. “Immaginate il gioco e l'app di Madden girare insieme, o pensate a Halo Waypoint dove aggregate ciò che fate. Pensate a un'applicazione di Halo Waypoint attiva che aggiorni i feed mentre giocate. Si tratta di un videogioco e un'app operativi in contemporanea e che comunicano reciprocamente”.

"Potreste collegare Youtube o Netflix a un gioco, o collegare questi ultimi due”, aggiunge Penello, sottolineando come le app possano essere collegate a un gioco o ad altre app.

Anche se non è possibile attivare l'interfaccia in questo modo, sembra che singoli compiti per cui potremmo utilizzarla possano essere gestiti come app individuali.

"Si può dare il comando 'Snap party', che mostrerà tutto ciò che gli altri stanno giocando e permetterà di unirvi ad altre partite”, dice Penello.

Dopo una breve sessione di domande con la stampa, la presentazione finisce. Noi però restiamo nei paraggi per presentarci e fare qualche altra domanda sull'architettura di Xbox One.

È interessante notare come la TV sia stata menzionata una sola volta in tutta la presentazione (nell'occasione in cui un giornalista ha notato un achievement TV nel profilo di Albert Penello, che per la cronaca non ha Gamerscore). La presentazione è stata incentrata sui videogiochi e sull'utilità di Kinect, senza dimenticare dashboard e interfaccia.

Anche se è difficile immaginare l'utilizzo esclusivo dei comandi vocali, l'uso di Kinect insieme al joypad ha molto più senso. A prescindere da quanto possa essere elegante e semplificata l'interfaccia di Xbox One, ci sono molti aspetti da coprire e la possibilità di utilizzare la voce per navigare non può essere ignorata. Allo stesso modo è interessante anche l'idea di gestire più utenti in contemporanea con Kinect, una funzione comprensibilmente ancora buggata ma che possiamo aspettarci venga sistemata.

Forse il punto maggiormente a favore del briefing è la trasformazione dell'interfaccia utente e della sua rilevanza per i giocatori. L'evento di presentazione di Xbox One si era concentrato troppo sulla TV, al punto che i giocatori si erano sentiti esclusi. Alla fine di questo nuovo evento siamo invece rimasti impressionati e avremmo voluto saperne di più. Penello sintetizza così:

"È impossibile parlarne. Quando vedrete, capirete".

Traduzione a cura di Emiliano Baglioni.