Quanto sarà grande il salto in avanti delle nuove GPU Nvidia? - articolo
Il Digital Foundry analizza le prime specifiche diffuse dell'architettura Pascal.
Se le schede grafiche high-end come la Titan X, la Fury X e la GTX 980 Ti non bastano a soddisfare la vostra sete di potenza, quest'anno finalmente assisterete al lancio di nuove GPU che dovrebbero spingere verso un nuovo livello la grafica e le performance di gioco. Storicamente, AMD e Nvidia lavorano ogni anno per far avanzare la grafica dei PC, ma con l'arrivo dei chip a 16 e 14 nanometri, realizzati usando i transistor 3D FinFET, i produttori di GPU hanno a disposizione la prima vera innovazione produttiva da cinque anni a questa parte. I dati recentemente rilasciati da Nvidia suggeriscono che la nuova architettura Pascal sia qualcosa di veramente speciale.
Tutto suggerisce che Nvidia presenterà i nuovi hardware grafici basati sul processo produttivo a 16nm (realizzato dal partner di lunga data TSMC), e i rumor indicano che i nuovi chip verranno mostrati al Computex show di Taiwan, alla fine di maggio. Nel tempo si sono susseguiti molti leak e rumor, ma le indicazioni più verosimili che abbiamo su cosa sarà Pascal vengono dall'annuncio dell'acceleratore Tesla P100 alla GPU Technology Conference di poche settimane fa, con tanto di specifiche ufficiali dettagliate.
Il nuovo prodotto è destinato ad essere impiegato nei grandi datacenter e nei cosiddetti "super-computer" professionali, ma la nuova Tesla è comunque basata sulla tecnologia Pascal, e le specifiche suggeriscono che questo processore finirà comunque per rappresentare l'ossatura della prossima Titan o equivalente. Il chip si chiama GP100, il che ricorda il GM200 della Titan X e il Gk110 della Titan originale, e le sue specifiche sulla carta sono davvero notevoli.
Innanzi tutto, osserviamo le dimensioni fisiche del chip. Inizialmente si pensava che il processo a 16nm avrebbe richiesto del tempo per maturare, e che i processori più grandi e difficili da realizzare avrebbero potuto apparire solo dopo anni. Il GP100, però, è addirittura più grande del GM200: 610mm2 contro 601mm2. Il vantaggio produttivo dei 16nm è anche confermato dai 15,3 miliardi di transistor, praticamente raddoppiati rispetto agli 8 miliardi presenti sugli odierni prodotti di fascia top. Forse la cosa più sorprendente di tutte è l'incremento di clock: la velocità massima del chip. Corrisponde a 1480MHz, un valore più alto rispetto a quello ottenibile con la Titan X spinta al suo limite massimo. E in questo caso stiamo parlando di un prodotto destinato all'utenza professionale, che solitamente ha velocità di clock più conservative rispetto alle schede di livello consumer.
Tesla M40 | Tesla P100 | |
---|---|---|
GPU | GM200 Maxwell | GP100 Pascal |
SMs | 24 | 56 |
Base Clock | 948MHz | 1328MHz |
Boost Clock | 1114MHz | 1480MHz |
Texture Units | 192 | 224 |
Memory Interface | 384-bit GDDR5 | 4096-bit HBM2 |
L2 Cache | 3072KB | 4096KB |
Transistor Count | 8bn | 15.3bn |
Die Size | 601mm2 | 610mm2 |
Process | 28nm | 16nmFF |
TDP | 250W | 300W |
Su carta, il salto in avanti di GP100 rispetto a GM200 è nettissimo. La potenza di calcolo, solitamente, aumenta in modo proporzionale al numero di transistor. Il processo a 16nm non solo ha consentito un raddoppio di tale numero, ma anche la velocità complessiva del processore è aumentata. Ci sono, quindi, ragioni per credere che anche il livello prestazionale sia incrementato enormemente: molti credevano che l'architettura Pascal si sarebbe limitata a far diminuire le dimensioni fisiche dei chip Maxwell, ma pare che le cose stiano andando diversamente, anche vista la ristrutturazione dei core CUDA e il grosso aumento della cache L2. Come tutto ciò si tradurrà in performance effettiva, ovviamente, resta da vedere.
La Tesla P100 impiega anche 16GB di HMB2, serviti da un bus con l'ampissima banda di 4096 bit: un enorme miglioramento rispetto ai 384-bit della GDDR5 impiegata nella Titan X. Possiamo immaginare che anche la prossima Titan mantenga la memoria HBM2 (è già confermato che la rivale di AMD, nome in codice Vega, lo farà), ma la domanda è: quanta VRAM vedremo nell'inevitabile versione depotenziata e destinata al pubblico gaming, l'equivalente dell'odierna GTX 980 Ti?
Quello che ci affascina dell'annuncio di Nvidia alla GTC è la quantità di informazioni diffuse dall'azienda, tante da averci praticamente dato una ricca anticipazione della GPU consumer top di gamma che probabilmente vedremo debuttare nel 2017. Ma cos'è che invece debutterà quest'anno? Per indagare su questo argomento, possiamo esaminare i rumor che ci giungono dalla stampa orientale.
I leak suggeriscono che vedremo le GPU Pascal a luglio di quest'anno, con una presentazione al Computex di Taipei il mese precedente. Si prevedono almeno due schede, apparentemente chiamate GTX 1070 e GTX 1080 e disegnate per rimpiazzare le equivalenti Maxwell. I nomi possono sembrare particolari, ma un altro leak (che mostra gli alloggiamenti sullo sfondo di quello che sembra il vero impianto produttivo) pare confermarli. Il fatto, però, è che entrambi questi prodotti dovrebbero essere derivati da un altro chip Pascal, più piccolo e denominato GP104.
Nvidia ha dimostrato che i suoi nuovi e "piccoli" chip next-gen possono battere i suoi "grandi" chip last-gen in termini di performance: esattamente quello che abbiamo visto quando la GTX 980 ha superato la GTX 780 Ti (la versione definitiva della prima Titan). Quel che resta da vedere è quanto sia piccolo il GP104. Un altro leak, che sostiene di mostrare il chip effettivo, indica che questo sia più piccolo del suo omologo su GTX 980, il GM204: dovrebbe misurare da 317mm2 a 330mm2, rispetto ai 398mm2 del vecchio chip.
Ma la scheda più diffusa delle due sarà sicuramente la GTX 1070. La domanda è: quanto vorrà osare Nvidia con questa scheda? Quando uscì la GTX 970, il green team ridefinì il mercato delle GPU high-end. La scheda poteva essere overclockata fino a superare le performance della GTX 980 stock, e batteva in scioltezza tutte le alternative AMD, inclusi prodotti che costavano anche 250 euro in più. La scommessa all'epoca pagò, con un fenomenale successo di vendite: al momento di picco, la GTX 970 rappresentava il 5% dell'intera utenza di Steam. Considerando l'abbondanza di modelli differenti sul mercato, sia vecchi che nuovi, si tratta di una percentuale notevolissima. Nvidia cercherà di ripetersi? Una GTX 1070 overclockata supererà le performance della GTX 980 Ti così come la 970 batteva la 780 Ti?
Speriamo che Nvidia abbia il coraggio di stravolgere il mercato anche stavolta. Per quanto la GTX 970 sia stata fenomenale, la Radeon R9 390 di AMD le ha presto risposto a tono. Fatta eccezione per Dark Souls 3, ha fatto girare la maggior parte dei giochi tripla-A alla pari o meglio della GTX 970, con un vantaggio addirittura netto in titoli come Quantum Break e Far Cry Primal. Resta anche l'interrogativo sulla performance di Nvidia con le DX12: le schede di AMD sembrano beneficiarne molto, mentre i risultati di Nvidia con Hitman e Ashes of the Singularity non sembrano affatto lusinghieri.
Ma ci sono anche molte altre questioni che rimangono aperte. Per esempio, sappiamo che il GP100 (il chip Pascal più grande) è disegnato per impiegare la memoria next-gen HBM2, ma cosa succederà con le schede in arrivo? La Titan X e la GTX 980 Ti hanno portato la GDDR5 al limite con il loro bus a 384-bit con moduli da 7Gbps. Nvidia continuerà ad usare questa tecnologia collaudata, oppure opterà per la nuova GDDR5X ad alta velocità di Micron?
Solo il tempo potrà dircelo, ma immaginando che i rumor di un annuncio al Computex di giugno e una release a luglio siano veri, non ci sarà poi molto da aspettare. Dal canto nostro, non vediamo l'ora di poter testare e recensire i primi prodotti Pascal: abbiamo appositamente creato una nuova suite di benchmark basata sia su DirectX 11 che DX12.