CPU EPYC a 64 core e schede Radeon Instinct a 7nm: il futuro di AMD passa dal datacenter

CPU EPYC a 64 core e schede Radeon Instinct a 7nm: il futuro di AMD passa dal datacenter

AMD affila le armi contro Intel per guadagnare spazio nel settore dei datacenter, grazie ad una roadmap molto ambiziosa e a prodotti basati su tecnologia produttiva a 7 nanometri che debutteranno tra fine 2018 e 2019. Con i processori EPYC della famiglia Zen 2 AMD passa a 64 core per socket, affiancando schede Radeon Instinct di nuova generazione pensate per il datacenter

di pubblicato il nel canale Server e Workstation
AMDVegaRadeon InstinctEPYCRyzenZen
 

"Il datacenter è una incredibile opportunità per AMD": con queste parole Lisa Su, CEO di AMD, ha aperto i lavori di AMD Next Horizon, evento organizzato a San Francisco e incentrato sulle novità di AMD previste per il settore dei datacenter. CPU e GPU sono al centro della strategia dell'azienda americana per andare a ritagliare una quota di mercato importante in un settore che è previsto essere capace di raggiungere, nel 2021, una soglia di 29 miliardi di dollari di controvalore.

L'impressione che si è ricavata da quest'evento è quella di una AMD molto fiduciosa dei propri mezzi e consapevole che i lavori di ricerca e sviluppo portati avanti in questi ultimi anni la stanno portando verso risultati importanti. Abbiamo visto questo lo scorso anno con le soluzioni Ryzen e ne abbiamo avuto conferma positiva nei risultati finanziari degli ultimi trimestri, con i quali l'azienda è stata capace di generare utili per i propri azionisti e di consolidare la propria posizione di mercato. E' nell'ambito dei datacenter che AMD vede le migliori opportunità di business per il futuro, con prodotti che saranno poi translati a livello di architettura anche nell'ambito consumer tanto per quanto riguarda la componente CPU come per quella GPU.

Creare soluzioni tecnologiche di successo è un processo non semplice in generale, ma lo è ancora meno quando si deve operare a livello di silicio. I prodotti che sono disponibili ora, oltre a quelli che diventeranno tali nel corso del 2019, sono frutto di vere e proprie scommesse fatte 4-5 anni fa sulle previsioni di quella che sarebbe stata l'evoluzione tecnologia e sulle necessità dei datacenter. Le scelte fatte in quel periodo si devono concretizzare in prodotti attesi per gli anni a venire, che se le previsioni verranno confermate saranno in grado di offrire quello che il mercato chiede. E' una vera e propria scommessa tesa a identificare quelle che saranno le necessità tecnologiche del futuro, con la speranza di aver intuito con successo cosa il futuro richiederà. In questo momento AMD prepara il lancio di CPU e GPU a 7 nanometri, ma da qualche parte in azienda dei team di sviluppo sono al lavoro per definire le caratteristiche tecniche e gli obiettivi dei prodotti che vedranno la luce tra non meno di 4 anni.


die del processore AMD EPYC Rome: 7nm, 64 core, al debutto nel 2019

AMD ha introdotto le prime soluzioni EPYC poco meno di 1 anno e mezzo fa, raccogliendo un notevole successo in termini di partner che hanno scelto di presentare proprie soluzioni basate su questi processori. L'impatto è stato interessante, per quanto numericamente meno importante, anche per quanto riguarda le GPU AMD sviluppate per il settore dei datacenter. Il mercato dei datacenter non solo è interessante per lo sviluppo futuro, ma è anche settore nel quale AMD ha molto faticato nell'ultimo decennio. Le proposte Opteron, dopo un iniziale successo di mercato, hanno faticato a tenere il passo con le proposte concorrenti di Intel e lo stesso può essere detto con riferimento alle soluzioni Radeon per il pubblico professionale nel confronto con le soluzioni concorrenti di Intel.

lisa_su_1.jpg

Il mercato professionale tende a muvoersi con dinamiche ben diverse da quello consumer. Nei datacenter il cambiamento è lento, per quanto diverso a seconda del tipo di cliente. In ambito High Performance Computing si è ben più propensi a testare ed implementare nuove architetture rispetto a quanto non avvenga ad esempio in ambito enterprise. Negli ultimi 18 mesi AMD ha portato avanti con i propri partner un lavoro di progressiva scoperta e implementazione delle proprie architetture EPYC: è uno sforzo complesso, di certo non ancora concluso ma che ora sta portando i primi frutti nella forma di annunci di nuove partnership e OEM che adottano EPYC per i propri sistemi. Del resto un periodo di 12-18 mesi è quello che tipicamente il settore richiede per completare i processi di analisi e validazione di nuove piattaforme dedicate ai datacenter.

La prima generazione di proposte EPYC ha quindi rappresentato per AMD un punto di svolta non solo in termini di prodotti e volumi di vendita, ma soprattutto di relazioni con i partner produttori di server e di soluzioni per il datacenter. Le peculiarità di questa architettura hanno permesso ad AMD di cambiare la percezione in un mercato che per sua natura è legato a rapporti di lungo periodo e nel quale è molto più difficile passare ad altro fornitore rispetto a quanto accada ad esempio nel contesto consumer.

L'annuncio odierno della partnership tra AMD e Amazon Web Services deve essere quindi visto proprio in quest'ottica, l'entrare in partnership diretta con il principale fornitore mondiale di soluzioni cloud: AWS adotterà soluzioni server basate su CPU EPYC proponendole ai propri clienti. Nello specifico i processori EPYC saranno disponibili da quest'oggi in 3 differenti famiglie di prodotti cloud di AWS: parliamo dei modelli R5a, M5a e T3a.

Da un evento chiamato "Next Horizon" è facile attendersi informazioni interessanti sulle future soluzioni che AMD renderà disponibili in commercio, e così è stato. La prima novità riguarda le soluzioni Zen di prossima generazione, indicate come Zen 2 e nello specifico con il nome in codice di "Rome" per la prossima generazione di processori EPYC che saranno costruiti con tecnologia produttiva a 7 nanometri e debutteranno nel corso del 2019.

Mark Papermaster, CTO dell'azienda, ha presentato Rome ricordando come risalgano al 2012 i primi lavori interni in azienda per la definizione degli elementi che avrebbero poi portato lo scorso anno al debutto delle prime soluzioni della famiglia Zen. Non solo: viene confermato il debutto delle soluzioni Zen 3 basate su tecnologia produttiva 7nm+: al momento attuale queste soluzioni sono in linea con le tempistiche di sviluppo interne che AMD ha fissato nella propria roadmap, pertanto le vedremo in commercio nel corso del 2020.

Il passaggio alla tecnologia produttiva a 7 nanometri porta una notevole complessità nella fase di progettazione e costruzione, ma permette anche di ottenere tangibili benefici diretti. Il primo è un raddoppio della densità rispetto al processo a 14 nanometri, seguito da una riduzione della potenza della metà a parità di prestazioni velocistiche e un incremento del 25% delle prestazioni a parità di potenza richiesta.

A livello architetturale, Zen 2 introduce varie novità che partono dal front end della CPU dotato di un nuovo branch predictor oltre ad un nuovo instruction counter. L'unità di calcolo in virgola mobile è stata raddoppiata con datapath a 256bit: questo ha implicato anche il raddoppiare la bandwidth per le operazioni di load e store e di incrementare quella per le operazioni di dispatch e retire, così da poter sfruttare al meglio il passaggio a 256bit. In Zen 2 AMD ha inoltre integrato nuove funzionalità legate alla sicurezza dei dati, oltre a gestire in hardware le funzioni di protezione dalle potenziali violazioni della famiglia Spectre.

Con la seconda generazione di architettura Zen cambia anche il modo con il quale i processori EPYC vengono sviluppati. Abbiamo ora quelli che AMD indica come Chiplets, costruiti con processo a 7 nanometri e di fatto componenti di silicio che integrano 8 core Zen 2 al proprio interno. I Chiplets vengono collegati internamente ad un secondo chip, indicato come I/O Die, che integra al proprio interno tutti i componenti indispensabili per il sistema dal controller PCI Express 4.0 al memory controller sino a tutta la parte di gestione dell'Input-Output. L'I/O Die è costruito con tecnologia produttiva a 14 nanometri e posizionato al centro del processore, collegato direttamente a ciascuno dei Chiplets. Nella versione più complessa di processore EPYC Rome AMD ne integra 8, per un totale di 64 core e sino a 128 threads: si tratta di numeri doppi rispetto alle attuali generazioni di CPU della famiglia EPYC in commercio.

Il numero massimo di core è stato quindi raddoppiato; l'IPC è stata incrementata grazie alle innovazioni architetturali, mentre l'integrazione del supporto all'interfaccia PCI Express 4.0 permette di ottenere un raddoppio della bandwidth per ogni canale. Si tratta di significative innovazioni che per AMD permettono un netto balzo in avanti rispetto a quanto ottenibile con le attuali proposte EPYC presenti in commercio.

Le CPU Rome sono compatibili a livello di socket con le piattaforme EPYC in commercio, e già da ora AMD conferma che la prossima generazione di processori EPYC, indicati con il nome in codice di Milan, saranno compatibili con le piattaforme ora sul mercato. Alcuni partner potranno scegliere di sviluppare nuove schede madri per meglio sfruttare le funzionalità avanzate dei nuovi processori come il controller PCI Express 4.0, soprattutto per quanto riguarda le declinazioni top di gamma, ma chi avesse acquistato un sistema EPYC di prima generazione può guardare a varie opportunità di upgrade nel futuro in modo speculare a quanto offerto da AMD con le soluzioni Ryzen per sistemi desktop.

Tutte queste novità quali ricadute hanno sulle prestazioni velocistiche? AMD ha dichiarato un raddoppio delle prestazioni per ogni socket rispetto alla precedente generazione di processori EPYC; in termini di elaborazioni floating point le innovazioni architetturali permettono un aumento di 4 volte delle prestazioni sempre per socket a parità di piattaforma rispetto alle attuali generazioni di CPU EPYC in commercio.

Non solo: AMD ha effettuato la prima dimostrazione pubblica di processore EPYC Rome mettendo a confronto un server con due processori Intel Xeon 8180M Platinum con uno EPYC Rome a singolo socket: quest'ultimo integra 64 core, mentre la soluzione Intel top di gamma abbina due processori ciascuno a 28 core. La risultante è un tempo di elaborazione con il benchmark C-Ray leggermente inferiore per il server AMD (28 secondo contro 30 secondi), con un costo totale di gestione della piattaforma che è nettamente inferiore.

Il futuro dei datacenter vede le CPU affiancate alle GPU, in misura ancor più marcata di quanto non sia in questo momento. L'attenzione di AMD è quindi legata ai molteplici utilizzi di questi componenti all'interno del contesto delle applicazioni cloud. Passiamo dal cloud gaming ai virtual desktop e workstation, sino alle elaborazioni di machine learning e al tradizionale high performance computing. Da vari anni raccontiamo come le GPU rivestano un ruolo fondamentale nell'elaborazione parallela, essendosiu trasformate da strumento utile per i videogiochi e la grafica 3D a risorse di elaborazione che affiancano, e in alcuni ambiti sostituiscono interamente, i tradizionali processori.

L'architettura a 7 nanometri è al centro anche della strategia GPU di AMD, che già al Computex di Taipei dello scorso mese di giugno aveva anticipato come la prima GPU a 7 nanometri sarebbe stata una soluzione dedicata proprio al datacenter. Radeon Instinct MI60 è il primo modello di scheda video basato su GPU costruita con tecnologia produttiva a 7 nanometri, specificamente sviluppata per le esigenze dei datacenter.

Cuore di questa GPU è una architettura Vega di tipo avanzato, rivista quindi in vari elementi rispetto a quella attualmente sul mercato, abbinata a memoria High Bandwidth Memory di seconda generazione. Nel passaggio a 7 nanometri AMD ritrova gli stessi benefici visti poco prima con l'architettura Zen 2. La densità raddoppia, con un totale di 13,2 miliardi di transistor per una superficie di 331 millimetri quadrati fermo restando il numero di stream processors che è pari a 4.096 come per le schede Vega 64 ora in commercio. A parità di frequenza di clock la potenza richiesta è pari al 50%, mentre a parità di potenza le prestazioni aumentano del 25%.

L'architettura Vega di tipo enhanced adottata dalla scheda Radeon Istinct MI60 permette di ottenere le più elevate prestazioni in operazioni FP64 e FP32: che il design sia stato completamente pensato per le specifiche esigenze dei datacenter si nota dalla presenza di correzione ECC per tutte le memorie interne.

Radeon Instinct MI60 suporta 32 Gbytes di memoria HBM2, con una bandwidth che raggiunge il valore record di 1 TB/s con ovviamente controllo ECC dell'integrità dei dati. Troviamo anche supporto alla tecnologia PCI Express 4.0, per la prima volta integrata all'interno di una scheda video: si tratta di una caratteristica che si abbina al controller PCI Express 4.0 integrato nei processori EPYC della famiglia Rome.

Il supporto all'architettura Infinity Fabric permette inoltre di collegare ad una CPU EPYC sino ad un massimo di 4 schede Radeon Instinct MI60 senza dover utilizzare switch, sfruttando in questo modo al meglio la nuova interfaccia PCI Express e ottenendo in questo modo una superiore efficienza complessiva. Non manca anche il supporto all'hardware based virtualization, qui giunta alla terza generazione: si tratta di una caratteristica richiesta dai clienti di AMD che si rivela essere di estrema importanza nell'utilizzo della GPU in desktop e workstation virtualizzati.

Grazie alle migliorie integrate nell'architettura Vega e alla bandwidth della memoria video, AMD è stata capace di incrementare sensibilmente la potenza di elaborazione delle proprie GPU. Sono stati riportati incrementi di 2,8 volte nel test Resnet-50, e di quasi 9x nelle elaborazioni in double precision con DGEMM rispetto alla scheda Radeon Instinct MI25 di precedente generazione.

Dinamiche simili sono registrate da AMD, secondo i propri test interni, anche nel confronto con la scheda NVIDIA Tesla V100: i risultati sono comparabili sia con elaborazioni in single che in double precision, oltre che nell'ambito del machine learning.

Dopo la scheda MI60 vedremo in futuro una nuova scheda Radeon Instinct, indicata al momento attuale con il nome di "MI-Next": il team di sviluppo interno ad AMD è al lavoro su questo prodotto, che immaginiamo essere basato su architettura di GPU della famiglia Navi con indicazione di superiori prestazioni hardware, maggiore connettività e ovviamente mantenimento della piena compatibilità software con quanto è disponibile ora in commercio. Al pari di quanto fatto per le proposte CPU anche in ambito GPU AMD vuole sottolineare come i prodotti a 7 nanometri che vedranno la luce tra fine 2018 e 2019 saranno seguiti da altre proposte per gli anni a venire, sulle quali l'azienda è già al lavoro internamente. Mancano i dettagli tecnici ma la strategia complessiva è molto chiara: in ambito datacenter è fondamentale fornire una roadmap futura credibile e sostenibile, e questo è il messaggio che AMD ha voluto portare avanti.

"AMD is totally committed to the datacenter": con queste parole Lisa Su, CEO dell'azienda, ha concluso la sessione di presentazione delle nuove soluzioni a 7 nanometri per il datacenter. AMD è parsa essere molto confidente circa le potenzialità delle proprie soluzioni attese tra fine 2018 e inizio 2019, lasciando la chiara impressione che se molte cose sono cambiate nell'ambito server tra 2017 e 2018 grazie al debutto dei primi sistemi EPYC molto altro attende il mercato a partire dai prossimi mesi. Intel e NVIDIA sono avvisate.

45 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
digieffe07 Novembre 2018, 04:03 #1
Lavoro notturno, ben fatto!
Marko#8807 Novembre 2018, 07:54 #2
Begli annunci. Vediamo più avanti cosa faranno lato consumer ma AMD sta lavorando decisamente bene.

Un complimento anche al Corsini che scrive articoli di qualità e belli da leggere. A differenza degli articoli degli altri che sono volti esclusivamente ad acchiappare click e a creare flame. Oltre ad essere scritti spesso piuttosto male.
nickname8807 Novembre 2018, 07:57 #3
Ed i giocatori abbandonati al competitor ...
Gyammy8507 Novembre 2018, 08:49 #4
Originariamente inviato da: nickname88
Ed i giocatori abbandonati al competitor ...


Evvabbè...

Originariamente inviato da: Bivvoz
Non basta guardare, bisogna anche capire.
Per esempio bisognerebbe capire che se l'evento parla di datacenter non ha senso parlare di giocatori.


Senza contare che poi a cascata tutto questo avrà riflessi sul consumer
Intanto con un chippetto hanno pareggiato tesla v100 che ha 1000 e passa sp in più, sta a vedere che ora i clock non contano più
Gyammy8507 Novembre 2018, 09:03 #5
Originariamente inviato da: Bivvoz
Pareggiato non saprei, forse solo sotto certi aspetti.
Ma adesso AMD se la gioca sulla soluzione completa con CPU Epyc molto competitive e probabilmente con ottimi rapporti perf/$$ grazie all'approccio chiplet, le Radeon anche se fossero leggermente inferiori alle Nvidia servono per offrire un pacchetto completo che attualmente solo AMD può fornire.
Detto semplicemente una mano lava l'altra.


In teoria siamo lì, 14,7 tf è la potenza di tu102 e compagnia
Poi già vega 10 se la batteva bene, figuriamoci questa che è steroidata
Tra l'altro sembra che dalle informazioni trapelate dai driver linux siano pronte tutte le funzionalità "dormienti" in vega 10
Staremo a vedere, a dicembre ci sarà il grosso update dei driver
lucusta07 Novembre 2018, 09:31 #6
Vega 20 è una GPU prettamente datacenter, con la massimizzazione delle possibili interconnessioni logiche dei cluster SP (guardando alla questione che in associativa ha un rateo 2:1 rispetto a FP32, mentre vega 10 solo 1:16 e che è comunque in grado di scendere a rateo diretto fino a logica boleana, 1-precision bit, usata nelle QNN).
sui giochi non serve così tanto e per farlo si devono usare un bel pò di registri in più, quindi complessità aumentata che porta a consumi superiori.

possono farla andare anche per i giochi, ma se ne perdono molti aspetti pratici.
il guadagno c'è sempre, comunque.

probabilmente la vedremo sul mondo consumer per abbattere i costi per datacenter (non i prezzi, solo i costi, per fare margini superiori), ma in una figura ben diversa.
probabile che la useranno solo con 2 HBM2, quindi con un bus di "soli 2048 bit e con circa 600GB/s se usano le samsung da 600mhz, con consumi inferiori alle attuali vega 64, passando dai 250W ai 140-150W con prestazioni leggermente superiori...
un buon chippetto "medio" considerando che la concorrente diretta dovrebbe essere la 2070 (quindi una nominazione probabile potrebbe essere 690 e 690x), ma parliamo di 450/500 euro massimo per questa classe di GPU.
dipende quindi molto dalle rese dei 7nm e dalla disponibilità di wafer di TMSC su quelle linee...

insomma... 50:50 che la faranno uscire aspettando Navi, architettura che sembra essere più votata al mondo gaming/rendering.
lucusta07 Novembre 2018, 09:38 #7
Originariamente inviato da: nickname88
Ed i giocatori abbandonati al competitor ...


abbandonati...
chi è causa del suo mal pianga se stesso...
Vash_8507 Novembre 2018, 09:41 #8
Originariamente inviato da: emiliano84


Quel: "As promised" suona come un macigno.
Gyammy8507 Novembre 2018, 11:39 #9
Originariamente inviato da: lucusta
Vega 20 è una GPU prettamente datacenter, con la massimizzazione delle possibili interconnessioni logiche dei cluster SP (guardando alla questione che in associativa ha un rateo 2:1 rispetto a FP32, mentre vega 10 solo 1:16 e che è comunque in grado di scendere a rateo diretto fino a logica boleana, 1-precision bit, usata nelle QNN).
sui giochi non serve così tanto e per farlo si devono usare un bel pò di registri in più, quindi complessità aumentata che porta a consumi superiori.

possono farla andare anche per i giochi, ma se ne perdono molti aspetti pratici.
il guadagno c'è sempre, comunque.

probabilmente la vedremo sul mondo consumer per abbattere i costi per datacenter (non i prezzi, solo i costi, per fare margini superiori), ma in una figura ben diversa.
probabile che la useranno solo con 2 HBM2, quindi con un bus di "soli 2048 bit e con circa 600GB/s se usano le samsung da 600mhz, con consumi inferiori alle attuali vega 64, passando dai 250W ai 140-150W con prestazioni leggermente superiori...
un buon chippetto "medio" considerando che la concorrente diretta dovrebbe essere la 2070 (quindi una nominazione probabile potrebbe essere 690 e 690x), ma parliamo di 450/500 euro massimo per questa classe di GPU.
dipende quindi molto dalle rese dei 7nm e dalla disponibilità di wafer di TMSC su quelle linee...

insomma... 50:50 che la faranno uscire aspettando Navi, architettura che sembra essere più votata al mondo gaming/rendering.


Si credo che le future pro e frontier a 7 nm saranno diverse
A questo punto si aspetta il ces, Navi imho sarà qualcosa di rivisto, altrimenti questa mi60 non l'avrebbero chiamata vega.
Non so se hai notato che c'è anche una mi50 con 60 cu e non 56 come era logico aspettarsi
nickname8807 Novembre 2018, 13:07 #10
Originariamente inviato da: Gyammy85
In teoria siamo lì, 14,7 tf è la potenza di tu102 e compagnia
Ah ecco ora ricordo. Tu eri quello che faceva le comparative con i TF

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^