Flex FP: floating point per i futuri server AMD

AMD illustra alcune delle peculiarità tecnologie della propria Flex FP, unità di calcolo in virgola mobile che verrà integrata nelle future cpu basate su architettura Bulldozer

di Paolo Corsini pubblicata il 29 Ottobre 2010, alle 11:47 nel canale Private Cloud
AMD

Prototipo di display flessibile basato su tecnologia electrowetting

Adobe: interessanti novità riguardanti le tecnologie Flash

calabar29 Ottobre 2010, 14:28 #11

@coschizza
Sebbene il modulo sia l'unità costruttiva di Bulldozer, i core int per modulo sono di fatto due, cosa ben diversa dal singolo core con SMT degli attuali processori intel.

elessar29 Ottobre 2010, 14:31 #12

Una cosa che non comprendo è:

per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.

Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.

Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.

Perciò? A chi serviranno?

marchigiano29 Ottobre 2010, 15:00 #13

Originariamente inviato da: coschizza

per sfruttare le estensioni AVX bisogna cambiare il codice quindi dobbiamo aspettare che i programmi ne facciano uso e comunque è piu probabile vedere vantaggi prima sui desktop che sui server proprio perche gia adesso i programmatori di codec encoder ecc stanno lavorando su quento

con la speranza che non si creino conflitti con l'architettura BD, un bug è sempre dietro l'angolo, magari con le avx viene sfruttato un solo core logico oppure nelle istruzioni a 128bit la fpu non riesce a fare due calcoli in parallelo...

sarebbe un bel danno per amd nel segmento desktop

coschizza29 Ottobre 2010, 15:09 #14

Originariamente inviato da: elessar

Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.

Perciò? A chi serviranno?

solo una parte dei software possono essere adattati per sfruttare la GPGPU quindi devi avere alterantive per poter gestire tutte la possibilità che nel campo software sono molte

inoltre non pensare che una ruotine fatta per GPGPU dia risultati migliori della stessa eseguita sulla cpu, questo perche appunto non tutti i codici sono parralelizzabili ed eseguibili con la stessa efficienza sui vari sistemi

La prossima cpu intel sb ha messo in campo un esempio pratico di quello che ti sto dicendo, all'interno ha un encoder video hardware che occupa solo 3mm quadrati ed è composta solo da funzioni fisse come si faceva una volta, il risultato è che puo eseguire codifica di flussi video alla pari di una gpu che pero consuma 100 di piu con un costo infinitamente maggiore e un consumo di spazio sul die nemmeno confrontabile.

Quindi le sse, vmx ecc non sono sostituibili a prescindere da funzioni GPGPU perche poi a livello pratico possono essere piu sconvenienti in base a cosa devono eseguire

cionci29 Ottobre 2010, 15:16 #15

Originariamente inviato da: marchigiano

questa architettura bulldozer può andare per server e workstation, dove puoi ricompilare i software con le nuove istruzioni, ma nei computer che abbiamo a casa come si comporteranno?

Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.

Originariamente inviato da: elessar

Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.

Originariamente inviato da: marchigiano

Perché si dovrebbero creare conflitti ? E' una gufata ? Non capisco

La FPU di Bulldozer di fatto è una unità SMT, le istruzioni dei vari thread vengono mescolate ed in ogni istante ad un thread possono venire assegnate due unità FMAC, una unità FMAC o nessuna. Questo è appunto il motivo per cui si chiama Flex FP: cioè Flexible...

riuzasan29 Ottobre 2010, 16:57 #16

Originariamente inviato da: cionci

Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.

Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.

Perché si dovrebbero creare conflitti ? E' una gufata ? Non capisco

Ma infatti Cionci, io non capisco tutti questi commenti assurdi e fuori luogo.
AMD sta semplicemeno introducendo una FPU più avanzata e complessa che, nelle intenzioni di AMD, sarà la vera punta di diamante delle sue future CPU (oltre all'unità grafica integrata).

cionci29 Ottobre 2010, 18:37 #17

Diciamo che in Bulldozer le innovazioni sono tante. La FPU, se pur innovativa, è a tutti gli effetti una unità SMT, di conseguenza fino a quando sarà dedicata ad un solo thread le prestazioni saranno stratosferiche. Quando però sarà utilizzata contemporaneamente da entrambi i thread allora le prestazioni dovrebbero calare di una percentuale non indifferente.
Certo beccare due thread non concorrenti (se sono in concorrenza la probabilità che uno dei due sia bloccato aumenta) che utilizzano la FPU non è così frequente in un utilizzo comune di server e desktop, tranne forse nell'utilizzo multimediale, encoding soprattutto, visto che il decoding sarà sempre più spesso demandato alla GPU.
La novità più grossa secondo me sono i due core INT nella stessa CPU. Questa sì che è una novità addirittura epocale. Soprattutto visto che le prestazioni a parità di frequenza saranno nettamente superiori ad un dual core della generazione precedente, ma con uno spazio occupato nettamente inferiore.

yossarian31 Ottobre 2010, 15:15 #18

Originariamente inviato da: elessar

Originariamente inviato da: coschizza

Originariamente inviato da: cionci

Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.

Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.

come spiegato da coschizza, il gpgpu va bene solo in alcuni ambiti. Per il resto, il modello di programmazione delle gpu è troppo poco flessibile rispetto a quello delle cpu. Molto meglio avere una APU con cpu+gpu o cpu+fpu; in questo modo è possibile unire la potenza di calcolo di una unità fp dedicata con la flessibilità di una cpu. Al discorso flessibilità è legato anche quello relativo alla compatibilità. L'utilizzo di una gpu per calcoli gp obbliga al ricorso a middleware come CUDA, CAL o OpenCL

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Tesla Model 3 Performance

Maserati GranCabrio Folgore

05:51

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento

07:56

DJI Avata 2: il drone FPV accessibile ancora più sicuro e divertente

06:11

Automazione e precisione nei nuovi robot Dreame

Logitech Signature Combo MK950

Lenovo ThinkVision 3D 27, la steroscopia senza occhialini Primo contatto con il monitor Lenovo ThinkVision 3D 27 che grazie a particolari accorgimenti tecnici riesce a ricreare l'illusione della spazialità tridimensionale...

Recensione Zenfone 11 Ultra: il flagship ASUS ritorna a essere un 'padellone' Zenfone 11 Ultra ha tantissime qualità interessanti, fra cui potenza da vendere, un display di primissimo livello, un comparto audio potente e prestazioni di connettività...

Granblue Fantasy: Relink, un action RPG che vi sorprenderà - Recensione PS5 Dopo l'ottimo Versus: Rising, tocca a Relink espandere l'immaginario di Granblue Fantasy. Per il suo progetto più ambizioso, Cygames sceglie di esplorare (con grande...

Sony FE 16-25mm F2.8 G: meno zoom, più luce Il nuovo Sony FE 16-25mm F2.8G si aggiunge all'analogo 24-50mm per offrire una coppia di zoom compatti ma di apertura F2.8 costante, ideali per corpi macchina altrettanto...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Appian: non solo low code. La missione è l’ottimizzazione dei processi con l'IA Abbiamo partecipato ad Appian World 2024, evento dedicato a partner e clienti che si è svolto recentemente nei pressi di Washington DC, vicino alla sede storica...

La Formula E può correre su un tracciato vero? Reportage da Misano con Jaguar TCS Racing Abbiamo visto ancora una volta la Formula E da vicino, ospiti di Jaguar TCS Racing. In questa occasione però curve e rettilinei erano quelli di un circuito permanente,...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

Flex FP: floating point per i futuri server AMD

18 Commenti