ConsoleWAR Current Gen Konsolen und Ihre Technik dahinter

Mal abgesehen vom Preis stellt sich auch die Frage wieviel RAM wirklich nötig sind, ohne auf "mehr ist immer besser" im Hinterkopf zu haben.

Gehen wir mal bei 24GB RAM von großzügigen 4GB Reservierung für´s OS aus, bleiben demnach 20GB als V-RAM übrig.

Nein, dann bleiben nicht 20GiB als V-RAM übrig ^^
 
Im KZSF pdf was letztens auch im ERA mal wieder vor geholt wurde, konnte man schön sehen wie schnell der RAM voll ist und auch ND war sehr froh nur die 0,5GB mehr zu bekommen mit der Pro da sie auch locker alles voll bekommen was sie nutzen können.
Jetzt lasst die Assets und Objekte in der Welt so ansteigen wie es pro neuer gen üblich ist und da können auch 16GB knapp werden imo.
 
Im KZSF pdf was letztens auch im ERA mal wieder vor geholt wurde, konnte man schön sehen wie schnell der RAM voll ist und auch ND war sehr froh nur die 0,5GB mehr zu bekommen mit der Pro da sie auch locker alles voll bekommen was sie nutzen können.
Jetzt lasst die Assets und Objekte in der Welt so ansteigen wie es pro neuer gen üblich ist und da können auch 16GB knapp werden imo.

Ist jetzt schon sogar der Fall bei FFXV xD
 
Im KZSF pdf was letztens auch im ERA mal wieder vor geholt wurde, konnte man schön sehen wie schnell der RAM voll ist und auch ND war sehr froh nur die 0,5GB mehr zu bekommen mit der Pro da sie auch locker alles voll bekommen was sie nutzen können.
Jetzt lasst die Assets und Objekte in der Welt so ansteigen wie es pro neuer gen üblich ist und da können auch 16GB knapp werden imo.

Mehr Objekte mit mehr verschiedenen Texturen, aufwendigere Geometrie, mehr und geschmeidigere Animationen, aufwendigerer Sound. Das alles in der Fülle kann schnell den RAM voll bekommen.
Nehmen wir Killzone von 2013 als Beispiel: Dort nimmt allein Sound, Meshes und Havok schon über 1GiB ein. Da hast du aber noch nicht einmal eine Fläche mit einer Textur gefüllt.
 
Gerade bei youtube gefunden:
Frage:
francescop1 vor 3 Tagen (bearbeitet)
Interesting views..How did you arrive at the 6x Ryzen 8 core advantage over the 8 core jaguar cpu by the way? I have been trying to find something to compare the jaguar cores to in terms of modern desktop CPUs. The only one I found was that 8 jaguar cores are about half the throughput of a 2nd gen desktop i5. Also I didn't get how you arrived at the 5x core advantage afforded by the jump from 16nm to 7nm? Would that imply that the ps5 would be 1.4flops X 3 X 5 = roughly 21 teraflops coming in 2019 or 2020? Sounds a bit too ambitious to me...


Antwort:
excellent questions. On the CPU front much to my embarrassment I simply multipy the 1 core times 1.4 increase in the IPC(inscructions per clock) over a jaguar core. I don't really know if that's the only performance increase but it's what I went with. second I doubled the clock frequency of the core from 1.6ghz of the standard Ps4 CPU to 3.2ghz for the Ps5 CPU that gets you almost 3 times. you double the figure one more time to account for dual threading(16 cores) and you get a close to 6 times increase in power. this doesn't even account for an increase in ram caches or other things like registers. So not a scientific calculation but it's what I'm going with. The jump in GPU transistor density is a lot easier to explain. 16nm squared is 256. 7nm squared is 49. so divide 256 by 49 and that's how much less space 7nm takes up than 16nm. there are also other factors to consider that could greatly alter the calculations. the biggest one being the actual ratio between the two processes and the layout of the circuits but it's a good overal guide. so if you can fit 40 functioning CUs in the 360mm SoC of the XBOX one X on a 16nm fab process than a 360mm SoC based on a would be able to house at least 200 CUs, not 80. if we simply multiply 6.01teraflops by 5.2 we get 31.2. and this doesn't take into account the increase in clock frequency that the new fab process will allow. if we allow for a modest 10% increase we get roughly 34.4. but most probably more. this is also assuming a vapor chamber solution is being used. but the really crazy part would be if we apply another 20% increase that the 7nm+ fab process is supposedly going to grant, you get 41.3teraflops. And that's without any further increase in frequency boost. I'm not sure how the 20% increase is gained so I didn't want to include it in my final figures. so when you take into account the original ps4's SoC size of 320mm you can easily arrive at a20 to 24 Teraflops estimate.
 
Einen gleichzeitiger Release 2020 sehe ich auch unproblematisch. Nur gleichzeitig 2019 wäre für MS ungünstig.
November 2020 wird die ONE 2 erscheinen. Da Wette ich drauf :)

Mit folgenden technischen Daten.

Fertigung in 7nm+ Verfahren. Chipfläche so wie ONE und ONE-X also ca. 360mm^2

CPU ZEN 8-Kerner mit SMT (also 16 virtuelle Prozessoren).
Takt. 3+ GHz.
CPU dürfte mindestens 3fache bis 5fache (bei Einsatz von SMT) Rechenleistung erreichen wie die ONE CPU

GPU: Jenseits von VEGA :)
80+ aktive CUs (88+ CUs von denen aufgrund erhöhter Chipausbeute 8 deaktiviert sind)
Takt: 1.5+ GHz
Somit Rechenleistung von 15,36TF+ (dazu eben die neuen Funktionen, die Vega und Nachfolger mit sich bringen.)

Speicher:
24 GiByte GDDR 6 an 384 bit Interface
Da die ersten GDDR6 Speicher zur Zeit die Datenrate ggü. GDDR5 Speicher verdoppeln, dürfte man mit einer Speicherbandbreite von 700+ Gbyte/sec rechnen.
24gb speicher ? dir ist schon klar das speicher so teuere geworden ist wie noch nie?
und 88cu in ngc architektur? glaub ich kaum limit liegt bei 64 rops und das ist schon gigantischer gpu in 7nm wird das teil nicht auf einmal doppelt so klin mal kleiner
um realiistisch zu bleiben solltest eher mit 11tf oder weniger rechnen denn nur weil der fertigung kleiner wird kann man gleich zig mal soviel recheneinheiter drauf kleistern
als vergleich was ne kline produktion grad mal bingt schau dir polaris und granada an

polaris10/20
144 TMUs
32 ROPs
36 CU
256 bit
232 mm² in 14nm
5,700 million transistoren


grenada
176 TMUs
64 ROPs
44 CU
512bit
438 mm² in 28m
6,200 million transistoren


polaris hat deutlich weniger rechen einheiten als ganada wie weniger cu, weniger tmus, weniger rops kein thruaudio und kleineren speicheranbindung
schaft es aber trozudem nicht die chip fläche zu halbieren
die anzahl der transitoren zeigt den unterschied in der atchitektur
je moderner die gpu desto mehr funktionen besitzt dieser, desto komplexer der aufbau der gpu und desto großer der die

fiji und vega sind da auch noch ne gutes beispiel

vega
484 mm² in 14nm
2048 bit
12,500 million transistoren


fiji
596 mm² in 28nm
4096 bit
8,900 million transistoren


vega u. fiji
TMUS gleichanzahl
ROPs gleichanzahl
CU gleiche anzahl


allein die technischen änderung in der architektur sorgen dafür das vega in 14nm fast so groß ist wie fiji in 28nm fertigung und das obwohl true audio bei vega nicht mehr vorhanden ist und die speicher anbindung bei vega nur halb so viel platz nutzt auf dem die nutzt da nur zwei stecks befeuert werden

klar wenn ihr nur nen xbox gpu in 7nm haben wollt ohne neuerungen dann geht die rechnung auf
aber wenn ne menge neuerungen von vega oder navi dazu kommen sollten wird man mehr für weitere funktionen auf dem die benötigen
dann wird halt der freigewordene platz durch die 7nm fertigung wie schon bei polaris und vega für andere sachen genutzt und nicht nur für CUs, ROPs oder TMUs
 
24gb speicher ? dir ist schon klar das speicher so teuere geworden ist wie noch nie?
und 88cu in ngc architektur? glaub ich kaum limit liegt bei 64 rops und das ist schon gigantischer gpu in 7nm wird das teil nicht auf einmal doppelt so klin mal kleiner
um realiistisch zu bleiben solltest eher mit 11tf oder weniger rechnen denn nur weil der fertigung kleiner wird kann man gleich zig mal soviel recheneinheiter drauf kleistern
als vergleich was ne kline produktion grad mal bingt schau dir polaris und granada an

polaris10/20
144 TMUs
32 ROPs
36 CU
256 bit
232 mm² in 14nm
5,700 million transistoren


grenada
176 TMUs
64 ROPs
44 CU
512bit
438 mm² in 28m
6,200 million transistoren


polaris hat deutlich weniger rechen einheiten als ganada wie weniger cu, weniger tmus, weniger rops kein thruaudio und kleineren speicheranbindung
schaft es aber trozudem nicht die chip fläche zu halbieren
die anzahl der transitoren zeigt den unterschied in der atchitektur
je moderner die gpu desto mehr funktionen besitzt dieser, desto komplexer der aufbau der gpu und desto großer der die

fiji und vega sind da auch noch ne gutes beispiel

vega
484 mm² in 14nm
2048 bit
12,500 million transistoren


fiji
596 mm² in 28nm
4096 bit
8,900 million transistoren


vega u. fiji
TMUS gleichanzahl
ROPs gleichanzahl
CU gleiche anzahl


allein die technischen änderung in der architektur sorgen dafür das vega in 14nm fast so groß ist wie fiji in 28nm fertigung und das obwohl true audio bei vega nicht mehr vorhanden ist und die speicher anbindung bei vega nur halb so viel platz nutzt auf dem die nutzt da nur zwei stecks befeuert werden

klar wenn ihr nur nen xbox gpu in 7nm haben wollt ohne neuerungen dann geht die rechnung auf
aber wenn ne menge neuerungen von vega oder navi dazu kommen sollten wird man mehr für weitere funktionen auf dem die benötigen
dann wird halt der freigewordene platz durch die 7nm fertigung wie schon bei polaris und vega für andere sachen genutzt und nicht nur für CUs, ROPs oder TMUs

Das passt schon. Warte nur ab :)
TMSC gibt selbst eine Steigerung der Transistordichte von 16nm auf 7nm von Faktor 3.2 an
von 14nm (VEGA) auf 7 (Next-Gen Konsolen) sind es schätzungsweise somit um Faktor 2.5 rum.

Das ist schon alles mit einberechnet.
Vor allem darfst du nicht die Größe einer PC GPU mit den Einheiten in einer Konsole-APU direkt vergleiche.

Bei VEGA z.B. kommt noch hinzu, dass die hohe Transistorzahl auch zum Teil der hohen Taktfrequenz geschuldet ist, welche mit dem Chip erreicht werden kann
Bei moderatem Takt, wie er in Konsolen üblich ist, fallen somit viele Transistoren weg, weil sie eben nicht nötig sind. Anstatt 12.5 Mrd. wären es nur noch ca. 10Mrd. Vega taktet bis zu 1546Mhz ohne Boost in 14nm
Bei 7nm ist dieser Takt aber ohne zusätzliche Transistoren, die die Stromverteilung regulieren, möglich. Und ich nehme ja einen Takt von 1500Mhz an.

Dein VEGA Beispiel würde unter Berücksichtigung dieser Faktoren weniger als 150mm^2 in 7nm Platz in Anspruch nehmen.
Die Shader nehmen natürlich davon nicht die ganze Fläche ein. Weiterhin befinden sich auf dem Chip auch noch viele Dinge, die in der Konsolen-APU nicht ausschließlich dem GPU Part zuzuordnen sind.

Jetzt schauen wir mal, wie viel Fläche die reinen Shadereinheiten in der ONE-X APU einnehmen.
Das sind ziemlich genau 145mm^2 der 360mm^2 des APU-DIE.

Die reinen Shader bei VEGA nutzen ca. 62% der Fläche (mit den oben erwähnten zusätzlichen Transistoren für höheren Takt). Also nach Abzug der überflüssigen Transistoren würden die 64CUs bei 14nm ungefähr 247mm^2 ausmachen. Auf 7nm runtergerechnet (mit Faktor 2.5 gerechnet) verbleiben ca. 100mm^2

Somit würde auf die Fläche, welche zur Zeit die Shader auf dem ONE-X Die einnehmen (die 145mm^2) ca. 93 Vega-CUs Platz haben.
Die CPU, sollte es sich um einen 8Kern Zen handeln, wird aber größer ausfallen als die Jaguar-Cores auf dem ONE-X Die.
Aber nicht viel größer. Auch hier darf man natürlich nicht das gesammte Ryzen-DIE mit den reinen CPU-Part der Konsolen-APUs gleichsetzten.
Durch den kleineren Fertigungsprozess fallen natürlich auch alle anderen Bereiche auf der APU kleiner aus. Die können dann entweder für sonstige Erweiterungen genutzt werden oder eben für mehr Shader einheiten.
80 (88) CU Einheiten auf Vega oder Nachfolger Niveau halte ich somit für durchaus realisierbar :)

PS: Als Beispiel kann man auch die Polaris GPUs nehmen.
Polaris 10/20 z.b verfügt über 36CUs. Der Chip ist 232mm^2 groß in 14nm
Das ONE-X DIE ist wie gesagt 360mm^2 groß und wird in 16nm gefertigt.
Die reine Fläche der CUs betraägt wie erwähnt bei der ONE-X 145mm^2 und darauf sind gar 44CUs untergebracht.
Vorher hätte wohl auch jeder gesagt, dass auf das ONE-X DIE unmöglich 44 CUs passen dürften.

Man kann also nicht einfach die einzelnen DIE Flächen der PC GPU und der Konsolen-APU vergleichen
 
Zuletzt bearbeitet:
Das passt schon. Warte nur ab :)
TMSC gibt selbst eine Steigerung der Transistordichte von 16nm auf 7nm von Faktor 3.2 an
von 14nm (VEGA) auf 7 (Next-Gen Konsolen) sind es schätzungsweise somit um Faktor 2.5 rum.

Das ist schon alles mit einberechnet.
Vor allem darfst du nicht die Größe einer PC GPU mit den Einheiten in einer Konsole-APU direkt vergleiche.

Bei VEGA z.B. kommt noch hinzu, dass die hohe Transistorzahl auch zum Teil der hohen Taktfrequenz geschuldet ist, welche mit dem Chip erreicht werden kann
Bei moderatem Takt, wie er in Konsolen üblich ist, fallen somit viele Transistoren weg, weil sie eben nicht nötig sind. Anstatt 12.5 Mrd. wären es nur noch ca. 10Mrd. Vega taktet bis zu 1546Mhz ohne Boost in 14nm
Bei 7nm ist dieser Takt aber ohne zusätzliche Transistoren, die die Stromverteilung regulieren, möglich. Und ich nehme ja einen Takt von 1500Mhz an.

Dein VEGA Beispiel würde unter Berücksichtigung dieser Faktoren weniger als 150mm^2 in 7nm Platz in Anspruch nehmen.
Die Shader nehmen natürlich davon nicht die ganze Fläche ein. Weiterhin befinden sich auf dem Chip auch noch viele Dinge, die in der Konsolen-APU nicht ausschließlich dem GPU Part zuzuordnen sind.

Jetzt schauen wir mal, wie viel Fläche die reinen Shadereinheiten in der ONE-X APU einnehmen.
Das sind ziemlich genau 145mm^2 der 360mm^2 des APU-DIE.

Die reinen Shader bei VEGA nutzen ca. 62% der Fläche (mit den oben erwähnten zusätzlichen Transistoren für höheren Takt). Also nach Abzug der überflüssigen Transistoren würden die 64CUs bei 14nm ungefähr 247mm^2 ausmachen. Auf 7nm runtergerechnet (mit Faktor 2.5 gerechnet) verbleiben ca. 100mm^2

Somit würde auf die Fläche, welche zur Zeit die Shader auf dem ONE-X Die einnehmen (die 145mm^2) ca. 93 Vega-CUs Platz haben.
Die CPU, sollte es sich um einen 8Kern Zen handeln, wird aber größer ausfallen als die Jaguar-Cores auf dem ONE-X Die.
Aber nicht viel größer. Auch hier darf man natürlich nicht das gesammte Ryzen-DIE mit den reinen CPU-Part der Konsolen-APUs gleichsetzten.
Durch den kleineren Fertigungsprozess fallen natürlich auch alle anderen Bereiche auf der APU kleiner aus. Die können dann entweder für sonstige Erweiterungen genutzt werden oder eben für mehr Shader einheiten.
80 (88) CU Einheiten auf Vega oder Nachfolger Niveau halte ich somit für durchaus realisierbar :)

PS: Als Beispiel kann man auch die Polaris GPUs nehmen.
Polaris 10/20 z.b verfügt über 36CUs. Der Chip ist 232mm^2 groß in 14nm
Das ONE-X DIE ist wie gesagt 360mm^2 groß und wird in 16nm gefertigt.
Die reine Fläche der CUs betraägt wie erwähnt bei der ONE-X 145mm^2 und darauf sind gar 44CUs untergebracht.
Vorher hätte wohl auch jeder gesagt, dass auf das ONE-X DIE unmöglich 44 CUs passen dürften.

Man kann also nicht einfach die einzelnen DIE Flächen der PC GPU und der Konsolen-APU vergleichen
transistoren des chips nutzen für höheren takt ?
die haben mehr transistoren damit sie neue funktionen wie doppelte leistung bei fp16, primitive shader oder conservative rasterization können
sache die es halt bei gcn3/4 noch nicht gab

tonga und tahiti ist da noch nen geiles beispiel das zeigt das architektur änderungen upgrade mehr platz brauchen

beide haben:
28nm
shader 2048
TMUs 128
ROPs 32
CUs: 32
384 bit


tonga xt gcn 3
366 mm²
5,000 million transistoren


tahiti xtl gcn 1
352 mm²
4,313 million transistoren


der unterschied liegt im architektur tonga hat deutlich bessere tessellation leistung delta color compresion
der andereung an den shadern aufbau hat den chip halt größer gemacht

nen fiji chip ohne architekur änderung würde unter 14nm nur 290-305mm² groß sein
vega 10 hingegen der von den eckdaten der selbe ist aber in 14nm schon 484mm² groß obwohl andere bauteile des chips wie true audio oder die 3te und 4te ram anbindung fehlen was den chip eigentlich noch kleiner hätte machen müste

ihr macht eure michmädchen rechnung immer auf veraltet architekturen der xbo x gpu ist ne abgespekte gcn4, vege shader sind komplexer aufgebaut sie haben mehr funktionendaher benötigen mehr transistoren und auchn mehr platz
bei navi wird es wohl wieder das selben sein noch komplexer noch mehr platz wird für die shader benötigt usw..

zumden noch die sache mit den CUs gcn/ngc das limit scheint bei 64 CUs zu liegen und bisher gab es kein gpu apu von amd die mehr als 64 CU hatte
man hat zwar die tmu anzahl erhöhen können aber derpixeldurchsatz hat sich nicht groß geändert seit 2015

@XBO x bin mir sicher das es nicht 161mm² für die shader sind nicht 145mm²
 
Ja, GCN soll seine Leistung schlecht mit der Anzahl der CUs skalieren. Mal sehen ob AMD das mit Navi lösen kann.
 
transistoren des chips nutzen für höheren takt ?
die haben mehr transistoren damit sie neue funktionen wie doppelte leistung bei fp16, primitive shader oder conservative rasterization können
sache die es halt bei gcn3/4 noch nicht gab

tonga und tahiti ist da noch nen geiles beispiel das zeigt das architektur änderungen upgrade mehr platz brauchen

beide haben:
28nm
shader 2048
TMUs 128
ROPs 32
CUs: 32
384 bit


tonga xt gcn 3
366 mm²
5,000 million transistoren


tahiti xtl gcn 1
352 mm²
4,313 million transistoren


der unterschied liegt im architektur tonga hat deutlich bessere tessellation leistung delta color compresion
der andereung an den shadern aufbau hat den chip halt größer gemacht

nen fiji chip ohne architekur änderung würde unter 14nm nur 290-305mm² groß sein
vega 10 hingegen der von den eckdaten der selbe ist aber in 14nm schon 484mm² groß obwohl andere bauteile des chips wie true audio oder die 3te und 4te ram anbindung fehlen was den chip eigentlich noch kleiner hätte machen müste

ihr macht eure michmädchen rechnung immer auf veraltet architekturen der xbo x gpu ist ne abgespekte gcn4, vege shader sind komplexer aufgebaut sie haben mehr funktionendaher benötigen mehr transistoren und auchn mehr platz
bei navi wird es wohl wieder das selben sein noch komplexer noch mehr platz wird für die shader benötigt usw..

zumden noch die sache mit den CUs gcn/ngc das limit scheint bei 64 CUs zu liegen und bisher gab es kein gpu apu von amd die mehr als 64 CU hatte
man hat zwar die tmu anzahl erhöhen können aber derpixeldurchsatz hat sich nicht groß geändert seit 2015

@XBO x bin mir sicher das es nicht 161mm² für die shader sind nicht 145mm²

Wie gesagt, du versteifst dich viel zu sehr an aktuellen PC Daten und ziehst meiner Meinung nach dadurch falsche Schlüsse.

Klar kosten neue Funktionen mehr Transistoren. Aber es werden eben auch viele Funktionen durch andere effizientere ersetzt. Das Transistorbudget muss somit nicht zwangsweise in allen Bereichen ansteigen. Außerdem habe ich doch schon die aktuelle VEGA Größe mit einberechnet. Was dann Navi oder sonstiger Vega Nachfolger dann bringt, wird man erst mal sehen müssen.

Die Speicheranbindung ist auch eine andere. HBM ist viel aufwändiger auf dem Chip zu implementieren, da es auch viel mehr Leitungen als eine normale GDDR5/6 Anbindung benötigt. Diese fallen somit bei der ONE 2 weg, da sie nach den Stellenausschreibungen wohl GDDR6 Speicher nutzt und nicht HBM2.

Und mit dem höheren Takt und den daraus resultierenen höheren Transistorbudget ist nicht auf meinem Mist gewachsen. Das hat AMD höchstpersönlich gesagt. http://www.pcgameshardware.de/Vega-...n-RX-Vega-GPU-Takt-Transistoren-DSBR-1234572/

Meine Rechnung zu den CU Größen kann auch jeder selber nachvollziehen. Genug Bilder zu den einzelen Chips gibts zu genüge im Netzt.
Hier eins von der ONE-X APU. Beim Wissen über die Größe dieses DIE (nämlich 360mm^2) kann man sich den Rest einfach selbst ausrechnen.
https://www.heise.de/newsticker/mel...r-Xbox-One-X-3809062.html?hg=1&hgi=0&hgf=true
Bei den 145mm^2 habe ich sogar die grünen Balken kurz vor den oberen und unteren Rändern, die wohl nicht direkt zu den CUs gehören, dazugerechnet.

Was die 64CUs Grenze angeht, wird das auch nur eine temporäre Blockade darstellen. Wäre ja bitter, wenn das für alle Zeiten die absolute Obergrenze darstellen würde :)
Ich gebe dir recht, dass für einen 2019 Release hier wohl Ende im Gelände ist. Für 2020 sollte aber sollte es wohl möglich sein. MS wird sicherlich mit der ONE 2 die leistungstechnische Krone zurück erobern wollen. Das steht sicherlich ganz oben auf deren To do Liste.
 
Welche Vorteile bringt denn jetzt eine Konsolen APU im Vergleich zu getrennten CPU und GPU Chips? Das war doch bei der PS4 / XBox One damals auch ein großer Aufhänger, dass man die Leistung einer APU eben nicht 1:1 mit den Rohleistungen der CPU und GPU gleichsetzen kann.
 
Welche Vorteile bringt denn jetzt eine Konsolen APU im Vergleich zu getrennten CPU und GPU Chips? Das war doch bei der PS4 / XBox One damals auch ein großer Aufhänger, dass man die Leistung einer APU eben nicht 1:1 mit den Rohleistungen der CPU und GPU gleichsetzen kann.

Kurz gesagt: Effizienz.
Da beide Hauptkomponenten sich auf einem Chip befinden fallen viele Interfacebaugruppen weg, die man bei getrennten Chips in diese einbauen muss. Weiterhin sind die Leitungswege kürzer, was bei den hohen Taktfrequenzen und den physikalischen Limitieungen der Laufzeit von Vorteil ist.
Auf der anderen Seite kann man aber eben nicht die gleiche Rechenleistung erzielen wie bei getrennten Einheiten.

Bei einer Konsole muss man Kompromisse eingehen was Leistung und Preis angeht. Würde der Preis keine Rolle spielen, würden auch Konsolen keine APUs verwenden.

Vor ONE / PS4 gab es zwar auch schon APUs, die konnte man aber bedenkenlos als Krüppel bezeichnen. Einsatz waren Low Budget Notebooks z.B.
 
Also könnte es sein, dass man bei der neuen Generation wieder dediziert getrennte CPU / GPU- Lösungen einbaut?

Ja, aber eher unwahrscheinlich.
Der Zug der dedizierten Hardware ist bei Konsolen abgefahren und aufgrund der leistungsfähigen APUs auch unnötig geworden.
Vor allem sind die Hardwaresubventionen, die Sony und MS für ihre Konsolen bei Launch eingeplant hatte, mit der Zeit gesunken.
Niemand will mehr mehrere hundert Dollar pro Konsole, wie z.B. Sony bei Einführung der PS3, subventionieren.
Selbst mit einer APU bleiben wohl kleine Subventionen zum Start der Konsolen nicht aus, will man nicht die kategorische Preisgrenze von derzeit 400-500 Dollar überschreiten.
 
Anandtech: TSMC Kicks Off Volume Production of 7nm Chips
https://www.resetera.com/threads/anandtech-tsmc-kicks-off-volume-production-of-7nm-chips.38495/

7nm+ wohl auch gut im Plan für Mitte 2019

Hört sich doch gut an.
Also von 16ff (ONE X) zu 7 bereits 70% oder Faktor 3.3 Platzersparnis.
7ff soll dann noch mal 20% Einsparungen zum normalen 7nm Prozess bringen.
Macht dann also insgesamt mehr als Faktor 4 ggü. 16ff

Dazu noch mehr als 60% Einsparung beim Stromverbrauch oder mehr als 30% höherer Takt bei gleicher DIE-Fläche. Oder natürlich ein Gemisch von Beiden :)
Gute Voraussetzungen für eine Next-Gen Ende 2020.
 
Wie gesagt, du versteifst dich viel zu sehr an aktuellen PC Daten und ziehst meiner Meinung nach dadurch falsche Schlüsse.

Klar kosten neue Funktionen mehr Transistoren. Aber es werden eben auch viele Funktionen durch andere effizientere ersetzt. Das Transistorbudget muss somit nicht zwangsweise in allen Bereichen ansteigen. Außerdem habe ich doch schon die aktuelle VEGA Größe mit einberechnet. Was dann Navi oder sonstiger Vega Nachfolger dann bringt, wird man erst mal sehen müssen.

Die Speicheranbindung ist auch eine andere. HBM ist viel aufwändiger auf dem Chip zu implementieren, da es auch viel mehr Leitungen als eine normale GDDR5/6 Anbindung benötigt. Diese fallen somit bei der ONE 2 weg, da sie nach den Stellenausschreibungen wohl GDDR6 Speicher nutzt und nicht HBM2.

Und mit dem höheren Takt und den daraus resultierenen höheren Transistorbudget ist nicht auf meinem Mist gewachsen. Das hat AMD höchstpersönlich gesagt. http://www.pcgameshardware.de/Vega-...n-RX-Vega-GPU-Takt-Transistoren-DSBR-1234572/

Meine Rechnung zu den CU Größen kann auch jeder selber nachvollziehen. Genug Bilder zu den einzelen Chips gibts zu genüge im Netzt.
Hier eins von der ONE-X APU. Beim Wissen über die Größe dieses DIE (nämlich 360mm^2) kann man sich den Rest einfach selbst ausrechnen.
https://www.heise.de/newsticker/mel...r-Xbox-One-X-3809062.html?hg=1&hgi=0&hgf=true
Bei den 145mm^2 habe ich sogar die grünen Balken kurz vor den oberen und unteren Rändern, die wohl nicht direkt zu den CUs gehören, dazugerechnet.

Was die 64CUs Grenze angeht, wird das auch nur eine temporäre Blockade darstellen. Wäre ja bitter, wenn das für alle Zeiten die absolute Obergrenze darstellen würde :)
Ich gebe dir recht, dass für einen 2019 Release hier wohl Ende im Gelände ist. Für 2020 sollte aber sollte es wohl möglich sein. MS wird sicherlich mit der ONE 2 die leistungstechnische Krone zurück erobern wollen. Das steht sicherlich ganz oben auf deren To do Liste.
doch es steigt ich hab dir gut drei beispiele genannt die das belegen bei gcn bei dem eue funktioen mehr transistoren brauchen
und was die speicher anbindung angeht hbm ist einfacher auf dem chip unterzubringen und braucht auch weit weniger platz
schau hier fiji und hier tonga als beispiel

hier bei tonga die 6x64bit controller
8wdx7ciy.jpg

hier bei fiji die 4x1024bit controller
b7rlj34k.jpg

polaris 10/20 braucht z.b noch mehr platz für die controller 8x32bit aud dem die
kurz und knapp gddr controller brauchten sehr viel platz als hbm nur ist hbm wegen dem interposer teurer in der produnktion denn diese kostenfaktor fehlt bei g/ddr ram einfach

zu der xbo x die shot
dir aber schon klar das das hier alles dazu gehöhrt? du kannst nicht einfach nur die fläche der cu nehmen die rops und das front end gehören zusammen
U5dtwAhnEvPfzBLJVRgbyHDMt2PjWoX_1680x8400

frond end und die rops kann nicht einfach aus der rechnung rauslassen das gehört zum rechen werk der gpu und auch gut zu sehen ist auf diesem bild wie unglaublich viele platz der controller einnimmt

was die CUs angeht zeit wird es zeigen den bisher gabs seiten amd nix dazu aber fakt ist mehr als 64ROPs 64CUs mit je 64 shadern drin gab bisher nicht
kann ja sein das amd erst wieder mit 128 rops mehr cus ins spiel bringt oder das sie einfach die shader pro cu erhöhen von 64 auf 128
so gesehen gibts da schon komische settings in der letzten zeit bei amd
die pro z.b hat doppelt so viele ROPs wie die xbox

xbo x
32ROPs (37;5gps)
pro
64ROPs (58,3gp/s)
 
doch es steigt ich hab dir gut drei beispiele genannt die das belegen bei gcn bei dem eue funktioen mehr transistoren brauchen
und was die speicher anbindung angeht hbm ist einfacher auf dem chip unterzubringen und braucht auch weit weniger platz
schau hier fiji und hier tonga als beispiel

hier bei tonga die 6x64bit controller
8wdx7ciy.jpg

hier bei fiji die 4x1024bit controller
b7rlj34k.jpg

polaris 10/20 braucht z.b noch mehr platz für die controller 8x32bit aud dem die
kurz und knapp gddr controller brauchten sehr viel platz als hbm nur ist hbm wegen dem interposer teurer in der produnktion denn diese kostenfaktor fehlt bei g/ddr ram einfach

zu der xbo x die shot
dir aber schon klar das das hier alles dazu gehöhrt? du kannst nicht einfach nur die fläche der cu nehmen die rops und das front end gehören zusammen
U5dtwAhnEvPfzBLJVRgbyHDMt2PjWoX_1680x8400

frond end und die rops kann nicht einfach aus der rechnung rauslassen das gehört zum rechen werk der gpu und auch gut zu sehen ist auf diesem bild wie unglaublich viele platz der controller einnimmt

was die CUs angeht zeit wird es zeigen den bisher gabs seiten amd nix dazu aber fakt ist mehr als 64ROPs 64CUs mit je 64 shadern drin gab bisher nicht
kann ja sein das amd erst wieder mit 128 rops mehr cus ins spiel bringt oder das sie einfach die shader pro cu erhöhen von 64 auf 128
so gesehen gibts da schon komische settings in der letzten zeit bei amd
die pro z.b hat doppelt so viele ROPs wie die xbox

xbo x
32ROPs (37;5gps)
pro
64ROPs (58,3gp/s)

Was die Fläche der Speicherinterfaces angeht, hatte ich das anders in Erinnerung. Deine Shots zeigen aber, dass HBM wohl tatsächlich einiges weniger an Platz verbraucht.

Zur Fläche der Grafikeinheit.
Klar weiß ich, dass hierzu nicht nur die CUs gehören. Aber diese sind am Einfachsten auf den DIE-Shots zu erkennen
Dein Shot des ONE-X Die kannte ich noch nicht. Ist sehr schön detailiert beschriftet.
Anhand dessen sehe ich gerade, dass ich bei der ONE-X die ROPS bereits mit eingerechnet habe. Nur das Front-End nicht. Das fehlt aber auch bei der Vega-Berechung.
Bei der Rechnung zwischen Vega und ONE-X habe ich aber auch bei VEGA nur die CU-Fläche berechnet. Somit ist ein Vergleich beider Die-Flächen schon möglich.

Zu den ROPs.
Die Pro hat ja einfach nur eine zweite GPU-Einheit, gespiegelt zur ersten. Somit auch doppelt so viele ROPs.
Jede GPU-Einheit verfügt über 20 CUs (2 deaktivert)
Ist natürlich die Frage, ob das nicht problemlos auch mit größeren CU-Clustern möglich ist, so dass die Gesamtzahl der CUs auf diesem Weg die 64CU Grenze sprengen kann,

Wenn das nicht geht und AMD bis nächstes Jahr auch die normale 64 CU Grenze nicht überwindet, sieht es natürlich für die Next-Gen, aber auch für zukünftige PC-Grafikkarten, mau aus.

Glaube kaum, dass in den Konsolen der GPU Takt signifikant über 1500Mhz, auch bei 7ff Fertigung liegen wird. Somit wären bei 64 CUs natürlich nur eine begrenzte Rechenleistung von maximal knapp 13TF möglich.
Ist natürlich ggü. den Leistungen der derzeitigen Standardkonsolen eine saubere Mehrleistung. Die Verbesserungen der einzelenen Einheiten sind natürlich auch noch zu berücksichtigen.

Ich sag somit.
Release Ende 2019: Maximal 64CUs
Release Ende 2010: Durchbrechung der Schallmauer und 80 CUs :)
 
Zuletzt bearbeitet:
Ich sehe max. 13 Tf als vollständig ausreichend an, sofern neueste Features verbaut sind, und eine Verschiebung zugunsten der CPU im Verhältnis zur GPU mittels ausreichend Ram (hoffe auf 24GB GDDR6) vollzogen wird, sprich 1-2Tf CPU, das wär dochmal fett.

Und somit wäre Ende 2019 der Nextgen Standart fest, denn die Ps5 wäre eh dann das Maß, an dem sich orientiert würde, die Thirds betreffend, was Sonys Exclusives da rausholen können, kann man derzeit an God of War erahnen, multipliziert um ca. Faktor 10 (ggü. der Ps4), aufgrund der moderneren Features (neben reinen Zahlen) die ich jetzt mit reingerundet habe. ;)
 
Zurück
Top Bottom