Vor allem hat ja damals nicht nur Matt im GAF geschrieben das man aus der PS4 CPU mehr Draw Calls raus holen kann, sondern auch der Witcher 3 Dev im DF Interview damals meinte das die ONE schneller ins Draw Call limit läuft, auch wenn er gelobt hat das MS da dran arbeitet es stets zu verbessern mit DX12.
Ohne das es bisher eine andere Aussage gibt das MS Sony in dem bereich jetzt überholt hat, hat man nur die 10% mehr takt die immer noch dafür da seien könnte das sie eben auf selben Level sind oder leicht drüber.
Es war von 4Games (Metro Dev)
Digital Foundry: DirectX 11 vs GNMX vs GNM - what's your take on the strengths and weakness of the APIs available to developers with Xbox One and PlayStation 4? Closer to launch there were some complaints about XO driver performance and CPU overhead on GNMX.
Oles Shishkovstov: Let's put it that way - we have seen scenarios where a single CPU core was fully loaded just by issuing draw-calls on Xbox One (and that's surely on the 'mono' driver with several fast-path calls utilised). Then, the same scenario on PS4, it was actually difficult to find those draw-calls in the profile graphs, because they are using almost no time and are barely visible as a result.
In general - I don't really get why they choose DX11 as a starting point for the console. It's a console! Why care about some legacy stuff at all? On PS4, most GPU commands are just a few DWORDs written into the command buffer, let's say just a few CPU clock cycles. On Xbox One it easily could be one million times slower because of all the bookkeeping the API does.
Quelle:
http://www.eurogamer.net/articles/d...its-really-like-to-make-a-multi-platform-game
Die höhere Anzahl der ACEs in der PS4 war auch dafür da, die Draw Calls besser zu verarbeiten.
The original AMD GCN architecture allowed for one source of graphics commands, and two sources of compute commands. For PS4, we’ve worked with AMD to increase the limit to 64 sources of compute commands — the idea is if you have some asynchronous compute you want to perform, you put commands in one of these 64 queues, and then there are multiple levels of arbitration in the hardware to determine what runs, how it runs, and when it runs, alongside the graphics that’s in the system.
Quelle:
https://www.extremetech.com/gaming/...avily-modified-radeon-supercharged-apu-design
Das Absenden von Draw Calls ist aber natürlich nicht das einzige was eine CPU zu tun hat, die ist auch nicht mit vielen anderen Dingen beschäftigt und die Draw Calls machen im gesamten nur einen Teil aus. Selbst wenn, sagen wir mal, die Performance der Draw Call um 100% gestiegen ist, ist natürlich nicht die Performance der ganzen CPU um 100% gestiegen. Das gleiche bei einer besseren Kommunikation mit der GPU. Hier ist erst einmal festzuhalten, dass eine CPU zu mindestens 80% mit ihren eigenen Caches kommuniziert, dann ist die Anbindung am RAM relevant. Die eigentliche Kommunikation mit der GPU nimmt davon nur einen kleinen Teil ein. Also auch hier, eine Verbesserung in dem Bereich für nicht zu einen starken Leistungsanstieg der Gesamtleistung, und nein, es wird auch nichts addiert.
Zu erwähnen ist hier natürlich, dass Sony auch schon bei der PS4 auf eine gute Kommunikation zwischen CPU und GPU gesetzt hat. Damit konnte man aber nicht den Taktvorteil und die geringeren Latzenzen bei der One ausgleichen. Was mich gleich zum nächsten Punkt bringt.
Die One hatte einen CPU Vorteil gegenüber der PS4. Dieser resultiert einmal aus dem Taktvorteil von ~9% und einmal aus dem Gebrauch von DDR3, der geringere Latenzen aufweißt als GDDR5 der PS4. Die führt ca. zu einen Leistungsvorteil von 15%, nachzulesen
hier (Folie 15)
Diesen Vorteil hat MS bei der XOX natürlich nicht mehr, da man ebenfalls auf GDDR5 setzt. Der Vorteil zur Pro hätte sich gegenüber des Vorteils der One zur PS4 also gar verringert, von den ~15% auf ~8%, also musste sich MS wohl etwas einfallen lassen
"First, we added another bus to the GPU that allows it to read directly from system memory or write directly to system memory, bypassing its own L1 and L2 caches. As a result, if the data that's being passed back and forth between CPU and GPU is small, you don't have issues with synchronization between them anymore. And by small, I just mean small in next-gen terms. We can pass almost 20 gigabytes a second down that bus.
Quelle:
http://www.gamasutra.com/view/feature/191007/inside_the_playstation_4_with_mark_.php?print=1
The PS4 operates a system where memory is allocated either to the CPU or GPU, using two separate memory buses.
"One's called the Onion, one's called the Garlic bus. Onion is mapped through the CPU caches... This allows the CPU to have good access to memory," explains Jenner.
"Garlic bypasses the CPU caches and has very high bandwidth suitable for graphics programming, which goes straight to the GPU. It's important to think about how you're allocating your memory based on what you're going to put in there."
Ach ups, das war bei der PS4 :v: , ich meine jetzt da hier
“The other thing we did is improve our GPU to CPU coherent bandwidth. So the bandwidth between the CPU and the GPU is drastically improved as well,”
:v:
Es ist und bleibt also natürlich absoluter Schmarrn, dass die CPU der XOX hätte 50% mehr Leistung als die der Pro, wenn der Taktvorteil nur 8% beträgt, da Verbesserungen in Teilbereichen keine lineare Steigerung der Gesamtleistung bedeutet. Eine Solche Behauptung, und man bedenke dass der Faktor zwischen 50 und 8 6,25 beträgt, zeugt von relativ geringen Verständnis über die Arbeitsweise einer CPU. Dies dann damit zu überdecken, Sony würde Devs dafür bezahlen, dass man diese Vorteile nicht mitnimmt, ist natürlich schon eine absolute Frechheit.
Aber alles schreiben bringt auch nicht immer etwas: Gehen wir einmal anders heran, hätte XOX 50 -80% mehr CPU Leistung als die One und 50% mehr als die Pro, hätte MS sich auch nicht die Chance nehmen lassen dies zu kommunizieren.
(übrigens schon ein Knaller nebenbei zu behaupten, die Pro CPU wäre im worst case so schnell wie die One CPU -- aber da hat man ihn bestimmt wieder falsch verstanden und etwas in den Mund gelegt)