ConsoleWAR Current Gen Konsolen und Ihre Technik dahinter

Nullpointer · 17 Aug 2020

123vorbei schrieb:
Naja, beide Konsolen haben schon mehr RT Power als eine RTX 2080 Ti.

Schöne Träume.

123vorbei · 17 Aug 2020

Brod schrieb:
Wie kommt man auf die Idee?

RT läuft bei RDNA 2 über die TMUs in denen 4 Intersection Engines pro CU eingebettet sind.
Die SX schafft 380 Ray-Triangle-Intersections und die PS5 321. Die 380 sind von MS schon so genannt worden.
CU * 4 * Takt

Verglichen mit Nvidia sind das 38 bzw. 32 Gigarays vs 10 Gigarays der 2080 Ti. Also Faktor 3-4 schneller.
Aufgrund der hardwarenäheren Programmierung bekommen beide das auch ohne Murren auf die Straße.

Noch weiß man nicht wie RT in RDNA 2 umgesetzt wurde aber nach MS aussagen, Cernys Aussagen und den Patenten schon.

Con$olef@natic · 17 Aug 2020

Die 2060 hat bessere performance als die XsX in Minecraft gezeigt. Ne 2080Ti ist nochmal ne ganz andere Liga.
Wie schon gesagt, Lederjacke hat nicht unrecht das er sich 10 Jahre vorraus sieht in sachen RT als AMD.

123vorbei · 17 Aug 2020

Con$olef@natic schrieb:
Die 2060 hat bessere performance als die XsX in Minecraft gezeigt. Ne 2080Ti ist nochmal ne ganz andere Liga.
Wie schon gesagt, Lederjacke hat nicht unrecht das er sich 10 Jahre vorraus sieht in sachen RT als AMD.

Abwarten. Klar Ampere kommt mit mind. über 100 Gigarays um die Ecke, da wirken die 10 Gigarays sehr schnuckelig. So wie die ~ 1,3 Gigarays der GTX 1080 Ti.

Con$olef@natic · 17 Aug 2020

Wo hast du her das Ampere 10x RT Performance wie Turing hat

Ich glaub nicht das du weißt wieviel sie wegen den shrink max auf den chip bekommen können.
Das optimistischste Gerücht meinte doppelte RT performance

123vorbei · 17 Aug 2020

Con$olef@natic schrieb:
Wo hast du her das Ampere 10x RT Performance wie Turing hat
Ich glaub nicht das du weißt wieviel sie wegen den shrink max auf den chip bekommen können.
Das optimistischste Gerücht meinte doppelte RT performance

Echt? Nur 20 Gigarays? Sollte das stimmen mit den RDNA 2 Patenten PS5 32 Gigarays vs. 20 Gigarays in Ampere erscheint mir recht wenig. Klar Ampere wird trotzdem besser sein aber nur doppelt?
Aber kann sein das du recht hast, da NVIDIA auch Tensor Cores einbauen wird damit DLSS, was eigentlich viel wichtiger ist, weiter vorangetrieben wird. Frisst als Diefläche.
Die 100 Gigarays waren lediglich eine Vermutung meinerseits.
Da bin ich aber ein bisschen über das Ziel hinausgeschossen. :awesome:

Wobei es gibt Gerüchte um einen Traversal Co-processor der auf RT ausgelegt ist um RT massiv zu beschleunigen., hat sich aber als falsch erwiesen.

Warten wir mal ab wenn AMD endlich mal RDNA 2 zeigt.

Ampere soll ja schon Anfang September gezeigt werden.

PS: Heute ist die Hot Chips Conference bei der MS die SX APU näher vorstellen wird. Kann sein das wir mehr über RT und die Sauce erfahren.

Con$olef@natic · 17 Aug 2020

Der fehler an deinem RDNA2 patent ist, das Gigarays von NV stammen und keine allgemeine bezeichnung für RT Leistung ist

Diese Buzz word hat sich NV nur ausgedacht um es den Leuten anhand von daten klar zu machen und da machen sie nicht mal ein Geheimnis drum.
Irgendwie müssen sie ja weitere sprünge auf zeigen in nummern statt groß mit strahlen pro sec rum zu hantieren.
Was schließen wir draus, das Patent in denen du 32 Gigarays bei der PS5 gesehen hast, ist sehr wahrscheinlich nicht echt :ol:

New · 17 Aug 2020

Danke
@Xyleph @Macros @OVERLORD1 und @123vorbei

Das hört sich sehr gut an...

123vorbei · 17 Aug 2020

Con$olef@natic schrieb:
Der fehler an deinem RDNA2 patent ist, das Gigarays von NV stammen und keine allgemeine bezeichnung für RT Leistung ist
Diese Buzz word hat sich NV nur ausgedacht um es den Leuten anhand von daten klar zu machen und da machen sie nicht mal ein Geheimnis drum.
Irgendwie müssen sie ja weitere sprünge auf zeigen in nummern statt groß mit strahlen pro sec rum zu hantieren.
Was schließen wir draus, das Patent in denen du 32 Gigarays bei der PS5 gesehen hast, ist sehr wahrscheinlich nicht echt

Wie gesagt abwarten.
Aber 38 Gigarays wurden von MS bestätigt.
Und 38 vs 10 geht klar an die Series X und die PS5 mit wahrscheinlichen 32 also auch höher als 10. Klar ist nur die reine Rohleistung von RT im Vergleich zur RTX 2080 Ti. Wenn die 40 Rays von dir stimmen oder den Gerüchten nach, stehen die beiden Konsolen nicht schlecht da, gemessen an der reinen Rohdaten.
Die frage ist halt wie sie es auf die Straße bringen werden.

Das eine RTX 2060 besser performt als die SX, liegt wohl eher daran, dass die APIs der SX noch nicht so weit oder gut optimiert sind.
Cerny sprach ja von einer fantastischen Implementierung von RT with modest costs.

Beide Konsolen sind rein von den rohen Daten einer RTX 2080 Ti überlegen. Nur wie wird die real Performance sein. Das muss man abwarten.

Con$olef@natic · 17 Aug 2020

Wo wurden 38 Gigarays bestätigt?

nochmal NV nutzt diesen ausdruck bisher nur.

Das einzige was man von den XsX daten kennt ist die Maschine learning performance gegen Turing, und da ist ne 2060 schon doppelt so schnell.
Big navi mit 80CU wird da wohl auch nicht ran kommen

Daten von DF

Just to add a little perspective to the Series X "Machine Learning Performance":

XSX
INT8 = 49 TOPS
INT4 = 97 TOPS

RTX 2080Ti Founders Edition
INT8 = 227.7 TOPS
INT4 = 455.4 TOPS

RTX 2080 Founders Edition
INT8 = 169.6 TOPS
INT4 = 339.1 TOPS

RTX 2070 Founders Edition
INT8 = 126 TOPS
INT4 = 252.1 TOPS

RTX 2060
INT8 = ~100 TOPS
INT4 = ~200 TOPS

So yeah, around half that of a RTX 2060. Don't know how significant this really is and how this is going to play out.

Edit:

PS5 sieht im vergleich so aus mit RDNA2 unoffiziel bisher, man weiß nur das Maschine learning von Cherny bestätigt wurde in nem Interview

And if it has INT8 and INT4 (running at 2.23Ghz):
INT8 -> 36CU * 512 op per clock * 2230Mhz = 41.1TOPS
INT4 -> 36CU * 1024 op per clock * 2230Mhz = 82.2TOPS

Scaliert halt wie RT

123vorbei schrieb:
Beide Konsolen sind rein von den rohen Daten einer RTX 2080 Ti überlegen. Nur wie wird die real Performance sein. Das muss man abwarten.

Nein, erkundige dich erst mal über eine 2080Ti

123vorbei · 17 Aug 2020

Con$olef@natic schrieb:
Wo wurden 38 Gigarays bestätigt? nochmal NV nutzt diesen ausdruck bisher nur.

Das einzige was man von den XsX daten kennt ist die Maschine learning performance gegen Turing, und da ist ne 2060 schon doppelt so schnell.
Big navi mit 80CU wird da wohl auch nicht ran kommen
Daten von DF

Just to add a little perspective to the Series X "Machine Learning Performance":

XSX
INT8 = 49 TOPS
INT4 = 97 TOPS

RTX 2080Ti Founders Edition
INT8 = 227.7 TOPS
INT4 = 455.4 TOPS

RTX 2080 Founders Edition
INT8 = 169.6 TOPS
INT4 = 339.1 TOPS

RTX 2070 Founders Edition
INT8 = 126 TOPS
INT4 = 252.1 TOPS

RTX 2060
INT8 = ~100 TOPS
INT4 = ~200 TOPS

So yeah, around half that of a RTX 2060. Don't know how significant this really is and how this is going to play out.

Edit:

PS5 sieht im vergleich so aus mit RDNA2 unoffiziel bisher, man weiß nur das Maschine learning von Cherny bestätigt wurde in nem Interview

And if it has INT8 and INT4 (running at 2.23Ghz):
INT8 -> 36CU * 512 op per clock * 2230Mhz = 41.1TOPS
INT4 -> 36CU * 1024 op per clock * 2230Mhz = 82.2TOPS

Scaliert halt wie RT

Nein, erkundige dich erst mal über eine 2080Ti

Nein eben nicht.
Digital Foundry hat selbst die 38 Gigarays von MS bestätigt.

Weiterleitungshinweis

380 Milliarden Schnittpunktberechnungen vs 100 Milliarden Schnittpunktberechnungen.

Kläre mich auf was das bedeutet.

Die TOPs von der PS5 reichen wohl nicht für DLSS.
Aber besser als nichts.

Con$olef@natic · 17 Aug 2020

Nochmal, erkundige dich erst mal über die 2080Ti und was NV bei Gigarays meint.
DF wissen die daten von Turing und auch wie RT auf dieser funktioniert und daher hat Dictator nicht umsonst gemeint das Turing Leistung da nicht erreicht wird.
Du weißt ja nicht mal das NV bei der 1080Ti 1.1GR/s angibt

Edit:
Da wird Gigarays nicht mal erwähnt in dem Artikel

123vorbei · 17 Aug 2020

Gerade Dictator mit seinem Crysis Schrein und seinen Äußerungen zu Halo und dem Event

Schaue mal nach. Bin gespannt wie RT bei RDNA 2 implementiert ist.
Wenn sie es endlich mal zeigen.

Con$olef@natic · 17 Aug 2020

Ich dachte du weißt wie es implementiert ist

Kleiner Tip, AMD gab nach dem NV event damals an das eine Vega 64 ~4,5 GR/s wie es NV nennt erreicht in claybook.
Aber das lustige ist das eine von NV 1.1GR/s 1080Ti besser in claybook perfortmt.
Soviel zur Schnittstellen berechnung, die natürlich deutlich höher ist bei Turing als sie strahlen werfen pro sek.

Hier für dich um es schnellerzu machen vom Turing launch

Als Vergleich zieht NVIDIA die GeForce GTX 1080 Ti hinzu und gibt hier eine Rechenleistung von 1,1 Gigarays/s an. Die GeForce RTX 2080 Ti soll mindestens 10 Gigarays/s erreichen – in einigen Fällen sogar mehr als 12. Doch wie lassen sich diese Werte vergleichen? Die Antwort ist ganz einfach: Gar nicht! Selbst auf die identische Szene bezogen können die Werte leicht schwanken und sind somit nur eine Näherung. NVIDIA möchte an dieser Stelle aber verdeutlichen, dass ein Ray Tracing auf Basis der Pascal-Architektur in dieser Form nicht möglich ist.

Die angaben lassen sich nicht vergleichen und sind einfach ein buzzword von NV

wie ich gesagt habe

Der versuch mit Vega von AMD ging damals etwas in die Hose.

Edit:
HWdeluxxx hat das mit den sogar 4.8GT/s von AMD in ihrer review drin

Als Anhaltspunkt: In einer Szene von Claybook, die per Ray Tracing berechnet wird, erreicht eine Radeon RX Vega 64 4,88 Gigarays/s. Dabei wurde nur ein Primary Ray Tracing durchgeführt, für Shadow Rays liegt der Wert etwas darunter. Das Spiel läuft für Primary Ray Tracing in 4K bei 60 FPS flüssig, aber das gilt hier auch für eine GeForce GTX 1080 Ti und insofern lassen sich die fast 5 Gigarays/s nicht mit den von NVIDIA gemachten Angaben vergleichen. Ein Primary Ray Tracing und Shadow Rays können kohärent berechnet werden, für Reflection und Refraction Rays gilt dies nicht und dann ändert sich auch die Leistung auf einen Wert bezogen auf Gigarays/s.

Reflektionen laufen nicht mal in die Gigarays angaben von NV

123vorbei · 17 Aug 2020

Interessant diese Aussagen. Soweit so gut arbeitet Turing nach dem Bounding volume hierarchy Prinzip. Zur Beschleunigung arbeiten die RT Cores mit den Shader-ALUs zusammen. Die RT Cores lokalisieren geeignete Polygone und die ALUs shaden die Strahlen anschließend.
Daraus ergibt sich also von Nvidia genannte Leistungsfaktor zwischen Turing und Pascal (RTX 2080 Ti vs. GTX 1080 Ti) - 10× da pro Gigaray rund 10 TFLOPS an Rechenleistung aufgewendet werden müssen.

Ach so setzt sich das zusammen.
Cool das mit den RT Cores. Aber dieses Lokalisieren der richtigen Polygone
und die Aufgabe festzustellen welche Strahlen wo auf Polygone stoßen, irgendwie ist das doch voll zeitaufwendig.^^ Auch die Vereinfachung das der Raum zunächst in größere Würfel aufgeteilt, die mithilfe effizienter Algorithmen schneller Aufschluss über darin enthaltene Polygone geben anstatt Pixelweise zu suchen ist nett,
aber irgendwie sehr aufwendig.

Aber an sich eine schöne Implementierung von Nvidia und das RT und Alu sich die Arbeit teilen und Algorithmen es noch vereinfachen. Und ja die Gigaray Angaben sind nur grobe Angaben die je nach Anwendung variieren können.

Da bin ich mal gespannt was AMD haben wird.

Con$olef@natic · 17 Aug 2020

Ich sag ja, da steckt viel mehr dahinter

Sollte Ampere 50% mehr RT leistung haben ist das schon ne Hausnummer.

Red · 17 Aug 2020

thraker · 17 Aug 2020

Vorgeschmack für morgen

Microsoft Xbox Series X's AMD Architecture Deep Dive at Hot Chips 2020

AMD's next-gen console APUs come out of hiding.

www.tomshardware.com

123vorbei · 18 Aug 2020

Bin gespannt auf mehr Infos.
Zumindest bestätigen die Folien das die SX 64 ROPs hat und die PS5 mit ihren 64 ROPs und höherem Takt schneller ist.
Beide haben also 64 ROPs.
Und ich wie ich es vermutet habe wurde der L3 Cache halbiert sogar mehr als halbiert. Das spart einige Transistoren ein.
Zu RT eher spärliche Infos außer das ich wie vermutet recht hatte: CU*4*Takt ergeben die 380
NUr lässt sich das wie Toms Hardware es geschrieben hat schlecht mit den Gigarays von Nvidia vergleichen, da beide Unternehmen Angaben weglassen um sie besser vergleichen zu können.

TheProphet · 18 Aug 2020

AMDs Vorgehensweise mit Raytracing war doch die CUs dafür zu nutzen oder? Nvidia hat ja RT bei der 1080Ti freigeschaltet und das Ergebnis war desaströs verglichen mit dem direkten Nachfolger 2080Ti:

In 4K war eine 2080TI statt 30% auf einmal 100% schneller als die 1080Ti...

ConsoleWAR Current Gen Konsolen und Ihre Technik dahinter

L20: Enlightened

L07: Active

L99: LIMIT BREAKER

L07: Active

L99: LIMIT BREAKER

L07: Active

L99: LIMIT BREAKER

L13: Maniac

L07: Active

L99: LIMIT BREAKER

L07: Active

L99: LIMIT BREAKER

L07: Active

L99: LIMIT BREAKER

L07: Active

L99: LIMIT BREAKER

L20: Enlightened

L15: Wise

L07: Active

L99: LIMIT BREAKER