Nagut, da mach ich mir mal die Mühe auf dieses Posting einzugehen, obwohl es dem original Poster etwas an technischen Sachverstand mangelt.
Unified Shaderunits können niemals die gleiche Effizienz erreichen wie fixe PS und VS, weil diese schlicht für den entsprechenden Shadercode spezialisiert sind.
Schau dir einfach mal die Shader Instructions von PS und VS an und behaupte nochmal solch einen Blödsinn. Die von beiden Units geforderten Berechnungen sind weitestgehend identisch.
Klar dürfte sein, dass Unified Shader etwas komplexeres Control haben und einen damit leicht erhöhten Transistor count im Vergleich zu dedizierten Units. Die Datenpfade/ALUs sind jedoch identisch, was überdies der Hauptgrund war, über Unified Shader ernster nachzudenken.
Aber im Normalfall, der wie das Wort schon impliziert überwiegen sollte, ist eine Aufteilung in PS und VS durchaus nicht von Nachteil, da die Lastverteilung von Spielen eigentlich immer im einem gewissen vorhersehbaren Verhälnis von VS-/PS-Last steht und Pixelshader PS-Code bzw. Vertexshader VS-Code schlicht schneller rechnen können...blubber
Ein weit verbreiteter Irrglaube. Es geht nicht darum, dass die Lastaufteilung "im Mittel pro Frame" vorhersagbar ist. Es geht hier um äusserst feingranulares Load Balancing.
Beispielsweise werden bei grösseren Dreiecken die VS idle und bei kleineren Dreiecken bzw. back backface culling, z-rejection ect. die PS idle. Das passiert während!! eines Frames sehr sehr häufig.
Somit ist der R500 flexibel und kann diese Flexibiltät in speziellen Sitationen in Geschwindigkeit umsetzen, aber im Normalfall etwas ineffizienter als eine PS-VS GPU.
Nicht in speziellen Situationen sondern immer, siehe auch oben....
Viel wichitger als Unifed Shader sind andere Sachen, wie z.B. dynamisches branching oder echtes displacementmapping.
Schön dass du es ansprichst. R500 hat einen Hardware Tesselator, welcher sich sehr vorteilhaft für Displacement Mapping anbietet. RSX/G70 hat einen solchen nicht !
Außerdem denken viele, dass Unified Shader automatisch toller sind als SM3.0 Das stimmt nicht!
Sicher haben Unified Shader nicht automatisch mehr Features. Allerdings haben Xenos' Unified Shader viele Features von WGF2.0, sind also von den Features wesentlich weiter als SM3.0
Dann kosten die Unifed Shader und mit ihrer recht aufwendigen Architektur nochmal locker 20%, nur damit sie unfied sind.
Jetzt wird es aber abenteuerrlich. Ich weiss zwar nicht wo du die 20% hezauberst. Ich empfehle dir ferner Gedanken darüber zu machen, welches Einsparungspotential Unified Shader, was den Transistor Count betrifft, mit sich bringen.
Nicht gemacht? Schade....bisher kommt nur Larifari von dir.
Wenn man jetzt noch hofft, dass der R500 HDR kann, dann gehen locker nochmal 10Mill. Tranistoren drauf, wenn nicht mehr
Wieviel Transistoren gehen denn für ALUs drauf die, 128 bit HDR untersützen? Noch dazu, wenn man die Bandbreite von RSX betrachtet, ein ziemlich nutzloses Feature...aber gut, dass du drauf zu sprechen kamst...
Der RSX hingegen hat mindestens 300Mill. Tranistoren mit 24 PS und 8 VS. Das Cell Interface mit direktem Zugriff auf SPEs und XDR wir die Tranistorenanzahl auch noch etwas ansteigen lassen.
Ein bischen ist gut. Ich nehm einfach mal an, dass du überhaupt keinen Plan hast wovon du redest und erklärs einfach mal. System Memory der PS3 hat wesentlich höhrer Latency als das Grafik Memory. Da auch das System Memory als Render Target zur Verfügung steht, müssen diese Latencies vor den Pipelines "verteckt" werden. Die geschieht mithilfe eines Caches (nachzulesen in diversen Patenten von Nvidia), welche nebst Cache Controller nicht unwesentlich in das Transistor Budget schlägt.
eDRAM braucht der RSX auch nicht, weil die Bandbreite der PS3 locker reicht für 4*AA in 720P, was auch die sweetpoint Resolution der X360 ist.
Dass die Bandbreite nicht ausreichend ist, kann man einfach berechnen, denn man benötig in der Tat für das erreichen der Peak Fillrate von R500 256Gbyte/s frame/z-buffer Bandbreite.
Nebenbei bemerkt wurden sämtliche ROPs auf das daugther die integriert, welche im Falle von RSX auch noch zu Buche schlagen und natürlich Teil des Chips sind.
Ich könnte noch ein paar andere Beispiele bringen, z.B. der Fakt dass moderne Engines (z.B. Doom3) einen initialen z-only Pass fahren. Dass R500 bei einem solchen z-only pass RSX im Regen stehen lässt, und das gerade aufgrund der unified Shader und des eDRAMs dürfte unter Umständen selbst dir klar werden.
Also, wenn Du hier einen auf Technikguru machen willst, dann beschäftige dich mit der Thematik und schrieb nicht einfach so einen Mist nach, den Du irgendwo gelesen hast und nicht verstehst.
Da kann ich dir nur sagen: "Setzen, 6"...zurück auf die Schulbank...
Cruncher