Xyleph
L99: LIMIT BREAKER
- Seit
- 9 Mai 2006
- Beiträge
- 42.064
Ist das dann Soft- oder Hardwareseitig?
Das Ganze ist natürlich Hardwareseitig und betrifft die GPU. Das heißt die Hardware muss es auch unterstützen, sonst kannst du als Entwickler FP16 Operationen verwenden, hast aber keinen Vorteil gegenüber FP32 Operationen.
Mit der Unterstützung von Rapid Packed Math kann man anstatt einer FP32 Operation gleichzeitig zwei FP16 Operationen durchführen. Dias verdoppelt die theoretische FLOPS-Leistung einer GPU. Dies wird in der Realität aber nie erreicht. Dafür gibt es mehrere Gründe. Einerseits eignet sich FP16 nicht für alle Operationen bei Videospielen, anderseits sind es nicht immer die FP-Recheneinheiten welche limitieren. Wenn die TMUs limitieren oder der Cache überläuft, bringt einem auch die Verdoppelung der FLOPS-Leistung nichts. Und natürlich resultiert eine Verdoppelung der FLOPS-Leistung nicht in die Verdoppelung der Frames oder Auflösung. Dafür gibt es zu viele Abhängigkeiten mit anderen Rechenoperationen auf CPU und GPU-Seite, sowie der Bandbreite.
Zuletzt bearbeitet: