wtf
Das die Cell Architektur seine Vorteile hat war mir schon bewusst, aber nach dem Lesen der Beiträge von Missile bin ich noch stärker als vorher ein Befürworter des Cells auch in der PS4.
Lass es wahr werden Sony
Ich denke der gute Missile überschätzt die Codequalität bei Videospielen um ein paar Größenordnungen. Die Posts sind alle aus einer wissenschaftlichen Perspektive geschrieben, bei hochkritischen Algorithmen, wo jede Effizienzsteigerung Unmengen an Geld sparen kann, ist die Qualität logischerweise viel höher, außerdem hat man in dem Bereich keinen derart großen Berg an Code zu verwalten und in der Tat sind Spiele heute in vielerlei Hinsicht sogar komplexer. Bei Videospielen werden ständig Teile des Codes rausgeworfen und erneuert. Das erfordert ganz andere Ansprüche als wissenschaftliche Simulationen.
Demzufolge ist es auch nicht verwunderlich, dass Cell mit Abstand die effizienteste CPU bei Matrix-Multiplikationen ist. Solche Effizienz geht eigentlich automatisch einher mit niedrigerer Effizienz bei nicht so optimalem Code, so läuft einfach der Tradeoff. Code für eine Architektur wie den Cell zu entwickeln kostet leicht mal doppelt so viel wie für andere Konsolen und ein Vielfaches von PC-Code. Außerdem beginnt bei 16 Kernen
Amdahl's Law langsam seine Wirkung
deutlich zu zeigen. Bei 95% Parallellität erreicht ein 16 Kern Prozessor nur 60% der Leistung eines Prozessors mit nur einem Kern aber 16-facher Taktung.
Auf einem 32nm Node könnte man entweder einen POWER7 mit 8 Kernen zu 265 GFLOPs oder einen verfünffachten Cell (also 40 SPEs, 5 PPEs) mit ~1,2 TFLOPs entwickeln. Letztere Option klingt natürlich erstmal geiler, allerdings verliert man bei 45 Kernen, bei allem was nicht zu 99% parallel ist, 60% der Leistung alleine durch fehlende Parallelität. Nun könnte man argumentieren, dass 360 GFLOPs noch immer besser sind als 265 GFLOPs. Richtig, nur hat POWER7 eine deutlich bessere IPC bei realem Code, liegt also wesentlich näher an der Peakleistung als es Cell je sein wird. POWER7 ist eine fantastische CPU und die beste Basis, die man aktuell für eine Konsolen-CPU haben kann.
Beim Fermi stimme ich ihm allerdings zu, die Architektur ist genial. Das Problem an der am PC gefühlten Stagnation der Grafikleistung liegt nicht daran, dass wir nicht genug Leistung haben. 2 TFLOPs sind Unmengen an Rechenleistung. Das Problem ist, dass ein großer Teil der Hardware noch immer Fixed-Function ist und daher auf einer veralteten Basis funktioniert, die Shaderprozessoren hingegen sind noch nicht flexibel genug und nicht gut ins System eingebunden.
Eine Next-Gen GPU sollte sich nicht dadurch auszeichnen möglichst viel Leistung zu haben, sonder dadurch endlich von den edlosen Limitierungen aktueller Hardware wegzugehen. Fermi ist ein erster relevanter Schritt in diese Richtung. Alleine die Tatsache wie schwer es ist Datenstrukturen auf einer GPU zu erstellen, wie umständlich bis unmöglich Polygone ab einer gewissen Größe zu rastern weil alles noch immer auf Quads basiert, wie ineffizient Texturfilterung und Anti-Aliasing berechnet wird.
Die verfügbare Rechenleistung steht leider in keinem Verhältnis zum erreichten Ergebnis mehr und das liegt daran, dass niemand am PC Milliarden in eine Architektur investiert, die nicht kompatibel zu alter Software ist bw sind die Softwarehersteller nicht dazu bereit quasi zwei Engines zu schreiben. Nvidia beginnt aber langsam mehr und mehr auf die Ansprüche von High-Performance Rechenclustern zu optimieren. Diese Leute interessieren alte Grafikfeatures nicht die Bohne, daher ist Fermi unter den aktuell erhältlichen GPUs wohl am besten für eine Next-Gen Konsole geeignet. Sowas wie die GF114 aka GTX 560. Wobei es 2013 sicher ne neue Architektur gibt, die eventuell noch besser ist. Momentan sind AMD-GPUs sicher effizienter aber ich denke das wird sich langfristig ändern und die Konsole soll ja wieder 10 Jahre halten.