Next Gen Konsolen und die Technik dahinter

Status
Nicht offen für weitere Antworten.
Hallow´s Victim schrieb:
Ich glaube auch,dass die Xbox360 unterm Strich in Sachen Grafik den (etwas) längeren Atem haben wird!
Die GPU der 360 ist einfach durchdachter und flexibler, vor allem hat sie aber noch einige Kniffe parat,die erst in Zukunft von Relevabz sein werden.
Nett diesbezüglich auch das Interview von NVidia,wo sie gefragt wurden,warum sie nicht auch die GPU für die 360 entwickelt haben...die antwort darauf war,dass der Xenos in seiner jetzigen Form das Entwicklungsbudget des Unternehmens bei Weitem überschritten hätte, wohl ganz im Gegensatz zum RSX... :)

Da Sony die Architektur der PS3 aber so ausgelegt hat, daß der Cell dem (zugegebenermassen gegenüber Xenos leicht unterlegenem) RSX perfekt unter die Arme greifen kann, könnte dich das Vorzeichen wiederum drehen, so daß nämlich die PS3 unterm Strich in Sachen Grafik den längeren Atem haben wird.
Unbestritten ist hingegen, daß das Potential des Xenos sich von einem Entwickler wesentlich einfacher nutzen läßt, während man bei der PS3 schon ein wenig ackern muß, um das volle Potential des Duos Cell&RSX ausschöpfen zu können.
 
http://www.neogaf.com/forum/showthread.php?t=158122

von nem heavenly sword entwickler (also werden ihn die ms fanboys eh nicht ernstnehmen ;) )

Last year I did about at least 2 crunchs of 3+months 12 hours, 7 days a week each. I’m not sure how many days I did out of the year but a worked most days of the year on HS by a massive margin. Nina had to order me to go home at one point, cos she was getting worried that working everyday for 100+ days isn’t healthy (specially when most were 12 hours days…). Haven’t had a chance to look at this years numbers but I’ve been in the office every day for at least the last month, maybe two or three.


And have done a lot of the design and implemention of the army sections of the game, doing AI, gameplay, physics etc. all on the SPU. So much that Sony used it in the GDC2007 as a case study in advanced SPU usage. I think the SPUs are the best peice of technology in a console for at least 2-3 generations… Once you get to grips with them, they just keep giving and giving… So much so that I suspect everybody has underestimated there power.

I pioneered a method of getting more out of RSX than the then current libraries, a good year before Sony provided there own version of it. The infomation was provided back to Sony (and in few cases Nvidia) and is now ’standard’ for all developers.

Atomic Cache Unit is one of my favorite things on the PS3 and gets little love cos its one of those tiny features that make life so much nicer.
Atomic ops refer to the most important principle in multi threading. It say that a single processor must read/modify/write without another thread interrupting (hence atomic). Without atomicy, multiple core system are much harder (if not near impossible).

The ACU (s) are a part of each SPU that allow atomic updates to occur very quickly. It appears fairly simple each SPU had 512 bytes of cache (yes contrary to what you might have heard SPU do have a tiny bit of cache). 512 bytes is divided into 4 128 byte lines. The MFC (DMA) unit can bring a cache line in from memory and mark it reserved… if another processor writes to the same bit of memory the reservation is lost and you know to repeat the read/modify/write cycle to guarantee atomicy.

All good, but whats really clever its how its implemented. If another SPU asks for that bit of memory its get its from another SPUs cache, if its in there. So you effectively have a fast SHARED 512 bytes. When an SPU writes, the other SPU only have to read from the writing SPU cache rather than DMAing it back to main memory and DMAing it into LS. Cuts down alot of memory traffic. I even abuse it and just use it as a conventional cache and communication channel between SPU. You can push alot of data around with a fast 128 byte path.

And the nicest thing about it… It just works… All the cache snooping, routing etc. all just happens magically inside the chip. You say ATOMIC_GET and ATOMIC_SET and treat yourself to a 512 byte shared cache.

So for example for some of the army stuff, I need statistics to be kept (things like how many dead, ko’ed etc.)

These are 128 byte structure, that each SPU read/writes to as nessecary. When first you look at it, its seems to be really slow if not for the ACU. All those 128 bytes DMA, every time I need to add a number I’m doing 2 128 DMA (one read/one write) but due to the fact that its sitting inside SPU cache most of the time its ends up just being EIB ring traffic. And thats fast, really really fast.

I just have a shared counter statistics system that all works even tho I can be making 100’s of atomic updates per frame.

Nice one… Whoever at STI who added that bit of hardware deserves a beer from me
 
Och wenn der Thread schon wieder mal da ist mach ich mir schnell die Mühe und verlege die offTopic Diskussion aus einen anderen Thread jetzt mal hier her.

Colditz schrieb:
Die Unreal Engine 3 profitiert von vier bis acht Prozessorkernen,
indem die zusätzlichen Kerne für die Beschleunigung von Physik oder
von künstlicher Intelligenz genutzt werden.
Das ist wohl der einzige Vorteil der PS3, zumindest bei der Unreal Engine 3.
Bei unsauberer Programmierung sieht die Geschichte wohl etwas anders aus...

Darauf Antwortete Taddl, was jetzt ein wenig zerstücklelt ist.

squallsdestiny schrieb:
Taddl schrieb:
Nicht einmal das, da ein einzelner SPE wesentlich schwächer ist als ein Core des Xenon.

Blödsinn, die SPE's sind der Leistungsträger und weitaus schneller als diese poplige PPE von der die 360 gleich 3 hat.

Taddl schrieb:
etztendlich läuft es auf 7 Threads des Cell gegen 6 Threads des Xenon aus, wobei letzterer individuell mit Cache gefüttert werden kann und die SPEs auf ihren starren, ineffizienten local store angewiesen sind.

Vergleich nicht das MultiThreading des Cells mit den des Xenon, wenn der Xenon 2 Threads auf einen Core laufen lässt nutzt er das Simultaneous Multithreading, eine Technik die Intel zu Pentium 4 Zeiten als Hyper Threading verkaufte,sollte dir ein Begriff sein.
Der Leistungsgewinn in gegensatz dazu wenn man einen Thread auf einen Core laufen lässt liegt vielleicht bei 30%.
Beim Cell läuft ein Thread auf einer SPE, somit sind Theoretisch 100% möglich, ist bei 2 Threads auf 2 SPE's also schon weitaus schneller als ein Core des Xenon.
Dazu greifen die 6 Threads des Xenon auf eine Cache zu, das ist an ineffizienz nicht zu überbieten, wenn ein Thread auf den Cache zugreift ist er für alle anderen Threads gesperrt, das einzige was ihnen dann übrig bleibt ist entweder über den quälend langsammen Arbeitsspeicher ihre Daten zu beziehen, oder zu warten bis der Cache wieder freigegeben ist.

Taddl schrieb:
Bei optimaler Ausreizung sind beide gleich schnell, nur ist eine optimale Lastenverteilung beim Cell wesentlich komplizierter als beim Xenon und fordert den Entwicklern geradezu hellseherische Kräfte ab.

Bei Optimaler Ausnutzung fegt der Cell den Xenos in andere Welten

Taddl schrieb:
Die PS3 packt nicht ohne Grund kein einziges UE-Game bislang. Rainbow Six Vegas für PS3 immer wieder verschoben, GRAW2 für PS3 gerade nochmal verschoben, GRAW 1 eingestampft und SC4 (sogar nur UE2) stark abgespeckt.

Das hat nichts mit der Leistungsfähigkeit der Konsole zu tun, sondern eher damit das die 360 den Vorteil hat zu 90% kompatibel mit der API des PC zu sein und die besseren DevTools hat, einen Vorteil den die PS3 bisher nicht hat, hier ist noch alles Handarbeit, leider.

Taddl schrieb:
Splinter Cell Conviction gänzlich nicht auf PS3 machbar and so on...

Schwachsinn hoch 10.


Darauf da die Antwort, die jetzt wieder ein weing verstückelt ist.

squallsdestiny schrieb:
Taddl schrieb:
@squallsdestiny
So ein Mumpitz. Du vergleichst die physikalisch vorhandenen zwei Threads eines Xenon-Cores mit den zwei virtuellen des P4 Hyper-Threading (auch als "1,5 Threads" bekannt)?

Richtiges Symmetric Multi-processing geht nur mit mehreren Cores.
Physikalisch ist für 2 Threads nur ein Core vorhanden, somit Simultaneous Multithreading, was das selbe wie Hyper Threading ist.
Rate mal was scheller bei der Xbox360 ist, 2 Threads auf einen Core und 2 Threads auf 2 Cores.

Taddl schrieb:
Dass nicht mehrere Threads gleichzeitig auf den Cache zugreifen können ist auch Unsinn. Was ist außerdem effizienter? Ein echter Cache, der Daten zwischenlagert und der Thread jederzeit bei Bedarf darauf zurückgreifen kann, oder der local store, der sich gar nichts merken kann und die Berechnung jedesmal neu durchführen müssen, was gerade bei Physikberechnungen extrem ausbremst...

Besser ist für jeden core eine eigene Bandbreite zu ihren eigenen Cache, ist bei der 360 nicht der Fall, es können nicht alle Threads gleichzeitig auf den Cache zugreifen, da alle über die selbe Bandbreite mit den Cache kommunizieren.
Die SPE's haben keinen eigenen Cache, dafür ihre eigene Bandbreite zu ihren LocalStore und einen Memory Controller um auf andere zuzugreifen, immer noch die bessere Lösung als bei der 360.

taddl schrieb:
Ja ein PPE ist schon sehr popelig, so popelig, dass er alle sieben SPEs des Cell gleichzeitig füttert und sie koordiniert, da ohne ihn die SPEs nichts auf die Reihe bringen.

Das ist nun mal die Architektur des Cells, die PPE macht nichts anderes als die SPE's zu koordinieren, warum?Weil sie schneller sind als die PPE (anmerkung, nach Benchmark ergebnissen auf den Niveau eines Athlons 1,3gHz), von der die 360 gleich 3 hat

Taddl schrieb:
Verbreiten wir wieder Halbwahrheiten unters Volk? Die Integer und Logik Leistung einer PPE liegt auf dem Niveau eines Athlon 1,3GHz. Die 360 hat drei davon, die PS3 nur eins.
Besser als Unwahrheiten wie bei dir.
Und schön das sie nur eine hat, war auch nicht anders gedacht, und ändert nichts das die PPE lahm ist, und davon die 360 gleich drei hat.

Taddl schrieb:
Was ist die Paradedisziplin des Performance-Einbruchs einer SPE gleich nochmal? Kein Wunder dass gerade die KI in PS3-Spielen so schwächelt und die Motorstorm-Gegner ständig gegen die Wand knallen.

Findest es wohl besser wenn alle in Ideallinie fahren.
Und bei GOW verstecken sich die Gegner auf der falschen Seite der Deckung, OMG, der Xenos ist KI unfähig!!!


Vielleich kann man so hier wieder mal für ein bischen Gesprächsstoff sorgen, da sich das ganze ja sonst immer auf andere Threads verteilt.

Nacht erstmal Leute.
 
Da der Cell nur über einen echten Prozessorkern verfügt, der den Xenos Kernen sehr ähnelt, kann er auch nur zwei Thread bearbeiten. Die SPEs sind sowas wie Signalprozessoren und können keinen Thread ausführen.

Ein Xenonkern mit seinen zwei Hardwarethreads ist zwar ähnlich zu behandeln wie Hyperthreading, jedoch mit wesentlich höherer Effizienz bei richtiger Handhabung. Der zweite Thread kann ohne weiteres 70% Leistungssteigerung bringen.

Die SPEs des Cells werden in Spielen nie auch nur ansatzweise an ihre 100% tige Auslastung kommen, da sie eben nicht ohne fremde Hilfe sich koordinieren können.
Ist also völlig Blödsinnig zu argumentieren, dass der Xenos nur unwesentlich durch Hyperthreading profitieren würde und andererseits der Cell seine SPEs vollständig ausnutzen kann.

Weder Xenos noch Cell sind zur Zeit programmiertechnisch auf dem Zenit der Ausnutzung angelangt. Es ist blauäugig zu glauben, nur beim Cell wären noch Leistungsschübe möglich und beim Xenon nicht.

Wer sich das neueste Material zu SC5 angesehen hat, kann erahnen, was noch so alles in der guten alten 360 schlummert :)

PS:
squallsdestiny:
Deine Ausführungen bzgl. des Xenon Cache und der angeblichen Nutzung nur durch einen Thread gleichzeitig sind aber zu köstlich :lol2:
 
Mell@ce schrieb:
Da der Cell nur über einen echten Prozessorkern verfügt, der den Xenos Kernen sehr ähnelt, kann er auch nur zwei Thread bearbeiten. Die SPEs sind sowas wie Signalprozessoren und können keinen Thread ausführen.

Wie die SPE's können keinen Thread ausführen?

Mallace schrieb:
Ein Xenonkern mit seinen zwei Hardwarethreads ist zwar ähnlich zu behandeln wie Hyperthreading, jedoch mit wesentlich höherer Effizienz bei richtiger Handhabung. Der zweite Thread kann ohne weiteres 70% Leistungssteigerung bringen.

Und warum sind beim Xenon locker 70% drin, der Pentium konnte bei Hyper Threading wenigstens sein Vorteil der Extrem hohen Bandbreite nutzen, dies hat der Xenon aber nicht mal.

Mell@ce schrieb:
Die SPEs des Cells werden in Spielen nie auch nur ansatzweise an ihre 100% tige Auslastung kommen, da sie eben nicht ohne fremde Hilfe sich koordinieren können.
Ist also völlig Blödsinnig zu argumentieren, dass der Xenos nur unwesentlich durch Hyperthreading profitieren würde und andererseits der Cell seine SPEs vollständig ausnutzen kann.


Weder Xenos noch Cell sind zur Zeit programmiertechnisch auf dem Zenit der Ausnutzung angelangt. Es ist blauäugig zu glauben, nur beim Cell wären noch Leistungsschübe möglich und beim Xenon nicht.

Natürlich sind 100% utopisch, war im Original Text auch extra markiert, kam beim Kopieren aber nicht mit.
Ändert aber nicht darand das imo im Cell noch mehr steckt als im Xenon.
Hier steckt die richtige koordination und generelle nutzung der SPE's komplett am Anfang.



Mallace schrieb:
PS:
squallsdestiny:
Deine Ausführungen bzgl. des Xenon Cache und der angeblichen Nutzung nur durch einen Thread gleichzeitig sind aber zu köstlich :lol2:

Solche Stalls sind afaik das Problem bei SMT und SMP Prozessoren, wenn du mit erklärst das das nicht so ist ist das OK, nur zu sagen das es blödsinn ist reicht nicht.
 
SPEs können keine Threads ausführen, da sie nun mal nicht über einen vollständigen Befehlssatz verfügen.
Sie werden wie Unterprogramme aufgerufen von den beiden Hardwarethreads des PPE Kerns.

Der Xenon kann aber wirklich sechs Threads fahren. Natürlich muss auch da ein Thread als Hauptthread fungieren, bei dem dann alles zusammen läuft, aber die restlichen fünf Threads können bis auf diese Einschränkung völlig unabhängig ihr Ding durchziehen.

Zum Hyperthreading.
Was meinst Du mit extrem hoher Bandbreite beim Pentium IV ?
Wie beim P4 sind auch beim Xenon jeweils die Register doppelt pro Kern ausgelegt, die Recheneinheiten aber nicht. Jeder Thread hat somit seine eigenen Register, sogar die Altivec Einheiten.
Der Vorteil des Xenon ggü. des P4 im Bezug auf Hyperthreading liegt unter anderem an dem geschlossenen System einer Konsole.
Der P4 konnte auch mittels Hyperthreading seine Effektivität enorm steigern nämlich dann, wenn zwei völlig unterschiedliche Programme abgearbeitet wurden.
Dürftig fiel seine Leistung lediglich dann aus, wenn beide Threads durch ein und das selbe Programm belegt wurden. Dann waren wirklich oft nur geringe bis gar keine Leistungssteigerungen feststellbar. Das lag aber eher daran, dass die Programme nicht auf Hyperthreading zugeschnitten waren und es beim PC dazu noch mannigfaltige Konfigurationsmöglichkeiten gibt.
Die 360 ist aber eine feste Konsole und die Programme , jedenfalls alle außer billigen Ports, werden diesen Umstand berücksichtigen und deshalb wesentlich effizienter die Kerne nutzen können.

Ist natürlich beim Cell ähnlich. Auch dort finden die Programmierer eine einheitliche Hardware vor, die sie mit der Zeit immer besser zu verstehen lernen werden.

Zum Cache.
Was Du dazu schreibst, habe ich immer noch nicht verstanden.
Der Cache ist beim Xenon so organisiert, dass man ihn auf die drei Kerne nach eigenem Belieben aufteilen kann. Jeder Kern hat dann aber auch nur den Bereich des Caches, der ihm reserviert wurde. Auf diesen Teil kann er aber dann mit voller Bandbreite zugreifen, während die anderen Kerne das gleiche mit ihrem Cachebereich tätigen können.
Keine Ahnung woher Du die Info haben willst, dass der Cachezugriff nur sequenziell, bezogen auf die Kerne, erfolgen kann.
 
Mell@ce schrieb:
Da der Cell nur über einen echten Prozessorkern verfügt, der den Xenos Kernen sehr ähnelt, kann er auch nur zwei Thread bearbeiten. Die SPEs sind sowas wie Signalprozessoren und können keinen Thread ausführen.

Ein Xenonkern mit seinen zwei Hardwarethreads ist zwar ähnlich zu behandeln wie Hyperthreading, jedoch mit wesentlich höherer Effizienz bei richtiger Handhabung. Der zweite Thread kann ohne weiteres 70% Leistungssteigerung bringen.

a) Das mit der höheren Effizienz hört sich für mich nach Wunschdenken an - worin liegt diese höhere Effizienz? Ich habe z.B. im Netz Quellen gefunden, dach denen das Multithreading des Xenos (und des PPEs) sogar weniger Leistungsfähig als das SMT der Pentium Prozessoren sei, weil kein SMT sondern sogenanntes "fine grained multithreading" zum Einsatz kommt, bei dem nur eine instruction von einem core gleichzeitig abgearbeitet werden kann, während beim SMT oder Hypertreading zwei Instruktionen pro cycle gleichzeitig abgearbeitet werden.

b) Dazu kommt, daß jeder Core des Xenos nur eine Altivec-Einheit besitzt, wenn es also darum geht, SIMD-Streams zu bearbeiten (das Spezialgebiet der SPEs) , schrumpft das parallel-Prozessing auf 3 "Threads" zusammen.

Mell@ce schrieb:
Die SPEs des Cells werden in Spielen nie auch nur ansatzweise an ihre 100% tige Auslastung kommen, da sie eben nicht ohne fremde Hilfe sich koordinieren können.
Ist also völlig Blödsinnig zu argumentieren, dass der Xenos nur unwesentlich durch Hyperthreading profitieren würde und andererseits der Cell seine SPEs vollständig ausnutzen kann.

Das kann man wohl so kaum stehen lassen, denn die Erfahrung zeigt, daß Entwickler bei einem unique Hardware-Konzept sich bisher immer den 100% Ausnutzung der vorhandenen Ressourcen genähert haben. Die 100% auf den Punkt werden wohl nicht erreicht werden, aber selbst eine 90%ige Auslastung dürfte Anwendungen ermöglichen, die wir derzeit auf einer Konsole noch für nicht machbar halten. Ein nie in dieser Hinsicht klingt auf jeden Fall eher nach kindischem Trotz, als nach zuverlässiger Prognose.


Mell@ce schrieb:
Weder Xenos noch Cell sind zur Zeit programmiertechnisch auf dem Zenit der Ausnutzung angelangt. Es ist blauäugig zu glauben, nur beim Cell wären noch Leistungsschübe möglich und beim Xenon nicht.

Der Xenos entspricht aber einer gut bekannten Architektur, die schon eine ganze Weile im Umlauf ist und dessen Vorteile und Schwächen der Entwicklergemeinde hingehend bekannt sind. Natürlich hat auch er noch Potential, das bei bisherigen games noch nicht 100%ig genutzt wird. Blauäugig hingegen ist aber die Annahme, das sei beim Cell genau so. Der Cell ist nicht nur um einiges komplexer in der Handhabung, er ist auch eine völlige Neuentwicklung, über die noch kein hinreichend umfangreiches Pool an Erfahrungsschätzen vorhanden ist, also für Entwickler noch völliges Neuland, das noch erforscht und erkundet werden muß. Und ja, der Cell hat ungeimein mehr Kraftreserven als der Xenos, und damit ist der zu erwartende Leistungschub beim Cell noch um ein vielfaches höher als beim Xenos.

Mell@ce schrieb:
Wer sich das neueste Material zu SC5 angesehen hat, kann erahnen, was noch so alles in der guten alten 360 schlummert :)

Ja, und das 1.5 Jahre nach Release, mit Developer-Systemen, die den Entwicklern noch viel früher in einer annehmbaren Form zur Verfügung standen und einer im Vergleich zur PS3 simplen, gut bekannten und dokumentierten Architektur - was glaubest Du, was man in 1-2 Jahren wohl auf der PS3 zu sehen bekommt, wenn diese erst mal in diesem Stadium angelangt ist?
 
chk23 schrieb:
was glaubest Du, was man in 1-2 Jahren wohl auf der PS3 zu sehen bekommt, wenn diese erst mal in diesem Stadium angelangt ist?

Nach der Fan-Zeitlogik zu urteilen etwa 0,5 dessen was man dann auf der Xbox 360 sehen wird. :rolleyes:
 
chk23 schrieb:
Der Xenos entspricht aber einer gut bekannten Architektur, die schon eine ganze Weile im Umlauf ist und dessen Vorteile und Schwächen der Entwicklergemeinde hingehend bekannt sind. Natürlich hat auch er noch Potential, das bei bisherigen games noch nicht 100%ig genutzt wird. Blauäugig hingegen ist aber die Annahme, das sei beim Cell genau so. Der Cell ist nicht nur um einiges komplexer in der Handhabung, er ist auch eine völlige Neuentwicklung, über die noch kein hinreichend umfangreiches Pool an Erfahrungsschätzen vorhanden ist, also für Entwickler noch völliges Neuland, das noch erforscht und erkundet werden muß. Und ja, der Cell hat ungeimein mehr Kraftreserven als der Xenos, und damit ist der zu erwartende Leistungschub beim Cell noch um ein vielfaches höher als beim Xenos.
Da muss ich insofern widersprechen, als Xenon eine in-Order CPU ist. Ansich ein alter Hut, aber nur vergleichsweise wenige Entwickler haben Erfahrung damit. In-Order ist recht schwer zu optimieren und sehr stark auf Optimierungen durch den Compiler angewiesen, die noch lange nicht optimal sind. Allerdings ist auch korrekt, dass CELL dennoch weitaus ungewöhnlicher und komplexer aufgebaut und somit noch schwerer auszureizen ist (und dennoch bei Spielen wohl nie auch nur im Ansatz eine perfekte Effizienz erreichen wird).

Da sind wir aber bei einem bekannten Problem: Beide CPUs sind nicht ideal für Spielentwickler, und CELL schon gar nicht. Sie passen einfach nicht wirklich zur üblichen Arbeitsweise in der Branche. Es steckt zwar viel Power drin, aber sie ist, gerade bei CELL, schwer bis unmöglich vernünftig zu nutzen. Und da ich das auch von Mitarbeitern des CELL-Entwicklerteams bei IBM gehört habe, selbst vom Leiter (H. Peter Hofstee), kann man wohl davon ausgehen, dass es stimmt.
 
wsippel schrieb:
Da muss ich insofern widersprechen, als Xenon eine in-Order CPU ist. Ansich ein alter Hut, aber nur vergleichsweise wenige Entwickler haben Erfahrung damit. In-Order ist recht schwer zu optimieren und sehr stark auf Optimierungen durch den Compiler angewiesen, die noch lange nicht optimal sind. Allerdings ist auch korrekt, dass CELL dennoch weitaus ungewöhnlicher und komplexer aufgebaut und somit noch schwerer auszureizen ist (und dennoch bei Spielen wohl nie auch nur im Ansatz eine perfekte Effizienz erreichen wird).

Da sind wir aber bei einem bekannten Problem: Beide CPUs sind nicht ideal für Spielentwickler, und CELL schon gar nicht. Sie passen einfach nicht wirklich zur üblichen Arbeitsweise in der Branche. Es steckt zwar viel Power drin, aber sie ist, gerade bei CELL, schwer bis unmöglich vernünftig zu nutzen. Und da ich das auch von Mitarbeitern des CELL-Entwicklerteams bei IBM gehört habe, selbst vom Leiter (H. Peter Hofstee), kann man wohl davon ausgehen, dass es stimmt.

Letzteres ist eine Ente, er hat nie gesagt, der Cell sei nicht für den Gameseinsatz geeignet, oder unmöglich vernünftig zu nutzen, er hat gesagt, es bedarf einiger Einarbeitung um das volle Potential des Cells auszunutzen, mehr nicht. Ganz im Gegenteil, der Cell ist genau für die Multimediaanwendung konzipiert und optimiert worden.

Und ich als Spielentwickler sage Dir: Es mag einige geben, die sich lieber auf die Highlevel-Entwicklung stürzen und am liebsten auf beinahe Scripting-Level arbeiten, und es gibt solche, die genau auf das was der Cell bietet gewartet haben, und es gar nicht erwarten können dieses Potential freizusetzen. Daß letztere sicher nicht am aussterben sind, sieht man an den PS2-Titeln der letzten Jahre - diese Hardware war für Lastgen Verhältnisse noch schwieriger in den Griff zu bekommen, als die PS3, und im Gegensatz zu dieser mußte man die Hardware schone sehr genau kennen, um auch nur an die Konkurrenten Cube und XBox heranzukommen. Trotzdem hat es dort immer wieder kleine technische Wunder gegeben, wie God of War II oder Black oder auch ältere Titel wie GT3 sehr schön bewiesen haben.
 
chk23 schrieb:
Letzteres ist eine Ente, er hat nie gesagt, der Cell sei nicht für den Gameseinsatz geeignet, oder unmöglich vernünftig zu nutzen, er hat gesagt, es bedarf einiger Einarbeitung um das volle Potential des Cells auszunutzen, mehr nicht. Ganz im Gegenteil, der Cell ist genau für die Multimediaanwendung konzipiert und optimiert worden.
Das ist sicher keine Ente, ich habe es nämlich von ihm und andere Mitarbeitern seines Teams persönlich. :D

Und Spiele haben herzlich wenig mit der Form von Multimedia zu tun, für die CELL besonders geeignet ist.

Und ich als Spielentwickler sage Dir: Es mag einige geben, die sich lieber auf die Highlevel-Entwicklung stürzen und am liebsten auf beinahe Scripting-Level arbeiten, und es gibt solche, die genau auf das was der Cell bietet gewartet haben, und es gar nicht erwarten können dieses Potential freizusetzen. Daß letztere sicher nicht am aussterben sind, sieht man an den PS2-Titeln der letzten Jahre - diese Hardware war für Lastgen Verhältnisse noch schwieriger in den Griff zu bekommen, als die PS3, und im Gegensatz zu dieser mußte man die Hardware schone sehr genau kennen, um auch nur an die Konkurrenten Cube und XBox heranzukommen. Trotzdem hat es dort immer wieder kleine technische Wunder gegeben, wie God of War II oder Black oder auch ältere Titel wie GT3 sehr schön bewiesen haben.
Ich bin selbst Programmierer und Spielentwickler, vielen Dank. :)

Der Vergleich PS2/ PS3 hinkt ein wenig. Die PS2-Architektur war zwar ziemlich merkwürdig und kompliziert zu meistern, aber dennoch meiner Ansicht nach weitaus besser für die Spielentwicklung geeignet. Aber gut, ein paar Leute wühlen liebend gerne in den Eingeweiden von Systemen rum, und versuchen, sie für Dinge zu nutzen, für die sie nie gedacht waren - wie eben CELL für Spiele.

Ich ziehe persönlich clevere Lösungsansätze dem Kampf gegen die Technik vor, aber das ist ein anderes Thema. Ich sage auch nicht, dass nicht wenige exzellente Coder extrem viel aus der PS3 holen können werden - aber eben nur eine winzige Elite. Man sieht ja, dass viele gute Entwickler der Last-Gen komplett von der PS3 überfordert scheinen. Unter Anderem deshalb laufen auch Engines von der Stange so gut wie noch nie.
 
wsippel schrieb:
Das ist sicher keine Ente, ich habe es nämlich von ihm und andere Mitarbeitern seines Teams persönlich.

Entschuldige, daß ich solch schwer verifizierbare Aussagen nicht als Argument akzeptieren kann - da müßte ich schon den exakten Wortlaut im O-Ton aus seinem Munde hören, um Interpretations/Übersetzungs/Wahrnehmungs-Fehler oder einfach dem subjektiven Wunschdenken entsprungene Sichtweise auszuschließen

wsippel schrieb:
Und Spiele haben herzlich wenig mit der Form von Multimedia zu tun, für die CELL besonders geeignet ist.

So? Haben sie das? Hochperformantes, paralleles SIMD-Processing ist also bei Physik, Sound, Geometrie, Kompression, DSP-Anwendungen nicht geeignet? Ich bitte Dich!!!

wsippel schrieb:
Ich bin selbst Programmierer und Spielentwickler, vielen Dank. :)

Cool - kannst ja per PM mal ein bisschen mehr darüber verlauten lassen. Mein erstes game ist 1989 bei Ariola-Soft erschienen, seit dem bin ich ohne Unterbrechung dabei :)

wsippel schrieb:
Der Vergleich PS2/ PS3 hinkt ein wenig. Die PS2-Architektur war zwar ziemlich merkwürdig und kompliziert zu meistern, aber dennoch meiner Ansicht nach weitaus besser für die Spielentwicklung geeignet. Aber gut, ein paar Leute wühlen liebend gerne in den Eingeweiden von Systemen rum, und versuchen, sie für Dinge zu nutzen, für die sie nie gedacht waren - wie eben CELL für Spiele.

Und letzteres ist und bleibt eine Falschaussage - hab mich neulich noch mit einem der talentiertesten 3D-Entwickler unterhalten, die ich so kenne (und ich kenne einige, bei 19 Jahren in der Spielentwicklung lernt man so manchen kennen ;) ), und der freut sich wie ein kleines Kind demnächst darauf entwicklen zu dürfen - sprudelte praktisch über vor Anwendungsideen für diese "für Spiele ungeeignete Hardware"...

wsippel schrieb:
Ich ziehe persönlich clevere Lösungsansätze dem Kampf gegen die Technik vor, aber das ist ein anderes Thema. Ich sage auch nicht, dass nicht wenige exzellente Coder extrem viel aus der PS3 holen können werden - aber eben nur eine winzige Elite. Man sieht ja, dass viele gute Entwickler der Last-Gen komplett von der PS3 überfordert scheinen. Unter Anderem deshalb laufen auch Engines von der Stange so gut wie noch nie.

Aber das ist doch ein sich selbst befruchtender Vorgang, wenn erst mal effiziente Algorithmen und Anwendungen gefunden sind, verschwinden die doch nicht in der Schublade, sondern landen in Engines, Sony-Tools oder zumindest dem reusable Codefundus des Entwicklers - ist doch nicht so, daß bei jedem Game das Rad von jedem Entwickler wieder neu erfunden werden müßte...
 
chk23 schrieb:
Der Xenos entspricht aber einer gut bekannten Architektur, die schon eine ganze Weile im Umlauf ist und dessen Vorteile und Schwächen der Entwicklergemeinde hingehend bekannt sind. Natürlich hat auch er noch Potential, das bei bisherigen games noch nicht 100%ig genutzt wird. Blauäugig hingegen ist aber die Annahme, das sei beim Cell genau so.

Sorry dass ich mich in eure Diskussion einmische ;) ihr versteht sicher mehr von der Materie als ich, aber dass der Xenos auf einer gut bekannten Architektur beruht, mag ja stimmen, wenn man mal von den 3 Kernen absieht, die ende 2005 noch nicht wirklich gebräuchlich waren.

Dafür war die xbox GPU an sich aber mit US und eDRAM(Tiling) viel ungewöhnlicher als der konventionelle RSX.
 
Mell@ce schrieb:
Zum Hyperthreading.
Was meinst Du mit extrem hoher Bandbreite beim Pentium IV

Der P4 übertrug pro Takt 4 Datenpakete a 64bit, der Athon hatte nur die hälfte, und dadurch das der Athlon generell geringer getaktet war natürlich weitaus weniger Bandbreite zur Verfügung.
Somit konnte Intel natürlich dieses Bandbreitenpotentioal gut für SMT nutzen, auch um den sehr hohen CPI Wert des P4 zu auszugleichen.

Mell@ce schrieb:
Wie beim P4 sind auch beim Xenon jeweils die Register doppelt pro Kern ausgelegt, die Recheneinheiten aber nicht. Jeder Thread hat somit seine eigenen Register, sogar die Altivec Einheiten.
Der Vorteil des Xenon ggü. des P4 im Bezug auf Hyperthreading liegt unter anderem an dem geschlossenen System einer Konsole.
Der P4 konnte auch mittels Hyperthreading seine Effektivität enorm steigern nämlich dann, wenn zwei völlig unterschiedliche Programme abgearbeitet wurden.
Dürftig fiel seine Leistung lediglich dann aus, wenn beide Threads durch ein und das selbe Programm belegt wurden. Dann waren wirklich oft nur geringe bis gar keine Leistungssteigerungen feststellbar. Das lag aber eher daran, dass die Programme nicht auf Hyperthreading zugeschnitten waren und es beim PC dazu noch mannigfaltige Konfigurationsmöglichkeiten gibt.
Die 360 ist aber eine feste Konsole und die Programme , jedenfalls alle außer billigen Ports, werden diesen Umstand berücksichtigen und deshalb wesentlich effizienter die Kerne nutzen können.

Auch wenn die 360 ein geschlossendes System ist, kann die Leistungssteigerung nicht über das gehen was maximal möglich ist.
Und diese Maxilamwert gibt IBM mit 40% bei ihren SMT Verfahren an, und das nur bei Integer Berechnungen, der Rest wird sogar darunter liegen, somit lag ich mit meinen geschätzten 30% gar nicht mal so falsch ;)

Mell@ce schrieb:
Ist natürlich beim Cell ähnlich. Auch dort finden die Programmierer eine einheitliche Hardware vor, die sie mit der Zeit immer besser zu verstehen lernen werden.

Natürlich, hoffe nur das dafür noch genug Zeit für die Konsole bleibt ihr Potential zu zeigen.
Hoffe ja das Sony mit der Edge Technologie hier weiterhelfen kann.

Mall@ce schrieb:
Zum Cache.
Was Du dazu schreibst, habe ich immer noch nicht verstanden.
Der Cache ist beim Xenon so organisiert, dass man ihn auf die drei Kerne nach eigenem Belieben aufteilen kann. Jeder Kern hat dann aber auch nur den Bereich des Caches, der ihm reserviert wurde. Auf diesen Teil kann er aber dann mit voller Bandbreite zugreifen, während die anderen Kerne das gleiche mit ihrem Cachebereich tätigen können.
Keine Ahnung woher Du die Info haben willst, dass der Cachezugriff nur sequenziell, bezogen auf die Kerne, erfolgen kann.

OK, das war eine Falsch Info von mir, war von ausgegangen das der Xenon nur einen Cache hat mit den alle Cores über einen Bus kommunizieren, beim Xenon hat jeder Core seinen eigenen L1 Cache mit eigenen Bus, somit können sie natürlich mit voller bandbreite darauf zugreifen, wie gesagt, sorry und Asche über meine Haupt für die Faulheit die Infos zu suchen.
Dann die Frage, wie sieht es mit den L2 Cache aus, geht der über einen Bus und ist dies beim Xenon eine exklusiv oder inklusive Cache Verwaltung?

wsippel schrieb:
Und da ich das auch von Mitarbeitern des CELL-Entwicklerteams bei IBM gehört habe, selbst vom Leiter (H. Peter Hofstee), kann man wohl davon ausgehen, dass es stimmt.

Ich kenne nur die Aussage von ihn das der Cell nicht nur für Spiele geegnet ist

wsippel schrieb:
Ich ziehe persönlich clevere Lösungsansätze dem Kampf gegen die Technik vor, aber das ist ein anderes Thema.

Am besten ist wohl ein einfach zu handhabenes System, welches aber noch genug "Schlupflöscher" für den Teil der Programmierer hat die noch Spass an der Arbeit haben und Herrausforderungen lieben.
Das hat meiner Meinung der Cube ganz gut erfüllt.

Vorlone schrieb:
Dafür war die xbox GPU an sich aber mit US und eDRAM(Tiling) viel ungewöhnlicher als der konventionelle RSX.

Durch die UF Shader ist der Xenos sogar einfacher zu nurtzen als ein Chip mit konventioneller Architektur, da die Lastverteilung einfacher zu plannen ist.
Zusätzlich hat der RSX noch die Verbindung zum Cell/Zugriff auf den XDR, was in Zukubft auch nicht ungenutzt bleibt ;)
 
chk23 schrieb:
Entschuldige, daß ich solch schwer verifizierbare Aussagen nicht als Argument akzeptieren kann - da müßte ich schon den exakten Wortlaut im O-Ton aus seinem Munde hören, um Interpretations/Übersetzungs/Wahrnehmungs-Fehler oder einfach dem subjektiven Wunschdenken entsprungene Sichtweise auszuschließen
Dann lässt Du's eben. Kannst aber gerne mal das IBM DeveloperWorks Forum umgraben, da hat sich Hofstee vor einer Weile auch mal dazu geäußert. Subjektives Wunschdenken gibt's bei mir dazu sowieso nicht, weil's mir persönlich eigentlich ziemlich egal ist... :)

So? Haben sie das? Hochperformantes, paralleles SIMD-Processing ist also bei Physik, Sound, Geometrie, Kompression, DSP-Anwendungen nicht geeignet? Ich bitte Dich!!!
So einfach ist das nicht. Aber ich kann Dir erklären, wozu CELL eigentlich entwickelt wurde: Zur parallelen Verarbeitung von großen, vorhersehbaren Datenströmen nach einem festem Muster. Sicher, das trifft auf einige Multimediaanwendungen zu, Video-Decoding zum Beispiel - aber eben nicht wirklich auf Spiele.

Und letzteres ist und bleibt eine Falschaussage - hab mich neulich noch mit einem der talentiertesten 3D-Entwickler unterhalten, die ich so kenne (und ich kenne einige, bei 19 Jahren in der Spielentwicklung lernt man so manchen kennen ;) ), und der freut sich wie ein kleines Kind demnächst darauf entwicklen zu dürfen - sprudelte praktisch über vor Anwendungsideen für diese "für Spiele ungeeignete Hardware"...
Sagte ich ja: es gibt Leute, denen so was Spaß macht. Ich kenne auch sehr fähige Entwickler, die sich nicht damit rumärgern wollen, sondern viel lieber eine starke "klassische" CPU hätten.

Eine Falschaussage ist es nebenbei ganz sicher nicht. Auch wenn Du's nicht glauben willst, ich weiß, was ich von IBM gehört habe. :D
 
wsippel schrieb:
Dann lässt Du's eben. Kannst aber gerne mal das IBM DeveloperWorks Forum umgraben, da hat sich Hofstee vor einer Weile auch mal dazu geäußert.

Ich kenn die diversen Äußerungen von Hofstee, die z.T. verfälscht und dramatisch überhöht durch die Foren geisterten. Verfolgt man sie dann zu der Originalquelle zurück, kommt immer etwas in der Art raus, wie auch squallsdestiny schon bemerkte: Aussagen wie "Der Cell ist nicht nur für Spiele geeignet" werden dann mal eben zu "Der Cell ist nicht für Spiele geeignet" umgetextet...

wsippel schrieb:
Eine Falschaussage ist es nebenbei ganz sicher nicht. Auch wenn Du's nicht glauben willst, ich weiß, was ich von IBM gehört habe. :D

IBM hat's ja nicht alleine entwicklet, und Toshiba und Sony hatten dabei sicher nicht nur Serveranwendungen im Sinn. Und es zählt schließlich weniger, mit welcher Absicht etwas entwicklet wurde, als wozu es zu gebrauchen ist. CPUs wurden auch nicht mit dem Zweck entwickelt, Kern eines neuen universellen Unterhaltungsmediums zu werden ;)
 

chk24, ist es denn aber nicht so dass der Umstand dass nur ein einziges Multispiel(Oblivion, nach einem Jahr) auf der PS3 wirklich besser ist, ein Beweis für wsippels Behauptungen?
 
chk23 schrieb:
Ich kenn die diversen Äußerungen von Hofstee, die z.T. verfälscht und dramatisch überhöht durch die Foren geisterten. Verfolgt man sie dann zu der Originalquelle zurück, kommt immer etwas in der Art raus, wie auch squallsdestiny schon bemerkte: Aussagen wie "Der Cell ist nicht nur für Spiele geeignet" werden dann mal eben zu "Der Cell ist nicht für Spiele geeignet" umgetextet...
Nochmal: Ich habe es von ihm, nicht von irgendwelchen Xbox-Fanboy-Seiten. Der "nicht nur für Spiele"-Spruch kam Monate später, nachdem er wohl einen Maulkorb verpasst bekam. Zusammengefasst waren seine Äußerungen davor, soweit ich sie zusammenbekomme:

- Zu kompliziert für Spielentwickler.
- Optimierungen sind sehr aufwändig und zeitraubend, passt nicht zu den branchenüblichen Deadlines.
- Spielecode ist zu unvorhersehbar, um die CPU wirklich effizient auslasten zu können.
- Zu wenig Integer-Performance.
- Zu wenig double-Precision-Performance für zB vernünftige Physik.

Alle diese Punkte sollten weitestgehend einleuchten. Über die unteren zwei kann man sich natürlich streiten, besonders über die Gleitkommaleistung - natürlich wäre double-Precision wesentlich besser, aber meines Wissens ist auch bei der Xbox360 Physik eigentlich immer nur single-Precision. Insgesamt hat es Hofstee in Carmacks Sinne zusammengefasst: Ein schneller out-of-Order Prozessor, der Entwickler und Compiler so viel Arbeit wie möglich abnimmt, möglichst mit nur ein oder zwei Kernen, wäre für die Entwickler besser und angenehmer gewesen. Klar kann man um alle diese Probleme herumarbeiten, und bekommt dann tolle Ergebnisse. Effektiv mag es sein, effizient oder gar ideal aber sicher nicht.
 
wsippel schrieb:
Nochmal: Ich habe es von ihm, nicht von irgendwelchen Xbox-Fanboy-Seiten. Der "nicht nur für Spiele"-Spruch kam Monate später, nachdem er wohl einen Maulkorb verpasst bekam. Zusammengefasst waren seine Äußerungen davor, soweit ich sie zusammenbekomme:

- Zu kompliziert für Spielentwickler.
- Optimierungen sind sehr aufwändig und zeitraubend, passt nicht zu den branchenüblichen Deadlines.
- Spielecode ist zu unvorhersehbar, um die CPU wirklich effizient auslasten zu können.
- Zu wenig Integer-Performance.
- Zu wenig double-Precision-Performance für zB vernünftige Physik.

soso, dann hat er dir also erzählt, sein baby sei ein haufen murks. wofür ist der cell dann seiner meinung nach geeignet? und woran macht sich eine eignung für eine sache überhaupt fest?
 
Status
Nicht offen für weitere Antworten.
Zurück
Top Bottom