16 12
发新话题
打印

XBOX360 構成細部公開

本主题由 Lan 于 2007-12-12 16:45 移动
每一件小事:
引用:
(以下是转贴自EG“爱你一棒锤”的原话):

gz里面阐述了很多c1的问题,但是不等于rsx不会遇到,恰恰是rsx问题更严重,例如处理模版阴影和柔滑阴影的问题,照tim sweent的说法,全精度的软阴影buffer本身体积已经大到哪怕是下代gpu也很难解决的地步,莫非c1会遇到,rsx不会?有些偏颇了。

回帖者也没提到cell超标量流水线设计的问题,超长流水线和短流水线设计多数情况下时钟周期的差异用简单的对比缺乏说服力,要知道两者都不支持oooe,这个问题肯定要面对的。

“waternoose的vmx指令集支持和CELL的PPE是一样的,因为两者的cpu内核单挑来看的话实际上是一样的,一样的ALU、一样的FPU、一样的VMX单元。\"---------可惜ps3只有一个内核而不是三个,单挑显然是不现实的。
“CELL、Waternoose都是一样的编译器?或许他有资料,我反正不知道。如果这样sony头疼什么劲?

“在PS3上RSX还能向XDR执行读取写入等操作,实际可用的带宽要高于XBOX 360”,tubro cache?这项技术带来性能增益有多少nvidia自己最清楚,6200tc的表现总该有代表性吧?而且rsx主内存是gddr3,tc如何直接获取另一条总线下支配的xdr主内存的东西?好像不能直接点对点的获取吧,如何得出效率更高的说法?

\"在制造工艺方面,索尼/东芝在2002年4月达成半导体工艺合作协议,在这个持续4年协议里面IBM会提供包括50nm线宽、300mm晶圆以及最先进的SOI(FD-SOI?)等工艺给索尼、东芝。PS3的CELL、RSX的生产工艺初期是90nm,索尼和IBM生产CELL,RSX是索尼自己生产。我没看出IBM的90nm SOI的工艺会在什么地方比TSMC落后,事实上这部分对用户来说基本上意义不大,关键是售价订在什么价位,这才是用户最关心。\"---------这更荒唐,ibm的east fishkill的可怜产能保证自己的产品线和有限的代工都成问题(nv3x的闹剧还知道吧?),ibm的生产工艺和东芝有什么关系?东芝代工ps3又不是ibm,我是拿toshiba和tsmc比较,他又何必偷梁换柱?

还有,原贴主要是说明tsmc的产能优势,显然他没看明白重点。至于.90工艺的所谓成熟,芯片面积没p4ee高所以生产没问题就更可笑了,主角成了intel,要知道intel工艺产能没问题哺代表其他人又那能耐,否则ibm的g5移动版也不会难产后被apple抛弃。

TOP

jfb:
引用:
超空间转移辩论啊  nv在不久的将来就会推出90纳米工艺,频率超rsx,同样128位带宽的 g70。rsx 基本没有yy的价值了。ps3用的xdr 和ddr3 带宽差不多。xdr 基本没有yy的价值了。 cell的主核心和x360的PPE 基本一样, cell的主核心 基本没有yy的价值了。cell的spe 只能做特定的事,在功能上spe 基本没有yy的价值了。 现在唯一有yy价值的是spe 的效率和速度了。  

TOP

Ayanaomi:
引用:
cho的意思是c1的parent die 是瓶颈啊,可是ATI的人对c1的shader性能可是充满信心

TOP

Eji:
引用:
(以下是转贴自EG“爱你一棒锤”的原话):
gz里面阐述了很多c1的问题,但是不等于rsx不会遇到,恰恰是rsx问题更严重,例如处理模版阴影和柔滑阴影的问题,照tim sweent的说法,全精度的软阴影buffer本身体积已经大到哪怕是下代gpu也很难解决的地步,莫非c1会遇到,rsx不会?有些偏颇了。
其實我不知道上面提的這個和C1與RSX之間的比較有什麼關係....  
C1的問題根本和stencil shadow、softshadow無關,cho的post也完全沒有提到這個。

cho講的東西只有一個,非常簡單:
乍看之下是323M,其實扣掉eDRAM之後,ROP + Core總計252M。
252M vs 300M+,哪邊的shader ALU資源較多不言而喻。
C1 ALU數量本來就較小,所以他們宣稱效率上會贏。
實際上是不是這樣?當然是等著看而已。
引用:
回帖者也没提到cell超标量流水线设计的问题,超长流水线和短流水线设计多数情况下时钟周期的差异用简单的对比缺乏说服力,要知道两者都不支持oooe,这个问题肯定要面对的。
這個每個人都知道,但是有一個疑問是:
以Console跑的OS與程式規模,到底需不需要OOOE?
話說連GZ的processor區都以P-M的遊戲性能好來衡量這點,
我很想說要不要乾脆把問題怪到MS身上。
引用:
“waternoose的vmx指令集支持和CELL的PPE是一样的,因为两者的cpu内核单挑来看的话实际上是一样的,一样的ALU、一样的FPU、一样的VMX单元。\"---------可惜ps3只有一个内核而不是三个,单挑显然是不现实的。
這讓我想到那句話:
『Xbox 360有三顆LP,但是一次只能跟一個女人搞。我們正在努力想辦法一次搞三個。等到我們練成了神功,就不用怕那對面那一個(PS3)只有一個LP、但是會玩上百種花樣的傢伙了。』

所以我只能給你這個表情。 ~ `s!`dry!
引用:
“CELL、Waternoose都是一样的编译器?或许他有资料,我反正不知道。如果这样sony头疼什么劲?
所以沒透過compiler思考嘛。
引用:
“在PS3上RSX还能向XDR执行读取写入等操作,实际可用的带宽要高于XBOX 360”,tubro cache?这项技术带来性能增益有多少nvidia自己最清楚,6200tc的表现总该有代表性吧?而且rsx主内存是gddr3,tc如何直接获取另一条总线下支配的xdr主内存的东西?好像不能直接点对点的获取吧,如何得出效率更高的说法?
EIB 的任兩個點可以依順序交換資料。
不過EIB本身並不是個高頻寬的東西....
它比較適合送高运算量低頻寬的東西從一點到另一點。
不過它本來就是distributed computing向的架構了。
刻意忽視這點去撞東西本來就不是個好點子。

至於到底XDR對RSX而言有多少可得性,
我還是回到那個180 cycle的數字上就好了。
引用:
\"在制造工艺方面,索尼/东芝在2002年4月达成半导体工艺合作协议,在这个持续4年协议里面IBM会提供包括50nm线宽、300mm晶圆以及最先进的SOI(FD-SOI?)等工艺给索尼、东芝。PS3的CELL、RSX的生产工艺初期是90nm,索尼和IBM生产CELL,RSX是索尼自己生产。我没看出IBM的90nm SOI的工艺会在什么地方比TSMC落后,事实上这部分对用户来说基本上意义不大,关键是售价订在什么价位,这才是用户最关心。\"---------这更荒唐,ibm的east fishkill的可怜产能保证自己的产品线和有限的代工都成问题(nv3x的闹剧还知道吧?),ibm的生产工艺和东芝有什么关系?东芝代工ps3又不是ibm,我是拿toshiba和tsmc比较,他又何必偷梁换柱?
基本上不少人譏笑IBM的fishkill是fabkill,
不過卻每個廠商都去和IBM洽談製程合作與技術交換事宜。

所以關係大還是小?
引用:
还有,原贴主要是说明tsmc的产能优势,显然他没看明白重点。至于.90工艺的所谓成熟,芯片面积没p4ee高所以生产没问题就更可笑了,主角成了intel,要知道intel工艺产能没问题哺代表其他人又那能耐,否则ibm的g5移动版也不会难产后被apple抛弃。
希望那個很歡樂的MCM結構真的拼得起來。

TOP

cho:stencil buffer、soft shadow正正都是NVIDIA的强项。

RSX有16个运行于550MHz的ROP,每个ROP能每个周期完成两个Z/stencil操作,每秒是17.6G Z/stencil ops/s。

Xenos是多少呢?Xenos采用分离式的设计,在eDRAM模块里集成192个processor作为FSAA、stencil/z、color操作。

按照微软Xenon(XBOX360)的SDK文件,这个Xenos的color fillrate是4G Pixels/s(8 pixel/cycle);Xenos同样能够做到双倍的Z/stencil输出,即8G Z/stencil ops/s(16 Z-ops/cycle)。

RSX/Xenos= (17.6G Z/stencil ops) / (8G Z/stencil ops/s) = 2.2 倍。 在Z/stencil计算能力上,RSX是Xenos的2.2倍。

如果跑类似DOOM III那样大量使用纹理、stencil buffer shadow的游戏,不出意料的话,Xenos必败无疑。

自NV20以来,NVIDIA的GPU都具备硬件PCF加速,这对使用shadow map来作为动态柔和阴影的游戏来说能起到显著的加速作用。

CELL的PPE和Waternoose的CPU内核结构基本一样,都是21级超长流水线,不存在什么和短流水线比较的问题。

微软采用IBM支援的编译器主要是两个方面:
1、微软从来没有出品过基于POWERPC的编译器;
2、在SPEC CPU2000测试中,微软编译器的性能一向落后于Intel以及其他商业化的编译器,其实在dos时代就如此。

索尼采用IBM支援的编译器理由就更简单了,他们不可能撇开IBM自己弄PowerPC的编译器,这是STI合作的关键内容之一。

要想比较Turbo Cache的效益,最简单的方式就是把ATI的RADEON eXprss整合图形芯片组和NVIDIA GeForce 6200TC比较。

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2269&p=18



http://review.gzeasy.com/graphic ... aphics_1039_10.html


CELL和RSX之间的连接是FlexIO,带宽是20GB/s (write) + 15GB/s (read),远比PCIE的4GB/s双向高得多,也要比waternoose和Xenos的10GB/s双向高出一倍以上,而XDR的存取延迟本身也要比GDDR3低不少,RSX能从FlexIO获得的带宽和6200 TC相比不可同日而语,NUMA方式的存取效能也要比UMA只能挤到同一条内存总线上抓GDDR3的XBOX 360高得多。
http://pc.watch.impress.co.jp/docs/2005/0521/e304.htm
引用:
“CellとRSXは密接な関係を持っており、両者ともメインメモリとVRAMに対して透過的にアクセス可能です。CellはVRAMに対してメインメモリと同じようにアクセスできますし、RSXもメインメモリをフレームバッファとして扱うことが可能です。このようなアーキテクチャにしたのは、CellとRSXの間で無駄なデータのコピーや演算をなくすためです。

Cellでのシミュレート結果をRSXが直接参照したり、RSXがシェーディングした物体の形をCellが直接参照できます(注S3ではCellとRSXの接続は双方向に独立したバンド幅を持っているため、相互にメモリ参照しても衝突は起きない)。”
NV30是TSMC生产的第一枚130nm low-K GPU,R520是TSMC的第一枚90nm low-K GPU,现在情况如何大家有目共睹。

实际上,PS3的主要芯片都是索尼自己生产的,索尼本身就有90nm 300mm晶圆的生产线,不需要跑到Toshiba那里,Toshiba、Samsung帮忙生产XDR、GDDR3就可以了。Toshiba的SCC未必会用到PS3上,它并不完全吻合PS3发布会上描述的规格。

芯片面积和产能是直接相关的,芯片尺寸越大,遭遇瑕疵的机会就越高。对于产能,Ken Kutaragi在接受日经BP社Tech On的专访中有过这样的描述(http://techon.nikkeibp.co.jp/english/NEWS_EN/20050426/104211/):
“Do you have any idea of what the yield will be?
I\'m not going to give a green light unless we attain a certain yield rate level. Just think of the amount of chips we are to produce - 20 million for game consoles alone, an estimated 10% of TV sets, as well as home servers. At this scale, brute strength alone won\'t do. We are not aiming to produce 100,000-yen chips. As Mr. Masatoshi Shima, who had designed the \"4004\" chip with Intel once wrote, Intel usually starts with the yield of 40% and then brings it up to 85%. That is a good curve. I believe there is universality in these figures that stands up regardless of time and use. ”

BTW,XBOX的CPU是IBM生产的,TSMC只生产北桥,NEC生产eDRAM,SiS(UMC)生产南桥。

TOP

Lan好像很喜欢gz嘛。的确是硬件天堂

TOP

 16 12
发新话题