cho:stencil buffer、soft shadow正正都是NVIDIA的强项。
RSX有16个运行于550MHz的ROP,每个ROP能每个周期完成两个Z/stencil操作,每秒是17.6G Z/stencil ops/s。
Xenos是多少呢?Xenos采用分离式的设计,在eDRAM模块里集成192个processor作为FSAA、stencil/z、color操作。
按照微软Xenon(XBOX360)的SDK文件,这个Xenos的color fillrate是4G Pixels/s(8 pixel/cycle);Xenos同样能够做到双倍的Z/stencil输出,即8G Z/stencil ops/s(16 Z-ops/cycle)。
RSX/Xenos= (17.6G Z/stencil ops) / (8G Z/stencil ops/s) = 2.2 倍。 在Z/stencil计算能力上,RSX是Xenos的2.2倍。
如果跑类似DOOM III那样大量使用纹理、stencil buffer shadow的游戏,不出意料的话,Xenos必败无疑。
自NV20以来,NVIDIA的GPU都具备硬件PCF加速,这对使用shadow map来作为动态柔和阴影的游戏来说能起到显著的加速作用。
CELL的PPE和Waternoose的CPU内核结构基本一样,都是21级超长流水线,不存在什么和短流水线比较的问题。
微软采用IBM支援的编译器主要是两个方面:
1、微软从来没有出品过基于POWERPC的编译器;
2、在SPEC CPU2000测试中,微软编译器的性能一向落后于Intel以及其他商业化的编译器,其实在dos时代就如此。
索尼采用IBM支援的编译器理由就更简单了,他们不可能撇开IBM自己弄PowerPC的编译器,这是STI合作的关键内容之一。
要想比较Turbo Cache的效益,最简单的方式就是把ATI的RADEON eXprss整合图形芯片组和NVIDIA GeForce 6200TC比较。
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2269&p=18
http://review.gzeasy.com/graphic ... aphics_1039_10.html
CELL和RSX之间的连接是FlexIO,带宽是20GB/s (write) + 15GB/s (read),远比PCIE的4GB/s双向高得多,也要比waternoose和Xenos的10GB/s双向高出一倍以上,而XDR的存取延迟本身也要比GDDR3低不少,RSX能从FlexIO获得的带宽和6200 TC相比不可同日而语,NUMA方式的存取效能也要比UMA只能挤到同一条内存总线上抓GDDR3的XBOX 360高得多。
http://pc.watch.impress.co.jp/docs/2005/0521/e304.htm引用:
“CellとRSXは密接な関係を持っており、両者ともメインメモリとVRAMに対して透過的にアクセス可能です。CellはVRAMに対してメインメモリと同じようにアクセスできますし、RSXもメインメモリをフレームバッファとして扱うことが可能です。このようなアーキテクチャにしたのは、CellとRSXの間で無駄なデータのコピーや演算をなくすためです。
Cellでのシミュレート結果をRSXが直接参照したり、RSXがシェーディングした物体の形をCellが直接参照できます(注
S3ではCellとRSXの接続は双方向に独立したバンド幅を持っているため、相互にメモリ参照しても衝突は起きない)。”
NV30是TSMC生产的第一枚130nm low-K GPU,R520是TSMC的第一枚90nm low-K GPU,现在情况如何大家有目共睹。
实际上,PS3的主要芯片都是索尼自己生产的,索尼本身就有90nm 300mm晶圆的生产线,不需要跑到Toshiba那里,Toshiba、Samsung帮忙生产XDR、GDDR3就可以了。Toshiba的SCC未必会用到PS3上,它并不完全吻合PS3发布会上描述的规格。
芯片面积和产能是直接相关的,芯片尺寸越大,遭遇瑕疵的机会就越高。对于产能,Ken Kutaragi在接受日经BP社Tech On的专访中有过这样的描述(
http://techon.nikkeibp.co.jp/english/NEWS_EN/20050426/104211/):
“Do you have any idea of what the yield will be?
I\'m not going to give a green light unless we attain a certain yield rate level. Just think of the amount of chips we are to produce - 20 million for game consoles alone, an estimated 10% of TV sets, as well as home servers. At this scale, brute strength alone won\'t do. We are not aiming to produce 100,000-yen chips. As Mr. Masatoshi Shima, who had designed the \"4004\" chip with Intel once wrote, Intel usually starts with the yield of 40% and then brings it up to 85%. That is a good curve. I believe there is universality in these figures that stands up regardless of time and use. ”
BTW,XBOX的CPU是IBM生产的,TSMC只生产北桥,NEC生产eDRAM,SiS(UMC)生产南桥。