DX10通用性与Performance之间的取舍
产品通用性与Performance之间的取舍是在产品设计中常遇到的一个选择,因为多功能通用灵活的产品在处理单一工作时总是会损失其效率,远不如专用的处理单元来的快捷;然而专用处理单元在面对多类型任务要求时却又往往束手无策。DX10在设计时也同样面临这种困惑,依据业界对图形处理性能的要求,在通用性与Performance之间舍弃任何一方都是不切实际的做法,下面有一个解决该问题比较成功的案例——Intel G965。

Intel的G965图形芯片便是这种妥协的最好诠释之一,其先进的内部硬件设计中有许多为DX10 Unified Architecture统一渲染架构而设计的可编程的渲染单元,为了满足业界对于图形性能的要求并弥补通用渲染单元的效率,Intel G965还设计了许多专用处理单元作为通用渲染单元的协处理器来使用,但在有限的硬件资源下这些负责协处理的单元不可能被过多的应用,否则通用渲染单元就失去其存在意义。G965的抉择是仅在少数的关键性计算中使用协处理单元,使整个芯片在保持良好的通用性同时具备高效率的处理能力。
DX10 Unified Architecture下的Stream Processor(SP)是一个具备Vertex/Pixel Shader能力的通用计算单元,在整个DX10架构下Stream Processor无疑将会获得更好的Load Balance,同时也在致力于把CPU从中间件的指令翻译中解脱出来,减少state切换代价。现在我们有一个很好机会来验证一下我们为DX10的通用性付出多少代价。

NVIDIA的GeForce 8600GTS使用了32个Stream Processor,其规格比较接近ATi上一代的DX9产品-Radeon X1950Pro,Radeon X1950Pro使用的是3:1(PSP:TMU)架构的Pixel Shader Pipeline,一共拥有12条Pixel Shader Pipeline以及8个Vertex Engine。我们将会在目前的DX9游戏下对比这两款产品的性能。
[1] [2] [3] [4] [5] [6] 下一页 |