更高级的分支预测器:
尽管SSE128被AMD称为Barcelona的最大改进,但是这只是冰山一角而已。在技术改进清单中排在最前面的是分支预测器。分支预测器的工作原理很简单,如果分支编码结果之前曾经被取用过,那么它将最有可能在下一次被提取。所以分支预测器的用途在于监测正在被CPU执行的指令,并且相应的对指令被执行的次数进行记录,来统计特定地址的分支编码结果被提取的概率。一旦计数器内部累积足够的数据,分支预测器就可以相对比较精确的对分支结果是否会被提取进行预测。通常来讲,CPU的分支预测器性能会直接影响数据处理的精确度。K8的分支预测器就非常好,对它的架构做了专门的优化。不过Intel的Pentium M和Pentium 4采用的分支预测器技术要更为出色。在Barcelona中将增加了一个512通路的间接分支预测器,更多的分支预测器将使Barcelona比K8获得和预测更多的历史数据,而更多的历史数据也会使支预测器更加精确。
频带堆栈优化和更快的加载速度:
Intel在Pentium M上首次提出了一个叫做专用堆栈管理器的功能,顾名思义就是用一个堆栈管理器来操作所有的X86堆栈运转。简单来说就是通过独立的堆栈管理器减轻了处理的负担。在Barcelona上AMD采用了相类似的技术,称为Sideband Stack Optimizer(频带堆栈优化),不但可以单独处理所有的堆栈运转,而且对堆栈处理器进行了优化,使其不浪费执行单元的位宽。
Barcelona还将具有Out-of-order load execution(乱序载入处理)能力,某些指令在实际运行当中可以绕过其他指令的处理,而且指令的存储也可以不按顺序进行,这在某些环境下对效率的提高有着很关键的作用。
更快速的内存控制器:
从以往的经验来看,AMD每推出一款新的处理器都会对内存控制器进行一次增强,Barcelona也不例外,它的内存控制器改进将会使内存性能得到很大的提升。和K8相比Barcelona的内存控制器将更加智能化。K8(Socket-940/939/AM2)处理器整合的是一个128-bit内存控制器,而在Barcelona中这个内存控制器被分离成两个64-bit控制器。每个控制器都可以独立运行,从而使内存控制的效率更高。尤其是四个核心分别处理不同的任务时它的优点更加明显。另外,Barcelona的北桥也将拥有比K8更高的带宽,考虑到高带宽的利用这个北桥将支持未来的DDR3内存标准。不过照目前的消息来看,起初发布的Barcelona仍然只支持DDR2内存。
新的Prefetcher单元:
Prefetcher(预取)单元的作用是预先取得内存中的数据放到缓存中备用,以加快内存的潜伏期。Intel的Core 2处理器每个核心有三个Prefetcher单元。K8处理器每个核心有两个Prefetcher单元,一个用来预取指令,一个用来预取数据。Barcelona每核心的Prefetcher单元数量仍然和K8一样,但是对它们进行了改进。最大的改变是数据Prefetcher单元会直接将数据储存到L1缓存中,而K8的数据Prefetcher单元是把数据储存到L2缓存中。把数据预取到潜伏期更低的L1缓存,会增加核心预取的精确性而且还可以避免占用L2缓存。而最大的改进是,在Barcelona的内存控制器内部加入了一个DRAM Prefetcher单元,这个DRAM Prefetcher单元用于整体的内存需求,它不会把数据储存到L2或L3缓存,而是储存到自带的缓存器中,这将会增强整个核心的性能。
三级缓存架构和虚拟化技术:
AMD在缓存部分一直都落后于Intel。我们知道双核Core 2处理器采用的是共享的4MB二级缓存,是目前双核K8的两倍。而这一差距在四核心处理器的竞争中还将继续拉大,Barcelona每个核心单独享有512KB二级缓存,四个核心的二级缓存总量仅仅只有2MB,而Intel的四核心Kentsfield却拥有高达8MB的二级缓存。预计年低推出的Penryn将拥有总数高达12MB的二级缓存。Barcelona没有像K8一样每个核心采用128KB的一级缓存和512KB的二级缓存,它的一级缓存仅仅只有64KB,但是AMD为Barcelona加入了四核心共享的2MB三级缓存,这将弥补二级缓存容量不足的问题。三级缓存的容量是可变化的,不同型号的处理器可能会配备不同容量的三级缓存。Barcelona在性能方面的改进还包括提升虚拟地址转换速度的增强虚拟化技术。目前进行地址转换,通常hypervisor是通过一种叫做shadow paging的技术来实现的,而是Barcelona采用的是一种硬件加速shadow paging技术,AMD把它称作Nested Paging。这样一来hypervisor进行地址转换所用的时间就会大大缩短。

电源管理:
Barcelona的四个核心仍然采用同样的电压,但是北桥的供电和CPU采用分离式电源管理设计,核心电压和北桥电压可以单独在0.8V - 1.4V之间改变,也就是说改变其中一个电压不会对另一个电压产生影响,这会有效的降低功耗。尽管Barcelona的四个核心的电压不能单独改变,但是它们可以运行在不同的时钟频率,在运行不需要四个核心满载的任务时,其它空闲的核心会自动降低时钟频率以达到省电的目的。Barcelona的每个核心都支持5种p-states模式来改变时钟频率,这种p-states模式是完全的硬件控制,因此你需要专用的驱动程序来激活这种电源控制功能。可以说Barcelona的电源管理模式为将来的多核心处理器增强功耗比提供了一个新的思路。
上一页 [1] [2] [3] [4] 下一页 |