AMD高端显卡“夏威夷”核心架构图、细节曝光

　　AMD Radeon R9/R7系列显卡已经陆续发布，不过真正属于新一代产品的还是顶级的R9 290X/290，它们都会采用“夏威夷”核心。虽然已有不少资料泄漏，但重量级的来了：国外某网站发表的R9 280X评测里竟然包含了夏威夷架构的详细解读，而且都是官方资料！

　　这就是夏威夷的架构图。44个计算单元，比“塔希提”多了12组，每单元仍是64个流处理器，总计2816个，并分为四组“着色器引擎”(Shader Engine)。几何引擎、ROP光栅单元也都划分到了这四组着色器引擎里，其中光栅单元每组16个，总计64个。

　　ACE异步计算引擎达到了八个，是塔希提的四倍。显存控制器是六个64-bit，总位宽达到了512-bit。

　　右侧可以看到，以前的交火合成模块变成了新的交火XDMA，而在它和VCE视频编码、UVD视频解码引擎之间是新的TrueAudio DSP音频模块。

　　顺便贴上塔希提的核心图，GCN架构两代的区别就一目了然了。

　　R9 290X、HD 7970 GHz规格提升对比：几何处理器能力增加90％、浮点计算性能增加30％、纹理填充率增加30％、像素填充率增加90％、显存带宽增加20％。这一切的代价只是核心面积增加24％，达到了438平方毫米。

　　不过单位面积浮点性能提升有限，仅仅5％。

　　作为基础模块的计算单元在架构上几乎原封不动，只做了一些细节上的改进。

　　可读写二级缓存容量从768KB增至1MB，最多16个分区(之前6个)，内部带宽也同样增加了三分之一。

　　显存位宽终于又出现了512-bit，因此尽管GDDR5显存频率降低到了5GHz，但总带宽增至320GB/s，同时容量也有4GB。最关键的是，高位宽带来的更大核心面积问题没有再出现，反而还小了大约20％，这要归功于显存控制器重新设计等诸多因素。

　　八个ACE异步计算引擎，主要特性有：

　　－独立调度、工作任务分派，多任务执行更高效
　　－和图形指令处理器并行操作
　　－每一个都可以管理最多8个请求
　　－可访问二级缓存和全局数据共享
　　－快速上下文切换

　　另外还有两个DMA引擎，均借助PCI-E 3.0 x16 16GB双向带宽与显存控制器沟通。

　　AMD R9、R7系列主要阵容和性能等级。

　　R9 290X/290是“发烧友的梦想”，不过价格仍然未定。R9 280X/270X则是“游戏玩家的甜点”。

　　面向中低端的R7系列。