AMD高端显卡“夏威夷”核心 架构图、细节曝光
AMD Radeon R9/R7系列显卡已经陆续发布,不过真正属于新一代产品的还是顶级的R9 290X/290,它们都会采用“夏威夷”核心。虽然已有不少资料泄漏,但重量级的来了:国外某网站发表的R9 280X评测里竟然包含了夏威夷架构的详细解读,而且都是官方资料!
这就是夏威夷的架构图。44个计算单元,比“塔希提”多了12组,每单元仍是64个流处理器,总计2816个,并分为四组“着色器引擎”(Shader Engine)。几何引擎、ROP光栅单元也都划分到了这四组着色器引擎里,其中光栅单元每组16个,总计64个。
ACE异步计算引擎达到了八个,是塔希提的四倍。显存控制器是六个64-bit,总位宽达到了512-bit。
右侧可以看到,以前的交火合成模块变成了新的交火XDMA,而在它和VCE视频编码、UVD视频解码引擎之间是新的TrueAudio DSP音频模块。
顺便贴上塔希提的核心图,GCN架构两代的区别就一目了然了。
R9 290X、HD 7970 GHz规格提升对比:几何处理器能力增加90%、浮点计算性能增加30%、纹理填充率增加30%、像素填充率增加90%、显存带宽增加20%。这一切的代价只是核心面积增加24%,达到了438平方毫米。
不过单位面积浮点性能提升有限,仅仅5%。
作为基础模块的计算单元在架构上几乎原封不动,只做了一些细节上的改进。
可读写二级缓存容量从768KB增至1MB,最多16个分区(之前6个),内部带宽也同样增加了三分之一。
显存位宽终于又出现了512-bit,因此尽管GDDR5显存频率降低到了5GHz,但总带宽增至320GB/s,同时容量也有4GB。最关键的是,高位宽带来的更大核心面积问题没有再出现,反而还小了大约20%,这要归功于显存控制器重新设计等诸多因素。
八个ACE异步计算引擎,主要特性有:
- 独立调度、工作任务分派,多任务执行更高效
- 和图形指令处理器并行操作
- 每一个都可以管理最多8个请求
- 可访问二级缓存和全局数据共享
- 快速上下文切换
另外还有两个DMA引擎,均借助PCI-E 3.0 x16 16GB双向带宽与显存控制器沟通。
AMD R9、R7系列主要阵容和性能等级。
R9 290X/290是“发烧友的梦想”,不过价格仍然未定。R9 280X/270X则是“游戏玩家的甜点”。
面向中低端的R7系列。