【解析】ZEN降临前的预演,全面解析AMD第七代APU产品

 

2016年9月,AMD发布了APU家族最新的第七代产品,最高端型号变成A12,它会有哪些变化呢?...



AMD作为目前全球唯一一家布局了高端GPU和CPU的企业,在技术融合上一直有自己的路线,其实际产品就是APU——这种融合了CPU和GPU优势的处理器产品,在长达数年的发展过程中也逐渐被业界接受和认可,成为CPU、GPU之外的第三股势力。

2016年9月,AMD又发布了APU家族最新的第七代产品,最高端型号变更成A12,那么它会有哪些变化呢?



▲AMD发布全新的第七代、代号为Bristol Ridge的APU产品。

AMD在2016年9月发布了全新的第七代APU产品,产品代号为“Bristol Ridge”,这款新产品最引人瞩目的一点就是加入了全新的AM4接口。不过,AMD本次发布可谓非常低调,不但没有大张旗鼓地召开发布会,媒体上也比较少有报道出现。AMD这样做的原因可能是考虑到Bristol Ridge面向的并非是零售端市场,而是几乎全部面向OEM市场,自然不需要在大众媒体上大力宣传。当然,AMD之前也出现过面向OEM的产品由于非常热销,反而最终推向零售端市场的情况。因此用户能否看到Bristol Ridge系列APU出现在市场上还得看AMD的营销策略。

继承Carrzio的血脉

Bristol Ridge架构解析

从架构和继承角度来看,目前市场上销售的APU产品几乎都采用了Kaveri核心或者其改进版本。2015年,AMD在ISSCC 2015上公布了Carrzio APU,面向低功耗市场。相比之下,Carrzio APU的CPU部分改用了升级版本的“挖掘机”架构,GPU部分改用了GCN 1.2架构,工艺则提升到新一代的TSMC 28nm,功耗得以大幅度降低。实际上,最新发布的Bristol Ridge和Kaveri APU关系不大,反而可看做是Carrzio APU架构的进化版本(Carrzio APU被称作第六代APU),CPU部分采用了改进版本的“挖掘机v2”,GPU部分改进至GCN 1.3(或称为GCN 3.0),整体架构基本继承Carrzio,没有在架构上进行显著的变化。

Carrzio上AMD对CPU架构的改进

在此前《微型计算机》介绍Carrzio的文章中,曾提到AMD对“挖掘机”架构的改进主要是为了提高IPC和加入了全新的指令集。这些变化包括:

1.AMD声称挖掘机架构的每时钟周期指令吞吐能力相比前代产品,大约会提升5%。缓存方面,挖掘机架构将在一级缓存访问延迟不变的情况将容量翻番,这有助于提升命中率,也能从一个侧面提高处理器在绝大部分场合下的性能。

2.挖掘机架构加入了AVX2.0(全称是“高级矢量扩展2.0”,它可以支持256位整数矢量操作、支持乘加融合指令、支持加载离散数据,AVX 2.0指令集将对视频编码、音频处理、整数密集型应用带来一定的性能优势)、BMI2(位操作指令集)、MOVBE(和HSA功能相关)、RDRAND(和HSA功能相关)等指令集,并且还有望加入TSX支持事务性内存的指令集。

下面来简单介绍下CPU、GPU和工艺。

CPU方面:目前Bristol Ridge的CPU部分是“挖掘机v2”,但是AMD没有给出新的v2版本相比之前Carrzio的“挖掘机”架构有什么变化。考虑到Bristol Ridge在功耗、频率上的优化,很可能相比“压路机”到“挖掘机”的IPC进步而言,“挖掘机v2”的重点在于继续提高能耗比。另外, Bristol Ridge的L1数据缓存相比之前的Kaveri架构提升了一倍,达到了128KB,与之对应的是L2缓存从之前Kaveri的4MB降低到了2MB。L2缓存的大幅度降低有助于减少晶体管数量、降低功耗、提高能耗比,但是会损失一些性能,尤其是在降低CPU命中率方面。当然,大幅度提升的L1数据缓存会弥补这样的损失,想必这是AMD经过多次模拟后在性能和功耗方面取得的最佳平衡点。

GPU方面:Bristol Ridge的GPU架构改用了比较新的GCN 1.3,也就是Fury X上使用的GCN 3.0。架构方面,AMD在GCN4.0之前的架构改进都集中在不断地扩大规模、提高性能功耗比,增加部分新功能以更好地支持新的DirectX版本,整体架构提升不算明显。因此,现在的GCN1.3可以比较好地支持DirectX 12。当然对APU类产品来说,APU要流畅地运行DirectX12大作还是比较困难的。



▲AMD GCN 1.3/GCN 3.0最出名的产品就是首次使用HMB显存的Fury X了。图为Fury X架构简图,其GPU部分和Bristol Ridge的GPU部分同根同源。



▲AMD给出了Bristol Ridge的部分官方测试成绩,其中3DMark 11的测绘成绩尤为抢眼。

规格方面BristolRidge的GPU架构和Kaveri、Carrzio基本相同,单个CU都拥有64个流处理单元,最多可集成8个CU单元也就是512个流处理单元。不同档次的Bristol Ridge处理器集成的CU单元数量从高端到低端分别为8个、6个、4个,流处理器单元数分别为512个、384个和256个。虽然CU单元和流处理器数量没有发生变化,但Bristol Ridge的GPU频率大幅度提升,最终性能相比Kaveri肯定会有显著的加强。AMD宣称Bristol Ridge中A12APU在图形性能上比Core i5超出了大约88%~99%,鉴于AMD在GPU上强大的实力,这样的结果也是在意料之中。

视频编解码和输出方面:在编解码能力方面,Bristol Ridge APU内部的编解码模块支持MPEG2(IDCT/VLD)、MPEG4(Level5)、MJPEG 1080p@60Hz、VC1-VLD(Level 3)、H.264(Level5.2)以及HEVC 8-bit(Level 5.2)、VP9的解码,基本囊括了目前所有的视频编解码类型。输出方面支持3路数字输出,支持的输出格式为DVI、DP1.2a、HDMI 2.0、eDP,不再支持VGA输出。

工艺方面:BristolRidge使用的还是TSMC的28nm工艺,只不过现在的28nm工艺在功耗控制、漏电率、成型等方面已经远不是早期的28nm工艺可比拟的。在Carrzio上,AMD全面更换了库文件,使得Carrzio表现出了极为出色的能耗比,这一点也被Bristol Ridge所继承。虽然Bristol Ridge也采用了28nm工艺,且频率更高,但它的功耗反而降低了,这是Bristol Ridge相对其他28nm APU的一大优势。



▲AMD给出的三代APU产品性能对比。

▲挖掘机架构带来了性能提升。



Bristol Ridge的亮点

频率、接口、DDR4和HSA

AMD本次发布的Bristol Ridge处理器一共有8款,囊括了从最高端A12到入门级A6、以及一款没有GPU、面向入门级用户或者独显用户的Athlon X4。按照TDP功耗来分则可分为65W和35W两个版本,其中65W的产品有5款,35W的版本有3款。所有的35W版本都有“E”后缀,用户识别比较方便。



从频率、功耗可以看出,本次Bristol Ridge APU的最大亮点在于功耗降低的情况下,频率甚至不降反升。而出现这样的情况,要么说明AMD对在APU中如何分配CPU和GPU部分的功耗有了全新的控制方式,要么说明AMD在工艺上有了长足的进步。但无论如何,这显示了Bristol Ridge在性能上的又一大进步,要知道,这是在28nm工艺下取得的成绩,实属不易。

令人欣喜的还不止频率、功耗的优化,Bristol Ridge APU在超频上的也足以令人满意。尤其是在开放倍频后,只要选择一款不错的主板、电源,再做好散热的话,可以简单地通过调整倍频将Bristol Ridge APU提升到更高频率。



▲Bristol Ridge的A12-9800超频能力非常不错,可以轻松超至4.8GHz,性能也得到了显著提升。







根据测试来看,A12-9800APU在没有调整外频的情况下就超频到了4.8GHz,此时倍频为48,外频为100MHz,且顺利地通过了Cinebench 11.5和Cinebench R15的测试,性能分别为4.77和380。数据显示,超频后的A12-9800在Cinebench 11.5的多线程测试部分轻松超越了默认频率下A10-7890K的3.83分,也超过了Core i3-6300的4.58分;在新的Cinebench R15中,4.8GHz的A12-9800得分虽然没有超过Core i3-6300的414分,但是也轻松超过了A10-7890K的331分,且比默认状态下的334分提升了约13.7%,和频率提升幅度呈线性关系,还是相当出色。考虑到之前基于Carrzio架构的Athlon X4 845处理器存在的超频难题,Bristol Ridge APU那经过优化的28nm生产工艺显然值信任。



▲即使频率相比A10-7890K略低,但是单线程性能上A12-9800还是略微胜出前者。

说完了超频,再来看看规格方面的进步。众所周知,APU对内存带宽的渴求远远超过一般的CPU,毕竟还有GPU这个带宽大户存在。因此,AMD之前已经在Kaveri上将内存规格提升到了DDR3-2133,几乎没有进一步提升的空间了。而在全新的Bristol Ridge上,AMD将内存控制器提升至DDR4-2400,并保留了对DDR3内存的向下兼容(需要主板提供相应插槽)。考虑到延迟等因素,DDR4-2400的性能可能不会比DDR3-2133强多少,但是整体来看,DDR4更有发展潜力,也是AMD在Zen架构高端CPU来到之前的一次预演。

接口方面,BristolRidge APU换上了全新的AM4接口。AM4接口内置1331个处理器针脚,比现在AM3的940针多出了近400个针脚。此外,AM4将接口插槽从之前的OPGA换成了uOPGA(针脚的直径更小,在同样大的CPU底座上可以支持更多的信号线和针脚),最大热设计功耗也提升至140W以上,未来可以推出更多高TDP功耗的产品。而在面向部分超低功耗用户和特殊用户的Bristol Ridge APU上,它的针脚会改为FP4 BGA接口,这种接口使得CPU直接焊接在主板上,用户不可自行更换。





▲全新的AM4接口和插座,针脚数量增加到了1331个。

最后,再来看看AMD一贯以来高调宣传的HSA异构运算功能。Bristol Ridge对HSA的支持和之前的APU没有任何变化,都是1.0规格。性能方面,AMD宣称A12-9800在PCMark 8 OpenCL加速环境下的测试性能可以匹敌Core i5 6500,低功耗版本的A12-9800E则超出同为低功耗设计的Core i5 6500T大约17%。

Bristol Ridge的座驾

B350和A320芯片组简介

AMD这次为Bristol Ridge APU搭配了两款全新的芯片组:B350和A320。在接触这两款芯片组之前,先来了解一下有关Bristol Ridge APU在PCIe通道上的一些特殊设计。

BristolRidge APU提供给外部的PCIe通道数只有PCIe3.0 x8,而不是之前Kaveri的PCIe 3.0 x16。从APU端来看,AMD的确预留了16条PCIe 3.0通道,除了用作外接设备的x8外,剩余的8个通道中,4个通道用于连接芯片组,1个通道留给USB 3.0设备,1个通道用于连接2个SATA控制器,还剩余2个PCIe通道可以用来转接其他设备,比如NVMe设备等。此外剩余的两个PCIe 3.0通道也可以合并成一个PCIe 3.0 x2单独提供给某些设备使用。

从通道的分配可以看出,AMD似乎并不在乎APU用户可能需要连接PCIex16接口的高端独立显卡,毕竟APU本身就自带显示核心,面向的OEM厂商一般也不会搭配高端显卡。而如果搭配一款中低端显卡的话,根据大量的测试表明,PCIe 3.0 x8和PCIe 3.0 x16几乎不会有太明显的性能差异。当然,对一些主板厂商而言,Bristol Ridge APU的PCIe 3.0 x8接口可以分成两个PCIe 3.0 x4,再用桥接器连接至两个PCIe 3.0 x16插槽,不过这样做的市场意义就非常有限了。对AMD来说,降低APU中的PCIe通道数量还有一个显而易见的好处就是节约处理器晶体管和面积,可以在一定程度上起到降低功耗的作用。

实际上,由于目前APU的集成度越来越高,因此芯片组已经成为了“超级外接设备中心”,只是用于连接网络、USB、SATA等设备,或者提供RAID功能等。像英特尔这样的厂商会用自己的DMI总线绑定处理器和芯片组,使得下游厂商不得不选择他们的产品,但对AMD这样使用开放的PCIe总线作为链接线路的厂商而言,选择什么样的芯片组并没有强制性需求。甚至对于一些特殊场合,Bristol Ridge APU并不是非要搭配芯片组使用。OEM厂商和部分整机厂商也喜欢通过连接特殊设备来展示自己在设计上的功力,比如高速SSD接口、Thunerbolt 3接口或者其他产品,毕竟Bristol Ridge APU自己也是一颗全功能的SOC芯片,单独使用也很正常。

说完了BristolRidge APU本身,再来看看芯片组。AMD发布的两款芯片组分别是B350和A320,接口都是AM4,其中前者面向主流用户,后者面向入门级用户,还有一款X/B/A300的芯片组面向小体积平台。



▲AMD推出了两款芯片组搭配Bristol Ridge APU。

规格上,B350相比A320,能够多提供一个USB 3.1接口、2个PCIe 2.0 x1通道,其余的诸如USB 3.1、USB 2.0、SATA、SATA Express、RAID功能等两者完全一样。值得一提的是,AMD的新芯片组原生支持USB 3.1@10 Gbps,规格上还是颇为超前的。不过,目前AMD的芯片组还不能支持USB Type-C,需要第三方芯片才能实现。



▲新芯片组的规格

功耗方面,AMD宣称新的B350功耗仅为5.8W,相比之前的A78和AMD 970等芯片组的7.8W、19.6W大幅度下降。据悉B350和A320都采用了TSMC55nm工艺,价格低廉量又足,成本控制应该非常出色。



▲新芯片组采用55nm工艺,功耗大幅度降低。

黎明之前

一切都在等待Zen

看完上面的介绍,可以看出,从产品和发布态势来看,AMD对APU产品线态度是“维持”,没有特别积极的更新工艺,也没有推出革命性新品,依旧使用TSMC 28nm也是证据之一,毕竟已经登场多时TSMC 16nm FF目前价格还略贵。如果AMD处在上升期,那么使用全新工艺打造APU并用更高的频率和性能来击垮对手就是理所应当的,但实际情况是AMD正处在战略调整期,资金状况表现也不是特别出色,维持目前的状态即可。

更具意义的是通过本次APU的发布,AMD将会把主流的产品接口从之前的AM3、FM2+、AM1等多种产品并存的情况全部统一至AM4,能够让OEM厂商以一套设计应对从主流到超值等不同价格档次的用户,节约了成本,提高了效率。



▲AMD未来桌面产品将全部统一到AM4平台,移动端还将维持FP4一段时间。

AMD之前公布的2016年路线图,不过由于各种各样的原因,Zen和新的高性能GPU都推迟到了2017年。

从AMD给出的路线图来看,在Zen架构的产品没有登场之前,AMD都将保持现在的情况,重点放在OEM市场上,针对OEM用户推出新品,尽可能地降低企业开支,让产品能带来持续的现金流。在APU方面,Bristol Ridge APU将接替之前的Godavari和Kaveri,一直持续到2017年第一季度,等到Zen产品发布并开始销售后,AMD才会开始更新APU的架构,为其换上全新的Zen CPU和GCN 4.0 GPU,那个时候,AMD APU才会焕发出全新的光彩。




    关注 微型计算机


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册