如何评价华为的麒麟980芯片?

华为是否掌握核心技术?是否性能强过骁龙845?
关注者
75
被浏览
118,107

12 个回答

来源:微博media.weibo.cn/article?




今年在IFA,华为首席执行官余承东在公司的主题演讲中宣布了今年新款的麒麟980 ,而不是让我们突然在展会上找到新的芯片。对于那些过去几个月一直关注我们文章的读者来说,今天的新闻应该不会出现太大的意外,因为我一直在暗示第一批新的7nm Cortex A76芯片将在稍后出现。今年在商用设备领域,HiSilicon成为新一代SoC市场上第一个市场供应者。

华为的半导体设计部门——海思半导体,一直是该公司产品的关键战略组成部分,因为它比我们通常看到:仅仅依赖于高通等成熟的开放式SoC供应商;能够以更为激烈的方式实现差异化。



这种策略当然是一把双刃剑,就好像你全押宝在你内部消化的芯片一样,这也意味着这些设计必须正确执行,否则你会发现自己处于不利的竞争地位。

麒麟950是一款令人印象深刻的芯片,因为它在当时全新的台积电16FF制造工艺上首次采用了Cortex A72 - 这为华为带来了丰厚回报,新IP+新制造节点的组合,使得它极具竞争力。

另一方面,麒麟960和麒麟970展示了这一策略的风险,并且事情可能偏离轨道 -

麒麟960是一款16nm SoC,当它发布时,10nm的竞争对手如Snapdragon 835和Exynos 8895占主导地位。

当切换到10nm制造节点时,麒麟970表现更好,但这次HiSilicon没有采用最新的ARM CPU IP设计,而依赖于于A73 CPU,Snapdragon 845则采用了新的A75。

此外,最近两代麒麟表现出极其缺乏竞争力的GPU性能和效率数据 - 在这里HiSilicon陷入困境,这应该是IP供应商能够与高通等市场领导者进行竞争性设计的能力。

我之所以重申最近几代发生的事情,是因为此次HiSilicon发现自己处于一个非常有利的位置,在这个位置上,IP和制造业已经融入了新设计,达到最佳情况。

ARM的新款Cortex A76和Mali G76在性能和功效方面都有飞跃,而台积电正在大规模生产其新的7nm芯片。

新款麒麟980,首款推出的台积电7nm SoC以及首款Cortex A76和Mali G76设计:


新的Kirin 980思索了ARM的所有最新可用IP之后,最终采用了——4个Cortex A76和4个Cortex A55组成的DynamIQ CPU集群配置。

今天对我来说最大的惊喜,是看到HiSilicon已经向前迈进了一步,充分利用了ARM的新DSU集群及其异步CPU配置,实际上全新的Cortex A76被分为两组,每组都有自己的时钟和电压。


性能最高的Cortex A76运行速度高达2.6GHz。

这比ARM最初公布的CPU的3GHz目标要低,但是我曾警告读者,表示应该期望在2.5GHz附近采用更保守的频率,因为更高的频率似乎意味着更高的TDP(热设计功耗)。

尽管如此,新的CPU架构仍然带来了显着的性能改进,在2.6GHz仍然表现非常出色,为这一代带来领先的性能。

令人惊讶的是,第二集群的Cortex A76核心运行频率高达1.92GHz,对电源效率来说是绝佳消息。在这里,我们看到一个“中等”效率CPU组。

由于这两个内核在与高性能集群的A76在分开的时钟和电压平面上运行,这意味着它们可以在不同的效率点运行,从而在各种多线程操作中更有效的节省功耗。

以前,四核集群运行在相同的时钟和电压上,如果有一个高性能线程需要高性能状态,这意味着其他中等性能线程被迫进行不必要的运行,导致功率效率下降。

这种效率较低的性能状态,通过引入中间层,有效地消除了这种在实际应用中常见的开销。

到目前为止,我还没有能够与HiSilicon证实这一点,但是这个中等性能的双核A76的时钟减少也会强烈指出可能不同的物理实现具有较低的硅签核频率(???)。这意味着即使两对A76都是相同的IP,这个中间集群在以相同频率运行时实际上更有效。

最后,我们看到四个新的Cortex A55内核是SoC中最节能的主力核心,它们能够承受高达1.8GHz的工作负载。此外,凭借中等性能集群,HiSilicon可能能够为A55实现很高的功耗效率,从而使频率在当前的A53和A55 SoC范围内。

缓存方面,所有Cortex A76都带有ARM推荐的512KB L2缓存配置,而A55则采用128KB缓存。

提醒一下,在新的DynamIQ群集配置中,这些设计的L2缓存是每个CPU核心专用的。DSU中的L3缓存已完全实现4MB,是我们在Snapdragon 845中看到的两倍。

我无法确定麒麟980中DSU的频率,也没有确定它自己有一个单独的时钟和电压平面,这里可能它可能与A55的同一平面上。

再一次讲下,这只是我的猜测,另一种可能性是980有4个完整的时钟和电压平面用于整个CPU。

与麒麟970相比,CPU性能提高75%,效率提高58%

在性能提升方面,HiSilicon承诺比麒麟970增加75%,我根据ARM声称的性能,经过一些数学运算预测A76实际的性能。


以下预测属于我自己,并考虑了ARM和HiSilicon的性能声明:


您可能已经注意到,功率和效率预估也包括在内。

海思半导体宣称,麒麟980的功率效率比麒麟970高58%。

我们无法确认:这是否意味着在970的相同性能或者麒麟980的目标性能下,能效比提高了58%;还是在SoC各自的峰值性能状态下,其性能均优于58%。

该假设假定后者,它实际上再次与ARM 自己关于Cortex A76的吹牛逼相匹配。


我还是很很怀疑这些数字,因为他们似乎相当惊人;

不过到目前为止,我还没有看到任何实际上会打破这些牛逼的信息。

在我们真正拿到第一台麒麟980设备之前,请考虑上面的功率和效率估算。


3集群CPU层次结构也带来了调度方面的复杂性。

正如我们今年所见,调度是现代SoC的一个关键,因为它具有非常高的动态性能和功率范围,使用最优解决方案对于SOC至关重要。

在这里,海思承诺推出一种新的“灵活调度”机制。遗憾的是,我们没有更多细节,但它将成为新款麒麟980的重要组成部分。

新Mali-G76 MP10 - 实际算是20个“渲染管道”

麒麟980也是第一款采用ARM新一代Mali G76 GPU的SoC。

G76与过去的Midgard和Bifrost GPU大不相同,它大大改变了你认为是“核心”的结构。

G76基本上在纹理单位,渲染单位上加倍,并且算术管道的宽度加倍。

实际上,G76核心几乎相当于两个G72核心。


这意味着,在纸面上,G76 MP10乍一看可能不如麒麟970中的G72 MP12,但它实际上计算资源增加了66%,这还没有考虑到新IP的架构改进。

麒麟970的GPU时钟频率高达747MHz - 但此频率下的功耗对于SoC来说仍然太大,推测实际工作负载可能在在低得多的频率下有效运行(本人注:可能GPU阳痿?)。

麒麟980以720MHz的频率运行新GPU,并将性能提升46%。我们在这里没有任何关于工作量的详细说明,但通常行业标准通常是GFXBench Manhattan。

性能提高46%,能效比提高178%

新GPU的真正杀伤力,是海思列出一个庞大的对比阵容,相比麒麟970,推断结果是能耗比有 178%的提升:


至少在这个工作量下,所宣称的性能提升对于Snapdragon 845的Adreno 630来说仍然有点太低了。根据Mali G76不同的扩展,我们可能会根据不同的测试得出不同的结果,显示重新填充繁重工作负载与算术/计算繁重工作负载的重新平衡。

麒麟980将展示飞跃性的功耗和效率。根据ARM自己的数据,HiSilicon的营销声明最终与我们对G76的预测差不多。

如果跟预期的那样,那将意味着新的麒麟980最终将恢复到麒麟950的可持续功耗(本人注:就是日常阳痿机率变小),从而消除了前两代Bifrost GPU带给用户的恐惧。

我今年一直在呼吁大家注意可持续性能,我真的希望麒麟980最终接近预测,因为这不仅是SoC的重要一步,也是消费者体验的飞跃。

更快的内存控制器

980采用LPDDR4X内存控制器,虽然它声称是业界第一款运行在2133MHz的芯片,带宽增加了13%。

麒麟970的缺点之一是内存控制器在较高频率下非常耗电,希望新设计解决这些问题,以便高性能状态下的效率更高。


令人惊讶的是,HiSilicon公布了一些内存延迟和带宽数据:

在GeekBench 4测试中,麒麟980的测试值为138ns,而Snapdragon 845的测量值为176ns。

这实际上有点令人眼花缭乱,因为在上下文中,延迟数字并非全部好的:麒麟970也有类似的138ns延迟,与Snapdragon 835相同。

然而所有这些都比Exynos 9810的78ns更差。

在这里,我希望厂商改造不会限制A76的峰值性能,就像高通公司在S845中增加的新L4系统缓存延迟阻碍了A75核心的性能。

对于Snapdragon 845,带宽数据为23.1GB / s而不是19.2GB / s。

我被告知GB4的内存带宽测试在某一点之后会出现问题,因此我暂时对这些结果的重视程度不高。

新ISP

麒麟980采用了新的ISP,增加了46%的吞吐量,能够支持更高分辨率的摄像机。

HiSilicon的第一款产品是引入用于HDR捕获的10bit流水线,这一功能也在今年竞争对手SoC中引入,但由于色彩管理和显示的落后,实际上很少使用。


新的ISP现在能够使用“多通道降噪”,这听起来很像今年Snapdragon 845中引入的多帧降噪功能,其中噪声降低不是基于空间像素执行,而是基于时间帧间基础,产生更清晰的无噪声图像,没有模糊的副作用。

还有一个新的视频编码管道,承诺在捕获之间“延迟33%”。最后一部分的意义还不清楚 - 麒麟970缺乏4K60编码功能,而麒麟980是否支持它是我们仍需要与华为澄清的事情。

新的“双NPU”,2倍吞吐量

麒麟980继续改进其神经网络推理加速IP,并推出了新的“双NPU”。

事实上,这意味着该模块已经加倍,就像将缩放单元添加到GPU一样。

该块一次只能处理一个模型内核,这意味着实际上单个推理的速度应该加倍,这取决于NN模型。


据说新单元比麒麟970的NPU快2.2倍,每分钟可实现高达4500次推断,或识图速度达到75 fps。

他们也提供了Snapdragon 845和Apple A11的数据,根据我自己的测试,这些数据非常准确。

更快的Cat.21基带,速率高达1400Mbps

麒麟980中的新基带提升了功能 - 现在它能够支持高达1400Mpbs的UE Cat 21。

通过4x4 MIMO组合实现高达3倍的载波聚合,同时支持2x2 MIMO和上传链路(类别18)中的新256-QAM,并实现200Mbps上传速度。

台积电7纳米制造工艺,69亿个晶体管分布在小于100mm²的面积上

新芯片组拥有69亿个晶体管 - 与去年的麒麟970相比增长25%,达到55亿个。

由于新的7nm TSMC工艺节点,HiSilicon能够保持小于100mm²的小芯片面积。


该项目于2015年开始,采用7nm工艺节点研究,从2016年开始进行IP单元开发,并于2017年进行验证。

最后,SoC自今年夏季开始大规模生产。

自家的WiFi芯片组

令人惊讶的是,980采用自家新款Hi1103 WiFi芯片组。

新芯片支持802.11ac,速度高达1732Mbps,支持2x2 MIMO和高达160MHz频宽。

我说这是令人惊讶的,因为通常华为会采用博通Broadcom的WIFI芯片,博通的解决方案被认为是行业领先的,并且基本上可以在每个旗舰设备中找到。

新款HiSilicon芯片组的表现如何,这将会是一个很有趣的问题。

群星汇聚麒麟980

麒麟980确实看起来像是一个非常均衡的SoC,在各方面都有重大改进。

麒麟960和970面临的竞争非常激烈,这既是由于工艺节点的劣势,也是由于IP的劣势,两者都因GPU性能和效率不佳而受到很大影响。

而麒麟980希望通过ARM的新Cortex A76 CPU,G76 GPU,内存控制器,ISP和更新后的NPU等新内部IP模块,再加上领先的7nm制造工艺,解决这些问题。

所有这些新特性的结合使新款麒麟980处于极佳的竞争地位,即将推出的Mate 20应该是一款值得期待的设备。​​​

首先是 7nm 工艺。

话说,这个nm就是纳米。X nm芯片,是指芯片采用X nm制程,线宽最小做到X nm尺寸。X值越低,集成电路的精细度越高,同样的体积下,就可以塞进更多的电子元件,性能也就越强,越先进。


芯片晶圆

一根头发丝直径约为0.1毫米,7nm相当于头发丝的万分之一,基本上已经快和原子一样大了。


7nm,已经接近半导体工艺的极限

此前的旗舰手机芯片,例如高通的骁龙845,华为的麒麟970(980的前代),用的都是10nm工艺。

根据官方数据,7nm相比于10nm可带来20%的性能提升,40%的能效提升,60%的晶体管密度提升。



采用了7nm工艺的麒麟980,集成了多达69亿个晶体管,相比麒麟970(55亿个)增加了25%,同时晶体管密度增加了55%,而芯片面积仅相当于指甲盖大小。



目前全球具备7nm芯片研发生产能力的只有三家,分别是台积电、三星和英特尔。而华为合作的对象,就是台积电。


台积电=台湾积体电路制造股份有限公司

我们再来看看CPU。

麒麟980芯片采用的是2+2+4的大中小核CPU形式。



其中两个频率为 2.6GHz 的 A76 「大核」负责高负载任务,两个频率 1.92GHz 的 A76「中核」负责日常任务,四个 A55 「小核」(1.8GHz)负责轻度运算。

A76,就是ARM公司新一代的CPU架构:Cortex-A76。(关于ARM和Cortex架构,大家可以看小枣君之前的文章:芯片春秋·ARM传)

相比于采用10nm制程的Cortex-A75(骁龙 845 搭载的内核型号),采用 7nm 制程的A76性能提升35%、能效提升40%,机器学习速度提升400%。



第三点,是NPU。

NPU这个概念是华为在麒麟970发布时推出来的,号称是世界上第一款AI芯片。确切地说,应该叫嵌入式神经网络处理器(Neural Network Processing Unit)。当然啦,还是叫AI芯片比较高大上一点。



简单地说,NPU是专门用来处理神经网络算法和机器学习的。

由于神经网络算法及机器学习需要涉及海量的信息处理,而手机已有的传统CPU和GPU都无法达到如此高效的处理能力,于是,就捣鼓出一个独立的NPU芯片,专门干这事。

麒麟970的NPU是单核的,这次980用的是双核。余大嘴说,新的NPU处理单元速度要比麒麟970上的快2.2倍。



话说,这个AI芯片也不是完全华为自己做的,用的是寒武纪科技的1H处理器,实现每分钟图像识别 4500 张,支持人脸识别、物体识别、物体检测等 AI 场景。


寒武纪,Cambricon,现在也是风投追捧的大红人

第四点,GPU。

这块没啥好说的,GPU就是图像处理芯片,就理解为显卡核心吧。

麒麟980采用了Mali G76的GPU,这是ARM重新设计架构后的新款高端GPU,相比前代性能提高了76%,复杂图形和机器学习的能力得到显著提升。

第五点,这个是我们通信人最关心的了,就是基带芯片能力。

之前小枣君曾经和大家说过,手机芯片是SoC芯片(System-on-a-Chip),包括了很多模块。


高度集成化的手机芯片

其中,基带芯片,就是专门负责通信的。你手机其它部分再牛掰,没有基带芯片,也就是一个单机PC,只能玩玩单机游戏。

目前的麒麟980,支持LTE Cat.21,业界最高下行速率1.4Gbps,包括4x4 MIMO 1.2Gbps(三载波聚合)、2x2 MIMO 200Mbps两部分组成,并支持256QAM。

这段话是不是看懵逼啦? 别急,我来一个一个解释!

LTE Cat.,是指LTE Category,简单的说,就是终端设备(手机)接入LTE网络的速率能力。这个能力分为很多种,如下:



4×4 MIMO,2×2 MIMO,就是多天线,一个手机多根天线收发。以前我都详细介绍过的。

载波聚合,简单地说,就是将多个载波聚合成一个更宽的频谱,同时也可以把一些不连续的频谱碎片聚合到一起。



三载波聚合,就是把三个载波拼在一起用,也就是上面图片里面的最粗的那根管子。

最后一个QAM,就是正交幅度调制,这个理论性有点强了。大家只需要知道,256QAM,实际上是5G的标配。

虽然大家看到这个麒麟980的网络通信能力很强,但是——

目前的它,不是5G芯片!

它只能算是4.5G手机芯片。是的,因为麒麟980目前没有采用5G基带,所以不是5G芯片。

但是,它具备兼容能力,兼容华为即将推出的5G基带芯片——Balong 5000。

一旦Balong 5000到位,搭配麒麟980,就是真正的5G手机芯片了。