华为芯片的芯片,是这样吗

导读: 华为的“达芬奇计划”曝光,该计划是开发用于数据中心的AI芯片,以挑战当下在AI芯片市场占据龙头地位的NVIDIA,那么对于华为来说它加入AI芯片大战有多少胜算呢?

华为的“达芬奇计划”曝光,该计划是开发用于数据中心的AI芯片,以挑战当下在AI芯片市场占据龙头地位的NVIDIA,那么对于华为来说它加入AI芯片大战有多少胜算呢?

NVIDIA在AI芯片领域取得领先优势并非一朝一夕所取得的,这是它十多年来努力获得的结果。随着AI的兴起,业界日益认识到GPU所拥有的低精度、并行计算等优点更适合神经训练,这是GPU开始逐渐被应用于AI领域的原因,不过NVIDIA能在该领域占据领先优势并不仅仅是它所拥有领先优势的GPU,毕竟另一家GPU厂商AMD的Radeon GPU在性能方面与NVIDIA旗鼓相当,但是在AI领域却远远落后于NVIDIA。

NVIDIA在AI芯片市场取得领先优势除了其所拥有的性能强大的GPU之外,还与它早早打造的CUDA平台有很大关系。NVIDIA很早就认识到了GPU所拥有的强大计算能力,并认为GPU将较CPU有更大的的发展前途,为此它开发了CUDA平台,这个平台可以将GPU作为一个并行数据计算的设备,对所进行的计算进行分配和管理,用户的开发门槛大大降低了。

在NVIDIA的努力下,CUDA平台逐渐获得一些开发者的加入,并逐渐形成了自己的生态,只不过当时由于数据中心绝大多数都是基于Intel的X86架构服务芯片开发,NVIDIA的CUDA平台并没有获得迅速的发展,直到AI的兴起,CUDA平台所拥有的优势开始获得认可,目前全球绝大多数的神经训练网络都是基于NVIDIA的芯片搭建,CUDA平台开始形成一个良好的生态平台,它让AI开发者可以基于CUDA平台更容易开发各种应用和服务,NVIDIA开始在AI领域取得领先优势。

NVIDIA并未占据绝对的优势

当NVIDIA在AI芯片市场逐渐取得领先优势的时候,各互联网巨头也开始在AI领域发力,不过或许是受市场过于受制于Intel的影响,互联网巨头并不希望在AI芯片上完全受制于NVIDIA,而且各个互联网巨头在AI领域的发展方向有自己的侧重点,例如图片分析与语音分析就有很大的差异,NVIDIA的通用方案导致在计算效率方面并未达到理想的状态,谷歌就专门开发了自己的AI芯片TPU并针对自己的AI算法进行深度优化获得更高的运算效率。

正因此全球的AI芯片开始呈现百花齐放的局面,尤其是中国市场诞生了数百家AI芯片企业,当下中国较为知名的AI芯片企业就有寒武纪、地平线等芯片企业。

片企业呈现高度繁荣的景象也与中国在2014年成立的基金的支持有很大关系,中国已认识到芯片的重要性为此对于国内兴起的芯片企业给予了大力支持,而AI芯片作为新兴芯片行业更容易在当下国外芯片企业尚未占据绝对优势的时候突围而出,自然也成为中国支持的重点。

华为布局AI芯片有它的优势

华为是中国实力最强的芯片设计企业,其研发的已追上了国际领先水平,与手机芯片老大高通不相上下,其在智能手机芯片市场取得成功之后开始介入更多的行业,在备受关注的服务器芯片方面它就基于ARM的授权开发了自主核心泰山,可见它对服务器芯片市场的野心,在这样的情况下顺势介入当下逐渐火热的AI芯片行业也可以认为是顺势而为。

华为是中国服务器市场的有力竞争者之一,其已成为全球第四大服务器供应商,当下其也已成立华为云事业部,这都可以看出它在数据业务方面的野心以及所拥有的能力,其可以如谷歌一样将自己的AI算法与AI芯片进行深度优化获得更高的运算效率。值得注意的是国内最大的云服务供应商阿里巴巴也宣布开发自己的AI芯片,华为更不应落于人后。

去年华为领先业界在自己的手机芯片麒麟970上集成了从寒武纪获取授权的AI芯片,显示出它在AI芯片开发和应用上都取得了一些经验,这有助于它开发自己的AI芯片取得成功。当然从谷歌开发TPU花费了数年时间来看,华为自己的AI芯片要取得成功也需要一些时间。

笔者认为华为开发AI芯片是有很大的可能性获得成功的,不过其AI芯片要获得其他企业的采用并不容易,毕竟竞争对手考虑到竞争关系一般都不会采用华为的AI芯片,华为研发的AI芯片很可能也将如手机芯片一样主要是应用于它自己的通信设备、手机、服务器以及华为云业务上。

猛然一看华为打着自主芯片旗号

利用此情怀卖的比小米高通芯片还贵

华为手机的朋友,这么爱国,怎么没人支持中兴


为了抢这个“世界第一”着实花了不少心思,作为一个以“自研”为骄傲的企业,本次麒麟970上不仅使用的是别家的(寒武纪的)神经网络处理单元(NPU),智东西还独家获悉到,麒麟970在物体识别方面的一整套嵌入式AI解决方案(从算法+Camera Tuning)都来自中科创达。下面就随手机便携小编一起来了解一下相关内容吧。

华为这周末搞了件不大不小的事——发布了“世界首款手机”麒麟970——各位科技媒体小编都辛苦了,大周六晚上的不是飞去德国跑会就是在电脑前蹲直播,连约会都要改期,好气哦。

(华为官方推特介绍,“世界上第一款搭载NPU的AI芯片”)

华为为了抢这个“世界第一”着实花了不少心思,作为一个以“自研”为骄傲的企业,本次麒麟970上不仅使用的是别家的(寒武纪的)神经网络处理单元(NPU),智东西还独家获悉到,麒麟970在物体识别方面的一整套嵌入式AI解决方案(从算法+Camera Tuning)都来自中科创达。

此外,据业内人士透露,寒武纪的AI架构在麒麟970上实现的梳理也并非全部是华为海思自研的技术。

这款芯片打造了多少个月?仅是加了一个NPU模块就能叫“AI芯片”吗?为什么华为要这么紧赶慢赶抢“第一”?联发科、深鉴科技等业内人士又是怎么看待麒麟970?……以上种种疑问,智东西将为你一一揭晓。

麒麟970的参数想必大家已经被刷屏了一遍又一遍,但为了文章完整性这里还是不能免俗地需要列一列数据,看过的读者可以直接跳过这段:

众所周知,目前九成的手机芯片采用的是ARM的架构,麒麟970也不例外。麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构,采用了台积电10nm制造工艺,搭载12核高效GPU、8核高性能CPU,4.5G高速LTE Modem,支持LTE CAT.18,最高下载速度可以达到1.2Gbps,与高通目前发布的最强的X20 LTE基带实力相当。

特别值得一提的是,麒麟970的GPU用上了ARM最新推出的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。这个架构很厉害,比上一代的Mali-G71性能提高了40%,能效提高了25%。

但如果抛去数据,一个小细节能让你更直观地理解它:在智东西跟某移动端大咖聊天的过程中,他对NPU、10nm统统只是点头微笑,唯有在看到MP12 GPU小小地惊讶了一下。

与此同时,麒麟970拥有两个用于处理图像信息的ISP,能够更快速地响应处理图片,并且能在低光照度环境下对降噪进行优化。

由中科创达提供的智能拍照技术则将自动识别镜头内的物体(比如一朵静止小花又或是一个奔跑的人类),系统根据该物体的属性调整相机参数或是进行主动去糊。

麒麟970会搭载在将于10月16日于慕尼黑发布的华为Mate 10手机上。

既然一直在说“寒武纪”的NPU,那么这个寒武纪究竟是何方神圣呢?

寒武纪科技(Cambricon)是中科院计算所孵化出来的AI芯片创业公司,中科院计算所不仅对寒武纪进行了天使轮融资,同时还给与了长期的支持与投入。8月底,寒武纪宣布完成了1亿美元的A轮融资,投资方为国投创业、阿里巴巴、联想等,一跃成为国内AI芯片届当之无愧的独角兽。

不仅如此,寒武纪的两位创始人也非常神奇——一对出身中科院的兄弟。哥哥陈云霁目前仍在中科院计算所担任研究员,从事基础科技研发,弟弟陈天石则当起了公司的CEO。

(弟弟陈天石与哥哥陈云霁)

不过,很长一段时间,寒武纪这家公司一直以“研究性”企业被业内所知,说白了就是没有产品出来。直到去年4月份的世界互联网大会期间,宣告自己的第一款AI芯片产品寒武纪1A流片了,这一点不断拿来背书,新闻联播、人民日报都说了这事;不过之后其产品到底有没有商用,有没有量产,并没有官方说法,按照2016年底寒武纪CEO 陈天石的说法,“芯片从研发、量产到商用,是一个以年为单位的周期,所以在明年,大家将可以在市面上看到使用寒武纪技术的芯片产品,比如在手机、安防监控等智能终端和云端服务器上。”

不过根据中国科学院计算技术研究所发布的贺信显示,上的NPU正是集成寒武纪1A处理器作为其核心人工智能处理单元,实现了手机上本地、实时、高效的智能处理。这也是寒武纪1A真正意义上的一次产品化应用。

不过话说回来,恐怕也只有华为这个量级的土壕,才有能力让寒武纪1A真正产品化,从这一点看寒武纪是抱上了一个不错的大腿。

三、到底什么是“AI芯片”?

上文提到,麒麟970之所以敢叫自己“AI芯片”,最主要的就是集成了寒武纪的NPU(Neural-Network Processing Unit,神经网络处理器。

现在所谓的手机处理器,比如高通的835、苹果的A11、麒麟970等,实际上所指的是一个“处理器包”封装在一起,这个计算包专业一点说叫Soc(System-on-a-Chip),高大上的说法是“计算平台”;根据分工不同,很多专用功能的处理单元加进来,比如我们最熟悉的是GPU,现在这个包里的独立单元数量已经越来越大,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等,不同的数据进来,交给不同特长的计算模块来处理,这个NPU就是手机处理器平台新加入的一个擅长神经网络计算的单元,那么到底哪些应用会用到神经网络计算?也就是现在最能代表人工智能计算的一些应用,比如模式识别里的语音、图像(人脸)识别,比如其他会用到深度学习的一些AI应用。

为了让这个深度神经元网络连接更快,“寒武纪1A”还设计了专门的存储结构,以及完全不同于通用处理器的指令集。“它每秒可以处理160亿个神经元和超过2万亿个突触,功能非常强大,功耗却只有原来的1/10。

有时候,有些计算单元会独立出来,不封装在SoC里,比如观察苹果iPhone的主板结构,其Modem模块就一直独立在其A系列处理器模块之外;寒武纪的这个NPU单元之前也是一个独立的处理器单元,只是这次整合封装到了麒麟970的Soc里面。

(华为海思麒麟970架构)

(高通835架构和华为海思960架构)

虽然芯片里的CPU、GPU、DSP都可以用来做运算,但是NPU是专门用于神经网络架构计算的,号称比CPU快25倍的同时效率将提高了50倍。有点类似于你想要剪东西,我给你一把剪刀。

至于为什么用的是寒武纪的NPU呢?主要原因是目前国内能做AI芯片级别的公司只有那几家,而寒武纪是中科院出身,和华为的合作自然也是顺理成章。中科院计算自己也表示,计算所自2011年以来就和华为展开合作,组建了“中科院计算所-华为联合实验室”。

不过,也没有说现在其他芯片的CPU+GPU+DSP架构在人工智能应用方面效果差到哪里去了,恰恰相反,现在的众多手机厂商都在这个架构上对AI功能进行优化。从高通骁龙到联发科Helio,无不在人工智能的芯片应用上进行了大力优化。比如高通在骁龙800和600系列芯片上做了一个软件的神经处理引擎,高通也承诺未来也会出专门用来做神经网络运算的核——比如NPU。

所以说,这个NPU,重要,但也没那么重要。以深度学习为例,深度学习分为训练(Training)和推理/应用(Inference)两部分,训练阶段的确需要非常高的计算能力,但在应用层面其实并不需要巨大的计算量——相信没有哪个纯真的用户拿手机去做Training的。

另一方面,AI不AI,最终还是得看应用嘛……需要整个移动AI应用的生态起来了,才能体现出硬件的优势。

同为手机芯片制造商,联发科的一位产品技术负责人也认为,在芯片上集成硬件相对容易,关键还是上层的应用,用户不会在意这个是不是AI,只会在意体验。

虽然华为展示出了三个常见应用方向(AR、计算机视觉、自然语言处理),还动用了开发者网页、开发者工具包、应用商店来招揽开发者,华为消费者业务CEO余承东也在发布会现场承诺,华为将打造一个开放的AI环境,开发者可以直接接入华为NPU功能,也可以通过第三方AI框架接入(目前支持TensorFlow和Caffe)。

不过,就目前来看,移动AI应用开发还很少,华为现场展示的AI功能也集中在降噪、拍照美化等方面,快则快矣,没有什么鸡蛋。在应用缺失的情况下,麒麟970、骁龙835、甚至性能再弱些的芯片使用起来也会让用户感觉相差不大。

四、为了这个“世界第一”煞费苦心

不知道大家还记不记得,去年12月16日,华为旗下手机品牌荣耀推出了2016年最后一款旗舰手机——荣耀Magic。

荣耀总裁赵明在讲述这款荣耀3周年的特殊新产品的过程中,全程未提硬件配置,只谈了这款手机的八曲面外形设计和搭载由华为2012实验室研发4年的人工智能引擎Magic Live。

除了2012实验室外,华为旗下还有诺亚方舟实验室、高斯实验室、香农实验室,华为没有透露本次麒麟970使用的人工智能技术是否来自这些实验室,但从目前看来主要是这几个部门在研发。

不过,仅从深度学习来说,华为的技术并不算领先。这也是为什么虽然华为海思方面非常想要自研“AI芯片”,但为了来得及抢上这个“世界第一”的名头,最终选择了和寒武纪、中科创达合作。

一位业内人士对此的评价是——“

编辑:李强 引用地址:
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

我要回帖

更多关于 华为芯片 的文章

 

随机推荐