• 最新新闻
  • 美国高校开课教你“修手机”,只为减少电子垃圾 全球移动互联网大会开幕 百名全球顶级科学家共话“科学复兴” 美国高校开课教你“修手机”,只为减少电子垃圾 全球移动互联网大会开幕 百名全球顶级科学家共话“科学复兴” 美国高校开课教你“修手机”,只为减少电子垃圾 8小时暴走打卡5G体验区,感受北京科技世园会 千元左右扫地机器人哪款最值得买,看了就知道! 8小时暴走打卡5G体验区,感受北京科技世园会 千元左右扫地机器人哪款最值得买,看了就知道! 麒麟990 5G芯片的NPU如何做到算力暴涨?华为自研达芬奇架构详解 万事利丝绸x微软小冰,第一款人工智能丝绸笔记本诞生! 小米AIOT开启AI+教育,先声智能助力小爱老师 万事利丝绸x微软小冰,第一款人工智能丝绸笔记本诞生!
  • 推荐新闻
  • 美国高校开课教你“修手机”,只为减少电子垃圾 全球移动互联网大会开幕 百名全球顶级科学家共话“科学复兴” 美国高校开课教你“修手机”,只为减少电子垃圾 全球移动互联网大会开幕 百名全球顶级科学家共话“科学复兴” 美国高校开课教你“修手机”,只为减少电子垃圾 8小时暴走打卡5G体验区,感受北京科技世园会 千元左右扫地机器人哪款最值得买,看了就知道! 8小时暴走打卡5G体验区,感受北京科技世园会 千元左右扫地机器人哪款最值得买,看了就知道! 麒麟990 5G芯片的NPU如何做到算力暴涨?华为自研达芬奇架构详解 万事利丝绸x微软小冰,第一款人工智能丝绸笔记本诞生! 小米AIOT开启AI+教育,先声智能助力小爱老师 万事利丝绸x微软小冰,第一款人工智能丝绸笔记本诞生!
  • 热门标签
  • 日期归档
  • 麒麟990 5G芯片的NPU如何做到算力暴涨?华为自研达芬奇架构详解

    来源:www.honkerbase.com 发布时间:2019-11-05

    5G时代正在逐步向你和我迈进。随着5G商用部署规模越来越全面,技术日趋成熟,应用场景也将越来越广泛,有了它,更多的技术将具有更广泛的应用空间,如AI。事实上,人工智能也是未来的趋势。由于这一趋势,智能手机制造商开始在移动终端中尽早布局并应用AI。 9月6日,华为在德国柏林IFA 2019展会上举行的麒麟芯片新产品发布会上正式推出新款麒麟990系列芯片。在麒麟990系列芯片中,AI只是一个大问题。

    我相信你会记得2017年,华为推出了首款与NPU神经网络单元集成的智能手机人工智能计算平台 - 麒麟970芯片,并于2018年首次在全球首次集成了双核NPU的麒麟980芯片。今年,在麒麟995G上,AI功能再次升级。它采用基于华为的技术开发了一种采用达芬奇架构的新NPU。

    麒麟9905G,新架构NPU,完全升级的AI功能

    NPU的新架构使得麒麟9905G能够保持业界领先的AI计算能力,同时提供更多实时AI体验。根据华为的说法,麒麟在AIBenchMark上的9905G运行达到了麒麟980的476%。

    此外,在人工智能生态方面,麒麟9905G的新NPU可以支持300多个AI运营商,而麒麟9905G可以在视觉计算神经网络模型下支持90%的开源模型。

    麒麟9905G集成的新NPU也在架构方面进行了创新,这就是我们刚才所说的大核心+ MICROCORE架构。

    其中两个大核心具有强大的性能,而另一个核心具有最高的能效。在双核支持下,与业内其他旗舰AI芯片相比,麒麟990 5G拥有业界最强的AI计算能力。性能优势高达6倍,能效优势高达8倍。

    关于新的微核,华为表示,如果它只与它配合使用,手机的功耗每天将低于5%,这表明它确实具有低功耗。至于采用大核+微核架构的原因,它可以类似于CPU核心架构的大小,也就是说,在日常生活中,许多任务AI计算任务不需要大核心,微芯足以满足,就像一辆卡车拉货,通常大货都可以拉大货车,小货可以用小卡车拉,这样手机芯片上不必要的耗电量就可以大大减少。华为还举例说明,在人脸检测的应用场景中,与大核工作相比,使用微核工作的能效可提高24倍,这是令人惊讶的。

    除了这些功能外,麒麟990 5G芯片的新NPU在其AI计算能力和应用体验方面也是独一无二的。更重要的原因是其基于华为自主研发技术的达芬奇架构。

    Da Vinci架构非常详细,它创造了Kirin 990 5G的AI创新

    在文章的开头,我们提到5G将推动人工智能在未来实现广泛的发展趋势。除了智能手机,互联网的一切,以及一切智能化,这无疑是未来的一个重要趋势。华为去年还发布了《GIV2025打开智能世界产业版图》白皮书,指出到2025年,8年后,全球物联网数量将达到1000亿,人工智能的普及率将达到86%,形成23万亿美元的数字经济;终端数量将达到400亿台,个人助理普及率达到90%,智能服务机器人将进入12%的家庭。换句话说,这将是一个极其臃肿,人工智能密集型终端,具有极其丰富的未来。基于这种对未来的预测,华为将推出一个致力于多平台、多场景协作的统一人工智能架构达芬奇架构。

    那么达芬奇的建筑是什么?

    达芬奇架构是基于人工智能计算芯片,所以首先我们必须从人工智能计算的本质开始。众所周知,人工智能的发展离不开三个要素:算法、计算能力、大数据。强大的算法可以强大地计算海量数据。人工智能操作或深度学习操作不同于普通的CPU和GPU操作。它有大量的卷积、剩余网络、全连接和其他需要处理的特殊计算。例如,图像处理需要卷积神经网络运算。自然语言和语音的处理主要采用循环神经网络运算。这些运算本质上是向量和矩阵运算,主要是加法和乘法(mac),有时也有一些除法和指数运算。

    所以让我们来整理一下,人工智能操作的数据对象主要包括标量(独立自然数)、向量(一组一维有序数)、矩阵(一组二维有序数)和张量(一组n维有序数)。事实上,前三个可以理解为张量,但在维度上有所不同。

    研究高等数学的小伙伴认为,当数据维度增加时,操作的复杂性呈指数级增长,因此AI操作是一种计算量大的计算,对硬件性能而言非常高。软件架构。换句话说,这些要求需要专门的硬件和专用软件架构。

    达芬奇架构的核心设计原则是以最低成本处理这些复杂的张量操作,以实现最低的能耗。

    你如何做达芬奇建筑?

    我们不妨通过其核心架构图的过程:

    在上图中,AI操作的数据通过缓冲器L0A和L0B传送到3D立方体矩阵乘法单元。在矩阵处理数据之后,将结果输出到缓冲器L0C,并且存储在此的数据需要被发送到矢量矢量计算单元以完成矢量。与DSP类似,计算主要是池化/填充,BN操作,激活,添加等处理。如果获得最终结果,则将其传输到统一缓冲区。

    还有一个Scalar标量操作单元,负责标量操作。这里,它主要是前一个Cube,Vector和其他指令的地址和参数计算,以及基本的算术运算。它还负责整个程序的循环控制和分支判断。结果也输出到统一缓冲区。

    这基本上是达芬奇架构系统运作的核心过程。它具有非常重要的特征,它基于3D立方体的矩阵运算,并引入了矢量矢量计算单元,可灵活调整。因为在AI操作中,大量的操作将是矩阵乘法。例如,通过矩阵乘法计算常用的卷积神经网络运算。因此,华为达芬奇架构加速了矩阵运算,可以大大提高单位面积。 AI计算能力。对于后续的矢量,激活和其他操作,它可能更灵活,因此使用单独的模块进行灵活处理,这增加了计算系统的整体灵活性,可以大大提高操作效率。

    3D立方体如何加速矩阵运算?基本思想是以矩阵处理阵列的立体声形式处理MAC中的乘法和加法运算。通常,它是同时从三个侧面输入计算数据,并且同时具有16 * 16 * 16或4096个计算单元。也就是说,当需要4096次操作时,2D结构需要64行和64列来计算。 3D立方体只需要16 * 16 * 16结构进行计算,大大缩短了计算周期,减少了延迟,提高了利用率。率。因此,3D立方体也被华为称为“达芬奇魔方”。

    这可以说是达芬奇建筑的核心创新。

    基于这一创新,我们可以看到麒麟990的新NPU在AI性能方面的诸多优势。

    事实上,大多数小伙伴应该已经了解到DaVinci架构已经在最近的Kirin 810芯片中亮相。然而,在麒麟990芯片中,与麒麟810相比,达芬奇架构的整体性能得到了提升。它在哪里?简单来说,麒麟990的3D立方体的立体声阵列可以达到16 * 16 * 16,而麒麟810相对较小。

    值得注意的是,在华为的产品阵列中,达芬奇架构下的新系列不仅适用于麒麟系列,Max,Mini,Lite,Tiny和Nano,它们可以被理解为超大尺寸。大,中,小,超小。就像在N Ten 910这样的边缘计算和云计算领域中使用的超大尺寸一样,大尺寸也是如此,并且在介质中使用了麒麟系列。

    因此我们可以看到,在DaVinci架构系列芯片下,AI计算性能覆盖非常全面,从云计算到服务器,再到超低功耗物联网设备,如我们周围的智能门铃。 IT Home小编从华为获悉,Da Vinci架构下的AI系列芯片的AI计算能力可以相差七个数量级,即10到7的差距。这也反映了此前小编所说的,达芬奇架构可以在未来的智能物联网时代真正实现跨平台的全场AI计算。

    回到应用程序,华为Mate30系列的AI功能预计将是

    最后,我们仍然需要回顾一下Kirin 990 5G芯片。在达芬奇架构的新NPU神经网络计算单元下,麒麟990 5G的AI计算能力已上升到一个新的水平。当然,最关键的是,使用这些人工智能计算,麒麟990 5G可以满足更多场景的人工智能计算需求,换句话说,它可以实现更多人工智能功能 - 这绝对是消费者最关心的,也是一切必须返回到应用程序级别。在新闻发布会上,我们已经看到华为展示的麒麟990 5G的一些创新AI应用,如实时视频的多实例分割。简单地说,它能够分别识别视频图像中的每个角色,以实现更多角色视频捕捉取代背景,甚至可以选择想要保留在图片中的角色,使视频应用充满想象力。

    我相信在即将推出的华为Mate30系列手机中,我们将看到更多创新和实用的AI功能。这些功能不是创造性的驱动因素,而是真正的技术驱动因素,它们将成为华为Mate30系列产品的差异化产品。该级别的技术障碍。

    凭借强大的AI功能,华为的Mate30系列可能会有一些创意应用,我们拭目以待。

    友情链接: