华为昇腾AI芯片,你了解多少?

AI百科4个月前更新 快创云
85 0

  今天,我们将聚焦于华为的昇腾AI处理器,探讨其技术特点及其在人工智能领域的应用。随着人工智能技术的迅猛发展,业界普遍认为,这一进步主要得益于三大推动力:海量数据的积累、理论算法的创新以及计算技术的变革。这三者相辅相成,共同构成了人工智能发展的基石。若将人工智能技术的发展比作火箭升空,那么数据就是燃料,算法和理论则是控制其飞行轨迹的关键,而计算技术则是驱动其持续前进的引擎。为了推动这一“火箭”飞得更高更远,我们不仅需要不断获取和创造更多的数据,还需要不断改进算法模型和理论,以更高效地处理、分析并利用这些数据。同时,我们还需要不断升级计算能力,以在更短的时间内处理更多数据。而这一切的基石,正是人工智能芯片。

  接下来,我们将重点介绍人工智能专用芯片,特别是华为的昇腾AI处理器。我们将探讨其技术特点,包括硬件架构、软件架构以及围绕该处理器构建的生态系统。

  首先,我们来看看昇腾AI芯片的硬件架构。昇腾AI处理器实际上包含两款产品:2018年发布的昇腾310,主要针对推理应用;以及2019年发布的昇腾910,针对训练应用。这两款芯片都是为特定领域设计和深度优化的专用芯片,与CPU、GPU等通用芯片有着显著区别。在AI系统中,训练和推断是两个关键过程。例如,昇腾910主要面向云端的AI训练应用,因此其优化重点在于算力大小。它采用7纳米工艺制造,FP16算力可达256TFLOPS, INT8算力高达512 TOPS,并支持128通道的全高清视频解码。这些性能甚至超过了同时期的GPU,如英伟达的V100。为了实现如此高的算力,其功耗最高可达310瓦,与GPU相当。而昇腾310则针对推理场景,主要应用于移动端。因此,它需要在性能和功耗之间找到平衡。考虑到智能摄像头、无人驾驶车辆以及手机或手表等设备的功耗限制,以及边缘计算对芯片使用成本、实时性和安全性的要求,昇腾310采用12纳米工艺制造,最大功耗仅为8瓦。在性能方面,它的FP16算力达到8TFLOPS,INT8算力为16 TOPS,并集成了16通道的全高清视频解码功能。这些性能在边缘计算领域已经相当出色。

  现在许多芯片的结构都是以片上系统的形式进行设计和开发的。我们可以将其比作在一个盒子里装有很多不同的小蛋糕,而不是直接做一个特别大的蛋糕。每个小蛋糕都可以单独制作,还可以有不同的口味和大小,最后整合在一起即可。这样既节省了制作时间,也降低了制作风险和成本。同样地,华为昇腾AI芯片也是一个片上系统。在芯片上有许多不同的模块,它们有的负责数据存储、接口和通信、任务调度和控制等任务;当然最重要的就是负责AI运算的计算核心了。从硬件结构来看昇腾AI芯片最突出特点之一就是其采用了华为自研的达芬奇架构作为其AI核心无论是昇腾910还是昇腾310都使用了基于达芬奇架构的AI核心总体来说达芬奇架构可以分为三个主要组成部分分别对应数据的计算存储和控制以计算单元为例它可以执行标量向量和张量三种基础运算例如张量运算就是专门用来加速AI应用中的矩阵运算它被称为3D Cube单元可以用一条指令完成两个16乘16的矩阵相乘运算除了硬件结构外同样重要的是芯片编程方法和软件架构设计实现英伟达GPU之所以在人工智能领域得到广泛应用除了其性能提升外更重要的是它推出了成熟且易用的编程框架CUDA相比之下FPGA的编程难度极大这也在很大程度上限制了FPGA的广泛使用对于这类AI专用芯片昇腾AI处理器也提供了一个多层的软件栈和开发工具链以帮助开发者更好地使用昇腾通过软件的多样性也能在很大程度上弥补专用芯片灵活性不足的劣势这个软件栈可以分为四层最底层是处理器的计算资源如前面提到的AI核心CPU以及负责数字视觉的计算模块等再往上是一些标准的加速库负责给硬件输出算子层面的任务此外还有任务调度器和一些预处理模块然后再往上就是框架层顾名思义它是用来调度和管理深度学习框架并生成离线模型用的值得注意的是昇腾AI处理器不仅支持主流的深度学习框架还支持华为自研的名叫MindSpore的深度学习框架通过MindSpore生成的神经网络模型可以直接运行在昇腾AI芯片上而无需进行硬件适配和转换这极大地提升了开发效率软件栈的最后一层是应用层其抽象程度最高封装集成了许多专用领域的计算引擎如针对计算机视觉和语言文字处理的算法封装等用户也可以直接调用除了这几个大的逻辑层次外昇腾的软件栈还提供了一个完整的开发工具链MindStudio包括编译调试性能分析模型转换等功能介绍了硬件架构和软件栈后我们还需要最后一个大的环节来完成整个生态的闭环那就是提供结合软硬件的系统级解决方案这实际上是当前芯片界的发展趋势无论你是CPU、GPU、FPGA还是像这样的AI专用芯片都在遵循这一规律发展简单来说就是芯片公司不仅要提供强大的芯片还要提供好用的软件和开发工具以及完整的参考设计和软硬件系统让所有人都能轻松使用同样地昇腾也提供了一系列硬件产品从最小的加速模块到推理或训练用的加速卡再到专用的服务器甚至是由多个服务器阵列组成的计算集群这些产品共同构建了一个涵盖终端边缘及云计算产品的组合使得用户可以根据自身需求选择合适的硬件产品这就是华为所说的全场景覆盖最后来总结一下今天的主要内容我们从硬件、软件和生态三个角度介绍了华为的昇腾AI芯片还深入探讨了华为自研的达芬奇架构以及MindSpore深度学习框架的技术特点同时我们也观察了一些业界的发展趋势即以硬件为基础通过软件扩展灵活性和易用性围绕软硬件打造系统级解决方案并由此构建一个完整的生态系统

© 版权声明

相关文章