健身俱乐部网站开发文档,校园资源共享网站建设,好的营销网站,不改变网站怎么做关键词优化来源#xff1a;专知1. AI芯片定义及技术架构1.1 AI芯片定义广义上所有面向AI应用的芯片都可以称为AI芯片。目前一般认为是针对AI算法做了特殊加速设计的芯片。现阶段#xff0c;这些人工智能算法一般以深度学习算法为主#xff0c;也可以包括其他浅层机器学习算法[7-8]。1.… 来源专知1. AI芯片定义及技术架构1.1 AI芯片定义广义上所有面向AI应用的芯片都可以称为AI芯片。目前一般认为是针对AI算法做了特殊加速设计的芯片。现阶段这些人工智能算法一般以深度学习算法为主也可以包括其他浅层机器学习算法[7-8]。1.2 AI芯片功能1训练。对大量的数据在平台上进行学习并形成具备特定功能的神经网络模型。对AI芯片有高算力、高容量和访问速率、高传输速率、通用性的要求。2推理。利用已经训练好的模型通过计算对输入的数据得到各种结论。对于 AI芯片主要注重算力功耗比、时延、价格成本的综合能力。实验证明低精度运算如float16int8可达到几乎和float32同等的推理效果所以AI推理芯片有低精度算力的要求。1.3 技术架构表1列出了AI芯片的几种技术架构并对其优缺点进行比较。表1.AI芯片技术架构2. AI芯片应用场景2.1 数据中心IDC用于云端训练和推理目前大多数的训练工作都在云端完成[9]。移动互联网的视频内容审核、个性化推荐等都是典型的云端推理应用。Nvidia GPU在训练方面一家独大在推理方面也保持领军位置。FPGA和ASIC因为低功耗、低成本的优势在持续抢夺GPU的市场的份额。云端主要的代表芯片有Nvidia-TESLA V100、华为昇腾910、Nvidia-TESLA T4、寒武纪MLU270等。2.2 移动终端主要用于移动端的推理解决云端推理因网络延迟带来的用户体验等问题。典型应用如视频特效、语音助手等。通过在手机系统芯片system on chipSoC中加入增加协处理器或专用加速单元来实现。受制于手机电量对芯片的功耗有严格的限制。代表芯片有Apple A12 Neural Engine加速引擎和华为麒麟990。2.3 安防目前最为明确的AI芯片应用场景主要任务是视频结构化。摄像头终端加入AI芯片可以实现实时响应、降低带宽压力。也可以将推理功能集成在边缘的服务器级产品中。AI芯片要有视频处理和解码能力。主要考虑的是可处理的视频路数以及单路视频结构化的成本[10]。代表芯片有华为Hi3559-AV100和比特大陆BM1684等。2.4 自动驾驶AI芯片作为无人车的大脑需要对汽车上大量传感器产生的数据做实时处理[11]对芯片的算力、功耗、可靠性都有非常高的要求同时芯片需要满足车规标准因此设计的难度较大[12]。面向自动驾驶的芯片目前主要有Nvidia Orin、Xavier和Tesla的FSD等。2.5 智能家居在AIIoT时代智能家居中的每个设备都需要具备一定的感知、推断以及决策功能。为了得到更好的智能语音交互用户体验语音AI芯片进入了端侧市场。语音AI芯片相对来说设计难度低开发周期短。代表芯片有思必驰TH1520和云知声雨燕UniOne等。3. AI芯片关键技术和基准测试平台3.1 关键技术和挑战1AI芯片当前的核心是利用乘加计算multiplier and accumulationMAC阵列来实现卷积神经网络中最主要的卷积运算的加速。MAC阵列的大量运算会造成功耗的增加。很多AI应用的场景对于功耗都有严格的限制如何达到优异的性能功耗比是AI芯片研发的一个重要目标。2深度学习算法中参与计算的数据和模型参数很多数据量庞大导致内存带宽成为了整个系统的一个瓶颈“Memory Wall”也是需要优化和突破的主要问题[13]。3除了芯片本身硬件的设计以外软件对于AI芯片性能的发挥也有着十分重要的作用编译器和工具链软件的优化能力、易用性现在也得到越来越多的重视。3.2 基准测试平台基准测试平台Benchmark为AI芯片建立了标准的评估体系主要职责和意义有1基于调研和集群信息收集真实反映AI芯片的使用情况。2引入评估和选型标准。3对AI芯片的架构定义和优化指引方向。基准测试平台的评估指标包括延时ms、吞吐量ims/s、能效比ims/s/W、利用率ims/s/T等。主要的基准测试台有MLPerf、DawnBenchStanford、DeepBench百度、AI Matrix阿里巴巴。4. AI芯片未来趋势和探索4.1 神经形态芯片神经形态芯片是指颠覆经典的冯·诺依曼计算架构采用电子技术模拟已经被证明了的生物脑的运作规则从而构建类似于生物脑的芯片[14]。神经形态芯片的优点1计算和存储融合突破Memory Wall瓶颈。2去中心化的众核架构强大的细粒度互联能力。3更好的在线学习能力。清华大学、Intel、IBM等学校和企业都在做此方面的研究工作。4.2 可重构计算芯片可重构计算芯片也叫做软件定义芯片[6]主要针对目前AI芯片存在的以下问题和任务需求1高效性和灵活性难以平衡。2复杂的AI任务需要不同类型AI算法任务的组合。3不同任务需要的计算精度不同。可重构计算芯片的设计思想在于软硬件可编程允许硬件架构和功能随软件变化而变化从而可以兼顾灵活性和实现超高的能效比。5. 云端和边缘侧AI芯片和应用5.1 云端和边缘侧AI芯片本研究团队从2017年开始研发AI芯片并在当年发售了第一代云端专用AI芯片 BM1680。在2019年发布了第三代AI芯片BM1684。BM1684采用TSMC-12 nm工艺有17.6Tops的int8和2.2Tflops的float32算力典型功耗为16W可以支持32路1080P的高清视频解码。基于BM1684芯片研发了深度学习加速板卡SC5如图1所示、高密度计算服务器SA5、边缘计算盒子SE5、边缘计算模组SM5等面向各种不同人工智能应用的产品。图1.深度学习加速板卡SC55.2 研发产品的应用本团队的AI产品已经在云端和边缘侧的多种应用场景下落地使用包括智慧园区如图2所示、城市大脑如图3所示、视频结构化、人脸布控、智能支付等。图2.智慧园区解决方案图3.城市大脑应用6. 结论AI芯片行业尚处于起步阶段已经有越来越多的项目开始落地和商业化它的快速发展有助于推动整个人工智能产业的进展。本文对AI芯片的现状和未来可能的技术方向做了调研和分析希望可以帮助读者更好地了解AI芯片行业AI 芯片拥有巨大的产业价值和战略地位相信中国的科研机构和企业会努力抓住机遇让中国的人工智能产业蓬勃发展。文献引用安宝磊.AI芯片发展现状及前景分析[J].微纳电子与智能制造, 2020, 2(1): 91-94.《微纳电子与智能制造》刊号CN10-1594/TN主管单位北京电子控股有限责任公司主办单位北京市电子科技科技情报研究所北京方略信息科技有限公司投稿邮箱tougaomneim.org.cn网站www.mneim.org.cn参考文献:[1] LECUN YBOTTOU LBENGIO Yet al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE199886( 11) : 2278-2324.[2] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks[C]// Proceedings of the 25th International Conference on Neural Information Processing Systems.ACM, 2012: 1097-1105. [3] VINCENT PLAROCHELLE HBENGIO Yet al. Extracting and composing robust features wi- h denoising autoencoders[C]// Proc of the 25th International Conference on Machine Learning. ACM Press2008: 1096- 1103. [4] VINCENT PLAROCHELLE HLAJOIE Iet al. Stacked denoising autoencoders: learning useful representations in a deep network with a local denoising criterion [J]. Journal of Machine Learning Research201011( 12) : 3371-3408. [5] 施羽暇 . 人工智能芯片技术研究[J]. 电信网技术, 2016, 12(12) : 11-13. SHI Y X. Research on artificial intelligence process chip technology[J]. Telecommunication network technology, 2016, 12(12) : 11-13.[6] 清华大学 . 人工智能芯片技术白皮书 (2018)[R/OL]. (2018-12-11) [2010-01-20]. https://www.tsinghua.edu.cn/ publish/thunews/9659/2018/20181217102627644168087/ 20181217102627644168087_.html. Tsinghua University. 2018 White Paper on AI Chip Technologies[R/OL]. (2018-12-11)[2010-01-20]. https://www. tsinghua.edu.cn/publish/thunews/9659/2018/2018121710 2627644168087/20181217102627644168087_.html. [7] BENGIO Y. Learning deep architectures for AI[J]. Foundations and Trends in Machine Learning20092(1) : 1- 127. [8] HINTON G E. Learning distributed representations of concepts[C]// Proc of the 8th Annual Conference of the Cognitive Science Society. 1986: 1-12. [9] 尹首一, 郭珩, 魏少军 . 人工智能芯片发展的现状及 趋势[J]. 科技导报, 2018, 17: 45-51. YIN S Y, GUO H, WEI S J. Present situation and future trend of artificial intelligence chips[J]. Science Technology Review, 2018, 17: 45-51. [10] 汤炜伟 . AI 安防芯片的发展现状与前景分析[J]. 中 国安防, 2018, 7: 47-50. TANG W W. Analysis of the development and Prospect of AI security chip[J]. China SecurityProtection, 2018, 7: 47-50. [11] 尹首一 . 人工智能芯片概述[J]. 微纳电子与智能制 造, 2019, 2: 7-11. YIN S Y. Overview of artificial intelligence chip[J]. Micro/nano Electronics and Intelligent Manufacturing, 2019, 2: 7-11. [12] 谭洪贺,余凯 . 端侧 AI 芯片的挑战和展望[J]. 人工智 能, 2018, 2: 113-121. TAN H H,YU K. The challenge and prospect of edge AI chip[J]. Artificial Intelligence, 2018, 2: 113-121. [13] 邱赐云, 李礼, 张欢, 等 . 大数据时代——从冯 · 诺依 曼到计算存储融合[J]. 计算机科学, 2018, 45(2): 71- 75. QIU C Y, LI L, Z H, et al. Age of big data: from von neumann to computing storage fusion[J]. Computer Science, 2018, 45(2): 71-75. [14] 赵正平 . 纳电子学与神经形态芯片的新进展[J]. 微纳 电子技术, 2018, 55(1): 1-5. ZHAO Z P. New progress of nanoelectronics and neuromorphic chips[J]. Micronanoelectronic Technology, 2018, 55(1): 1-5未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”