立即注册
查看: 1181|回复: 4

[转载] 君正公布全栈式低功耗AI技术:芯片+AI算力+AI开发平台

已绑定手机
发表于 2021-5-24 10:45:33 | 显示全部楼层 |阅读模式 来自 广东省深圳市
基础技术组件如今包含:
一系列落地芯片:布局完备,覆盖高中低阶,除AI以外具备完整的各方面竞争力,成本亲和,性能均衡,效果出众,功耗领先,被市场认可并且持续大量出货。这就像AI和算法落地生根的土壤,越广阔越好。
一套先进的AI加速硬件:优秀的PPA(Performance, Power, Area),兼具高性能和灵活性,并且通过有效创新,真正突破AI推理在端侧产品中的各种瓶颈,使得高发热,高带宽,成本冗余等在实际产品中不再是问题。
一个完善的算法开发平台:敏捷的算法移植过程,除了提供一键式算法部署,还提供最先进的量化感知训练方法论,提供典型网络的全流程开源代码,让算法专家专注于挖掘痛点与数据的价值。

君正的整体AI技术架构如下图:
2.jpg

AIE—有效突破端侧AI的算力瓶颈
AI-Engine(AIE)是君正完全自主创新的一套AI加速硬件组合,广泛支持各类神经网络加速,如CNN/RNN/GCN等,也支持传统CV算法和平面运算的加速。得益于公司对CPU技术的掌握,AIE实现了其他一般芯片公司难以做到的CPU与NPU的同构设计。
3.jpg
在全球各种不同的AI加速技术路线中,DSA(Domain Specific Architecture)尤其适合端侧推理场景。AIE引用了多种DSA的设计理念,实现了一整套满足复合算法加速的硬件组成:
支持SMT多核架构的XBurst2 CPU,凝聚了君正团队20多年的CPU技术精华;
128bit/512bit/1024bit位宽的SIMD指令集,针对向量运算加速;
算力高达2T - 32T的NN加速阵列,针对张量计算加速,支持混合位宽量化
协处理单元,对其他运算加速;
高效RAM pool,深度优化内存带宽吞吐
实测运行功耗很低,8T算力场景下典型功耗小于500mW,能耗比最低达到了0.05W/T级别

“与云上的AI芯片加速不同,在端侧芯片上,4T算力曾经是天花板,这并不是因为硬件无法将算力继续提高,而是因为端侧产品在算力以外有太多的制约因素。”刘远解释道,“如果不优先把NPU内部的PPA、带宽、功耗等关键障碍解决,即使再提高计算矩阵的规模,实际芯片也大概率发挥不出来。”


完整内容请下载附件查看
2021-5-24 10:43 上传
文件大小:
479.32 KB
下载次数:
34
本地下载

16RD supports Paypal , Payment is calculated at the exchange rate of the day. Unable to download please contact 18902843661 (WhatsApp OR wechat number)

关于一牛网在微软浏览器(Microsoft Edge、IE浏览器)警报通告&解决方案!(无法下载直接更换浏览器即可)

*附件为作者发布,与本站无关,如有侵权,请联系客服删除

已绑定手机
发表于 2021-6-29 18:40:49 | 显示全部楼层 来自 北京市
非常不错,,,,,,  ———————————————— 版权声明:本文为一牛网 - https://bbs.16rd.com/ 的原创文章,转载请附上原文出处链接及本声明。 原文链接:https://bbs.16rd.com/thread-567004-1-1.html
已绑定手机
发表于 2021-7-23 01:54:59 | 显示全部楼层 来自 香港
謝謝版主分享
发表于 2021-12-15 13:47:13 | 显示全部楼层 来自 浙江省宁波市
謝謝版主分享
已绑定手机
发表于 2022-9-26 16:01:04 | 显示全部楼层 来自 广东省深圳市
能下载看看
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

合作/建议

TEL: 19168984579

工作时间:
周一到周五 9:00-11:30 13:30-19:30
  • 扫一扫关注公众号
  • 扫一扫打开小程序
Copyright © 2013-2024 一牛网 版权所有 All Rights Reserved. 帮助中心|隐私声明|联系我们|手机版|粤ICP备13053961号|营业执照|EDI证
在本版发帖搜索
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表