当前位置:首页 > 天道酬勤 > 正文内容

飞腾cpu arm(arm实现100以内)

张世龙2021年12月21日 23:46天道酬勤500

本周三,Arm根据目前广泛使用的Armv8,发布了未来十年的新一代体系结构——最新一代体系结构Armv9。

据雷锋网介绍,Armv9体系结构有三个系列,分别是面向通用计算的a系列、面向实时处理器的r系列和面向微控制器的m系列,是未来两代移动基础架构CPU的性能第一个配备Armv9架构CPU的移动处理器将于今年年底上市,可能来自MediaTek。

第一代版本的Armv9体系结构增强了安全性、机器学习和DSP的性能,Armv9体系结构今后将继续增强这些性能并添加新功能。

近年来,Arm架构处理器从以智能手机为代表的终端扩展到了对性能要求更高的PC、数据中心。 根据最新的发布,Arm希望Armv9架构CPU及其GPU、NPU处理器可以搭载在任何地方。 如果能实现Arm的目标,能实现CPU计算的统治吗? Arm的第三个1000万出货目标多久能实现?

安全是发挥计算体系结构潜能的最大课题

在Armv9体系结构发布会上,安全性经常被提及,安全相关技术和介绍的篇幅也很长。 Arm高级副总裁、首席架构师、技术院士Richard Grisenthwaite做了如下说明。 “要充分发挥计算的潜力,最大的挑战是安全,越来越多的个人数据存储在计算系统中,因此我认为这些数据已成为安全攻击的魅力目标。 今年网络犯罪的损失额估计达到了6兆美元。 ”

因此,Armv9体系结构在安全方面做了多方面的工作。 首先,引入了armcomputearchitecture,CCA )。 CCA建立基于硬件的安全运行环境来执行计算,保护代码和数据的一部分免受访问和修改,也防止特权软件的侵害。

Arm CCA面向所有APP,在安全或非安全的环境中运行,引入了动态创建敏感区域(Realms )的概念,以确保数据的安全。 例如,在业务APP中,敏感领域可以保护系统中的业务敏感数据和代码,无论是在使用中、空闲中还是传输中。

据悉,Arm将于今年下半年发布Arm CCA更多信息。

内存标签扩展是Armv9体系结构的另一种安全技术。 Richard Grisenthwaite先生说: “我们分析了全球软件报告的大量安全问题,发现许多问题的根本原因实际上与过去的内存安全问题有关。 这些问题在计算领域困扰了50年,多年来两个最常见的内存安全问题——缓存溢出和释放后重用。 大多数问题都是在利用这些内存安全漏洞之前就可以发现问题,这是提高全局软件安全性的重要步骤。 ”

Arm不断与谷歌合作开发的“内存标签扩展”技术可以在软件中找到区域和时间内存的安全性问题,软件将指向内存的指针与标签相关联,并在使用指针时检查该标签是否正确

Richard表示,内存标签的扩展是明年上市的第一代Armv9 CPU中不可缺少的一部分。 支持内存标签扩展的软件也引入到了Android11系统和OPENSUSE中。

Arm多年来一直与剑桥大学在CHERI体系结构上合作,从体系结构的基础上提高了安全性。 根据所述,CHERI体系结构定义了提供这种封装功能的硬件功能,将来可能会成为更安全的计算平台,但这将大大改变某些系统的工作方式。

但是,该体系结构Arm已经在与合作伙伴进行探索,如果成功,未来5-6年将部署Armv9体系结构,成为Armv9体系结构的主要组件之一。

未来2代Armv9体系结构的CPU性能将超过30%

安全性是计算体系结构的基础,而性能的提高是满足日益增长的计算需求和多样化计算需求的关键。 Arm预计,新一代架构Armv9的速度将超过业界CPU的性能提升,未来两代移动和基础架构CPU的性能提升将超过30%。

Richard强调说:“该数据是基于行业标准的评估工具进行测量的,30%的计算能力是通过独特的体系结构而不是过程技术实现的。”

提高计算性能的非常重要的动力是AI。 根据Statista Research Department今年1月发表的最新报告,到20世纪20年代中期,全球估计有80亿台以上的AI语音支持设备。 不同的设备对AI性能的需求不同,需要不同的AI处理器。

/p26.toutiaoimg.com/origin/pgc-image/STL5GhsAQGu7JW?from=pc">

Arm与富士通合作开发了可伸缩矢量扩展(Scalable Vector Extension, SVE)技术并用在了全球最快的超级计算机“刻苦的小懒虫”上。在SVE的基础上,Armv9中使用了新开发的SVE2技术,增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力,能够提供实现增强的机器学习和数字信号处理能力。

“我们还将通过提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU 性能。”Richard表示。

在解决新问题的过程中,Arm加入了一些复杂技术,这是否违背了精简指令集(RISC)的初衷?Richard的观点是:“Arm架构的精简指令(RISC)核心没有改变,我们依然遵循着注册到注册(registration to registration) 的操作原则,所以从硬件的角度来看,Arm指令集仍然保持着精益性。”

Arm称,除了大幅增强CPU内的矩阵乘法,Mali GPU和Ethos NPU也会持续进行AI创新,扩展Arm的技术能力。

统治CPU计算

目前,CPU领域最成功的架构当属x86,不过x86的成功和统治力在于PC和高性能计算市场,在Arm擅长的智能终端市场并不成功。近几年,Arm架构在高性能计算领域取得了一些进展,包括上面提到的“刻苦的小懒虫”超级计算机,以及推出采用Arm架构的多款服务器。去年,苹果M1处理器Macbook Pro电脑的推出,也让业界看到了x86架构在PC市场的统治地位并非牢不可破。

Arm首席执行官Simon Segars说,“Arm芯片实现1000亿颗的出货花了26年,如果预测准确,接下来一年,我们的合作伙伴出货的Arm芯片将累计达到2000亿颗。也就是说,我们的第二个1000亿的出货将在短短5年内达成。”

雷锋网了解到,目前Arm架构的芯片出货已经超过1800亿颗,Armv9架构会成为实现Arm芯片3000亿颗芯片出货的先驱。没有人能准确预估Arm实现第三个1000亿颗芯片出货的时间,但可以明确的是Arm希望其芯片能够为所有智能计算提供算力,也就是让其芯片在未来无处不在。

为了实现这个目标,同时满足行业从通用计算向普遍的专用处理发展的需求,Arm也开始强调全面计算的理念。全面计算设计方法包含Arm的CPU、GPU、NPU,通过将全面计算的设计原则应用在包含汽车、客户端、基础设施和物联网解决方案的整个IP组合中。

与此配合,Arm也需要在标准化程度上取得平衡。Richard说:“如果过多的标准化,那么合作伙伴将无法开发合适的专用解决方案。而如果太少的标准化,我们得承担低价值、形同实异的解决方案的风险。这将让软件生态系统的成本增加、且毫无益处。”

Arm在服务器领域中已经看到了标准化平衡的价值,推出了“服务器基础架构SBSA”和相关的认证计划“服务器就绪”。

“我们也正在扩大标准化的范围,Arm SystemReady将服务器就绪计划的概念从云端延伸到物联网边缘等广泛的设备上,以实现通用操作系统及虚拟机管理程序之间的交互运作。”Richard说。

如果Arm的全面计算以及标准化探索成功,从终端到边缘再到云端,Arm是否就能够实现在未来的计算统治?实现3000亿颗甚至更多芯片出货又会有多快呢?

小结

现在看来,有两大方面的阻碍,一方面是在复杂的国际形势下,同属精简指令集的RISC-V正在快速发展,加上x86阵营intel和AMD也在加强x86的竞争力,Arm要真正撼动x86的优势领域并非易事。

另一方面,中国作为芯片进口的大国,Arm与Nvidia的收购交易,以及美国对中国领先芯片设计公司的出口限制,让客户产生担忧。

对于Armv9是否以供给包括华为在内的中国企业的问题,Arm的官方回复是:“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。Arm已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。”

这样的回复,不知你怎么看?

注:文中图片来自Arm 雷锋网

扫描二维码推送至手机访问。

版权声明:本文由花开半夏のブログ发布,如需转载请注明出处。

本文链接:https://www.zhangshilong.cn/work/26662.html

分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。