©深响原创 · 作者|张嘉豪
“芯片上的晶体管密度每18个月就会翻一番,随之而来的便是芯片性能的翻倍。”——这是影响了半导体产业数十寒暑的摩尔定律,众所周知,这一定律正在失效。
高通中国区董事长孟樸在今年5月的采访中曾告诉「深响」:“这个规律(摩尔定律)不一定能一直持续,但是半导体技术的更新换代是一直在持续的……半导体的发展有物理极限,但是科技创新就是把不可能变成可能。”
安谋科技CEO 吴雄昂则表示:“算力的演进是我们信息技术革命的核心基础,在PC时代,CPU加上工艺的演进,让算力提升了近百倍;在移动互联网时代,Arm CPU、GPU加上工艺的演进,从第一代iPhone到iPhone 12,算力提升达到了280倍。未来,这样的提升还需要呈10倍、百倍地增长,因为我们的未来是一个全面数字化的时代。”
时代变了,AI、5G、IoT技术空前发展、信息数据大爆炸, IDC统计显示,预计到2025年,全球数据量将达到163 ZB,而这意味着算力要求的不断提高。从单纯的中央处理器(CPU)到大众所熟知的图形处理器GPU(也就是显卡),到嵌入式神经网络处理器NPU,再到近年来各厂商不断推出的各种AI芯片,最终,聚光灯落在了性能更强、效率更高、更加灵活的XPU上。
而各大厂商早已纷纷布局,逐梦XPU,构建自身多维产品能力:英特尔为首的老牌玩家“将重心从单独的CPU转移到跨CPU、GPU、FPGA和其他加速器的混合架构,并称其为‘XPU’愿景”;安谋科技则以「核芯动力」为主打品牌推出XPU战略,“通过强大的自研XPU IP产品和专业的一站式支持和服务,赋能中国客户、消费者、产业生态”。
虽然这些XPU有着区别与各自的特点,但是大家都指向着更高效的计算、更强的性能、更丰富的应用场景,是硬科技接下来的真动力。
无法忽视的XPU
8月26日,安谋科技召开新业务品牌战略发布会,推出了以「核芯动力」为主打品牌的XPU战略。
“未来世界里有很多应用场景,以自动驾驶为例,摄像头的清晰度每过几年就翻番……这些摄像头产生的数据流都必须被实时性地处理,才能保障行车安全。更重要的是,随着这类自动化、自主智能设备的出现,设备和设备之间、车和网络之间的实时互动产生了更多的多样化数据。这些海量的数据流必须有一个全新的计算架构才能提供百倍算力的提升。”吴雄昂如是谈及XPU战略的需求起源。
其实,XPU的应运而生主要依托于两个大背景:通用计算层面,基于CPU的算力演进速度日趋缓慢;融合计算层面,专有数据流计算处理大幅增长。这也就是说,数据处理的需求激增但算力的发展跟不上,中间的鸿沟就会越来越大。
比如自动驾驶芯片通常具有“CPU+XPU”的多核架构,L3+的车端中央计算平台需要达到500+TOPS的算力,只具备CPU处理器的芯片不能满足需求。所以自动驾驶SoC芯片上通常需要集成除CPU之外的一个或多个XPU来做AI运算。特斯拉在2019年4月发布的全自动驾驶套件(Tesla FSD)赚足了眼球,其搭载的神经网络加速器(NPU)就是整块FSD芯片上最大的组件和最重要的逻辑部分。
而XPU可能是一个,也可能是多个,X代表着无限的可能性。这些不同的、专业的“XPU”以某种最优的方式组合在一起,然后在CPU的指挥下去做自己更擅长的事情。简单来讲,在系统中,中央处理器将化身成为一个管家,在读取得到的指令后不再由自己来完成所有任务,而是将任务分配出去,以达到计算能力最大化的目的。
这样一来,计算的能量将会被进一步释放:
第一,功耗小、成本低。还是举特斯拉FSD芯片的例子。根据特斯拉官方数据,FSD计算机(HW 3.0)与其上一代产品(HW 2.5)相比,性能提高了21倍,而功耗仅提高了25%,其中NPU的贡献功不可没。
第二,个性化、定制化。针对特定需求所设计的XPU,在处理相关数据和信息时的计算能力和性能表现会更加优秀,也更能适应多样化使用场景对于计算速度的要求。
第三,开发者友好。一位芯片行业从业者告诉「深响」:“如果CPU和XPU是一起的就更好了,我就不用一家一家地买不同的IP。从技术方面来说,推出新的架构肯定对于技术类的公司是非常好的,说明行业在进步,巨头们没有躺赚而是坚持在探索这个领域,面对不同的应用需求,推出不同的处理单元,肯定是更好的。”
此外随着目前神经网络算法和与之对应的计算架构不断涌现,如果每逢“上新必剁手”,最终下沉到用户和企业身上,就会导致使用成本和替换成本过高。因此,最好的解决办法就是将多种计算架构融合在一起,大家集体做功,生命周期就长的多了,在产业落地上也具有了更大的优势。
所以,有了这些优势,再结合当下越来越丰富的计算场景、越来越庞大的数据,XPU这条赛道不容小觑。
“在过去,从CPU到NPU 、VPU再到 ISP,每个计算单元都是独立的,合作伙伴往往需要从多个供应商那里把这些IP根据场景重新定义、二次开发、裁剪和优化。在新的高密度数据流计算环境当中,这是一个巨大的挑战。”
吴雄昂表示:“针对这样的挑战,我们根据场景,重新定义融合计算架构、新的指令集、处理器IP、系统软件、设计服务。不同的计算单元根据使用场景进行重新定义、组合以及架构融合,优化数据搬运,降低功耗,提升效能,给我们合作伙伴提供一个完整的交付方案。”
核芯动力开启
当前,各个产业转型所面临的一个问题就是如何快速由信息化时代进入数字化时代。在信息化时代,计算机领域封闭的硬件架构造成了无法协同的管理机制。这也正是数字化时代计算机领域的一个发力点。
凭借上文提到的种种优势,XPU也逐渐成为一股推动数字化转型的重要力量。XPU,并非硬件层面的物理堆砌,其本质上讲求的是通过互联互通、跨架构的软件和生态构建来改变“分头发展、多头并举”的老路。
英特尔的策略是在自身X86架构的基础上,将其赖以成名的CPU与其他类型的处理器结合,来打造自己的XPU系统。
2018年,在成为中资控股的本土企业之后,安谋科技也在顺应发展趋势的XPU赛道上加大自身的投入,同时构建起自己的生态。
事实上,在过去十余年,安谋科技及前身Arm中国开拓并赋能了国内年产值过千亿人民币规模的芯片设计产业,拉动了下游年产值过万亿人民币规模的智能科技产业生态。
这让安谋科技成为了中国最大的芯片设计IP供应商,其结合中国市场需求,自主研发基于Arm技术的IP与标准,赋能本土芯片生态合作伙伴超过250家,中国客户国产芯片累计出货量约200亿,并在过去十余年取得近200倍的增长。
国产SoC中,有95%是基于Arm处理器技术,预计到2035年,将由超过1万亿台智能电子设备实现互联。从各种传感器、门禁卡、手机、家电、汽车,到工业机械、通信基站、数据中心、云服务器,基于Arm架构的芯片无处不在。
在此基础上,安谋科技提出“A+X”双轮驱动战略,一方面持续推动Arm CPU架构的本土化、生态化发展;另一方面,发挥本土企业的优势,聚焦自主研发,打造自主架构的XPU产品和多样化生态,以自主架构XPU的创新发展与传统计算IP相配合,提供多样化、定制化、符合中国产业及市场需求的计算元素。可以预见,安谋科技的「核芯动力」将会越来越强。
再具体来看,「核芯动力」的具体优势主要体现在灵活、高效、专用及支持丰富产品组合等特性上。其中,高灵活性表现在可以根据计算密度的需求,动态来分布负载;高效率部分能够基于场景调度XPU,提高整体计算效率;高性能部分可以用新的架构提升性能,并且实现超低功耗。此外,也可以支持丰富的XPU产品组合。
目前「核芯动力」已经落实了包括“周易”NPU、“山海”SPU(信息安全解决方案)以及“玲珑”ISP、“玲珑”VPU在内的四大产品线。
仅以其中的“周易”NPU为例,作为安谋科技面向人工智能设计的全新AI处理单元,已经广泛应用于安防、智能家居、移动设备、物联网、车载等市场。除了更低的成本、更强的安全性以及高性能的AI算力之外,“周易”NPU的一大特点就是适配性强,开放通用。
对于新开发的芯片,“周易”平台还可以让芯片合作伙伴使用“周易”NPU IP设计新的SoC,并提供了验证测试向量、参考用例和后端实现参考流程等全面支持,以加速新的SoC设计。这种在IP设计过程中的开放性已初步显示出安谋科技对于开放生态的一种态度。
就像多年前Arm放弃了传统IDM模式、开创授权模式一样,安谋科技承袭了这一开放、创新的基因。这也是安谋科技XPU与其他厂商XPU最大的不同——它不是封闭的,而是开放的。它为客户提供一体化IP解决方案,与客户携手打造共享共赢的生态;甚至发起并加入”智能计算产业技术创新联合体”,与联合体成员共同宣布全球首个开源神经网络处理器指令集架构。
生态一方面能够促进其中的企业加速成长,形成互利共赢的局面。反过来,不同细分领域的厂商加入进来,也能更好地丰富应用场景,激发整个生态创新发展的活力。而开放生态或许还不够,安谋科技还打算进一步赋能生态。其实早从2016年起,安谋生态里的安创加速器就开始在商业模式和资本方面为中小企业和研发团队提供支持。
“我们也希望‘共建·共享’这个理念不仅仅用在架构指令集本身。” 正如吴雄昂在发布会上所分享的关于生态的看法,从社区、投资、标准、学术研究到产业发展,其也将依托这个开源指令集和XPU的核心技术,打造一个全球开放的生态。
除了技术实力和开放生态,还有特别值得注意的一点是,无论在国内还是国外,XPU还都没有形成一套成熟的标准,这给各个企业带来机遇的同时,也带来了风险和挑战。安谋科技拥有中国属性和强烈的国产化决心。核芯动力XPU是中国团队自主研发的架构和技术,未来有希望以中国为中心打造一套国际标准。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至22018681@qq.com 举报,一经查实,本站将立刻删除。