IT技术信息

首颗中国DPU芯片点亮背后 我们对DPU又有了更清晰的认识「dpu遮瑕dpu鼻贴好物分享」

原标题:首颗国产DPU芯片点亮背后 我们对DPU又有了更清晰的认识

随着国际芯片大厂纷纷入局DPU,市场对DPU芯片的价值肯定进一步坐实。前有英伟达CTO表示“DPU是我们的重中之重”,后有英特尔收购Bearfoot、AMD收购DPU初创公司Pensando,最近Fungible又被微软收购,这些都间接地反映出DPU的核心价值。DPU作为继CPU和GPU之后的又一个重要的算力支柱,将卸载网络、存储、虚拟化、安全等基础负载,有效减轻CPU的负担。

作为国内第一批研究和开发DPU芯片的企业,近日,中科驭数宣布自主研发的第一颗DPU芯片K2成功点亮,这是业内首颗完成点亮的国产ASIC形态的DPU芯片,中科驭数也扛起了国内DPU发展的大旗。

K2是一颗怎样的DPU?功能完整、性能也不差

DPU芯片发展近3年,但关于DPU芯片,其行业标准还没有形成,在工艺和性能方面并没有很多可以对标的商品。那么K2芯片是一款怎样的产品呢?

(图源:中科驭数)

在K2芯片的定义和定位上,据中科驭数创始人、CEO鄢贵海告诉笔者,现阶段的DPU核心是进行功能定义,必须要先解决功能的问题,然后才能考虑更多的性能问题。所以在工艺方面,驭数科技选用的是28nm。28nm的选择又有几方面的考量:首先,28nm实现DPU芯片的功能没有问题;其次,从性价比来看,28nm的成本比较可接受;另外,这也与驭数科技在过往设计方面的积累有关,K2本来的规模比较大,用到的IP也比较丰富,而且大多数IP在28nm的工艺线上已经验证地比较充分。所以,综合考量来看,28nm是一个既安全、工艺又成熟、性价比较高、且能达到功能的诉求的选择。

中科驭数创始人兼CEO鄢贵海(图源:中科驭数)

作为一颗功能型定位的DPU芯片,K2可以支持网络、存储、虚拟化等功能卸载,这也是目前国内首颗功能较完整的ASIC形态的DPU芯片。

功能满足了,性能如何呢?

诺基亚c3-01上市时多少钱

说到性能上的突破,鄢贵海表示,DPU首先要解决的是时延问题。DPU最早用于网络加速就是为了解决网络延迟的问题,例如在金融证券行业,超低延迟网卡是刚需,必须要做到1.7微秒才是超低时延,而在这个场景下,处于长期被国外厂商垄断的局面,到2021年为止,AMD仍占据90%以上的市场份额,剩下的几乎被英伟达和思科占据。正是因为抓住了行业这一大痛点,低时延成为驭数科技最先爆量的一个产品。

K2芯片达到了1.2微秒超低时延的性能,并且可以支持最高200G网络带宽。驭数科技的K2芯片成功打破了国际厂商的垄断,至少是在金融场景下。

不过对于K2,驭数对其的厚望远远不是仅实现金融计算领域的国产替代这一目标,而是也瞄准了更广阔的数据中心场景。因此,驭数科技把预计未来1~2年能用到的功能都布进去,希望在接下来K2的应用过程中,不断完善软件等方面的支持,推动DPU芯片在数据中心的标准化。“我们很高兴在这个时点看到,现在的数据中心中的运营商对于DPU的需求正在逐渐走向一致,之前我们定义K2的时候,大部分已经预料到它核心的需求点,我们占了一定的先机。”鄢贵海指出。

DPU的路线之争:是FPGA还是ASIC

怎么不用榨汁机榨出苹果汁

广汽传祺最新发动机技术

在DPU的发展路线方面,业界一直有关于是采用FPGA还是ASIC的路线探讨。譬如,全球行业的标杆英伟达采用的是ASIC路线,英特尔采用FPGA加速卡+ASIC的方式。

对此,鄢贵海认为,是选用FPGA还是ASIC,我觉得本身还是要看成本。当两者性能都可以满足一定要求的时候,就要看边际成本是不是够低,是不是可以做到一定的规模效应,保证它的生命周期。目前,业界的DPU运用FPGA的方式,我觉得也是一个阶段性的,DPU的应用场景相对比较多,对于一些特别细分的场景,尤其是那些对设备功耗要求没有那么高、功能也相对简单的场景来说,可能用FPGA就可以满足部分要求,而如果贸然用ASIC,虽然功耗降低了,但是整体的成本还是太高。

驭数科技从第一代芯片K1开始就采用自主研发的敏捷异构KPU芯片架构。鄢贵海指出,我们选择ASIC的路线本质上是ASIC的DPU是能产生规模化效应的,是能包含大量FPGA的方案覆盖不到的细分市场。ASIC芯片所能带来的优势它的边际成本比较低,性能优、功耗小。

ASIC是一条性能最好也是最困难的一条路,鄢贵海说道:“我觉得要把困难想在前面,一开始做的时候就得啃最硬的骨头,后面再做减法的时候才会游刃有余,不要开始就先专挑犄角旮旯去做,尤其在做对技术要求门槛比较高的创新性产品上。通过这种方式,才能让公司技术的积累有一个雏形,你的产品才会一代比一代完善,价值才会得到增加。如果反过来,你的积累看着多,光是积,但是累不起来,最后就会变得很散,散了以后产品就很难具有核心竞争力。”

积木易搭科技

什么时候做ASIC应该是每一家DPU厂商都会面临的一个问题。怎么选这个时间点?有两个方面的因素,一是内部因素,团队现在的技术积累是不是足以支撑做ASIC的产品;二是外部因素,芯片做出来用于什么场景中,企业必须准确地判断好外部条件的成熟度。

做一颗DPU不难,难的是跟上整个计算基础设施技术的演进

可能很多人看到,现在诸多的云厂商开始投入到DPU的研发中,云厂商能不能做好DPU?鄢贵海的观点是,答案不太好下定论,但我相信一点,DPU终将会成为一颗相对标准的芯片,会跟CPU、GPU一样,成为整个计算的基础设施里面的一部分。从这个角度来看,如果把DPU理解成一个应用型的芯片,那可能是应用厂商能做得好;而如果DPU的定位是在基础设施层的芯片,可能还是得由第三方来做。

从发展的眼光来看,对于一家DPU厂商而言,其实短时间内跟哪个厂商绑定的紧不紧,并没有那么重要。绑的紧并不代表它的方案就是最优的,可能绑的紧的目的就是为了短期拿个单子而已,这种思路不见得对DPU的发展具有生命力。鄢贵海认为,作为一家DPU厂商,要看到整个计算基础设施技术的演进,DPU的产品要随着这一技术的演变而发展,这才是让DPU最后真正变成核心的主流芯片的正确态度。

作为一个在DPU行业已经摸爬滚打了好几年的创业者,鄢贵海表示,DPU还是一个挺复杂的事情,虽然我们在这一块已经做了好几年,但我仍然觉得还有大量的技术难题需要攻克,绝对不是说铺500个工程师就能搞定的事情,需要随着整个应用的基础设施的改进而改进。做出一颗DPU本质上没有那么困难,但是要保证你的DPU的技术迭代跟上整个基础设施的演进步伐,这个是术业有专攻的。

据驭数科技的介绍,K2 DPU自2020年10月开始规划,到立项,再到完成代码、流片,前后投入小200人,历经差不多2年的时间,直到2022年12月,驭数科技这颗DPU芯片才成功完成点亮。

中科驭数联合创始人、高级副总裁(兼CTO)卢文岩也介绍道,整个K2项目进行了60余次方案评审,芯片前端进行了近40万行代码的开发;DPU是一个与应用密切相关的芯片,在研发阶段就要完成云原生、存储、金融计算、边缘计算等5大场景的应用的原型适配;在功能仿真和测试阶段要完成数千个验证和测试用例。 这还是在团队在芯片体系结构领域超过15年的技术积累,已经完成了第一代芯片K1,以及驭数在网络、存储、计算等领域积累的TOE、RDMA、NVMe-oF、大数据处理等功能核,技术积累的前提之下。

有望成为最快规模化落地应用的国产DPU芯片

芯片从设计到流片回来,成功点亮,接下来量产,这些都不能算是真正意义上的成功。一个芯片产品要最终变成商品、实现规模化落地,才能真正发挥其价值。

在鄢贵海看来,DPU要想形成规模化的应用,很重要的一点就是,DPU必须要跟云厂商、操作系统厂商,以及服务器厂商等建立良性的联系,大家相互开放、做兼容。之前市场上没有成形的产品,厂商之间仅限于初步的交流,所以兼容很难做到很深。要想真正把生态搭建起来,需要有芯片产品真正进入这些现实的硬件平台中,供第三方生态厂商在上面做开发、测试。

在应用场景上,K2可以广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景。

210dpu2000和150dpu3000哪种好

譬如在数据中心场景中,通过DPU去卸载云原生,中科驭数在整个行业中可以说是走在前列的,即使是对比英特尔。国内更是如此,尤其是通过DPU卸载方案在金融中心的商业化落地方面。

除了数据中心,5G方面,驭数科技也进行了各种探索和合作,这不仅包括国内的大部分集成商、曙光、联想、浪潮,还有些新兴的服务器集成厂商等都有相关的合作。可以说DPU主打的通用市场,典型的客户都与驭数有很多合作。

“我们现在已经有了上量的条件,这将使得K2 DPU也有望成为最快规模化落地应用的国产DPU芯片。”鄢贵海谈道。

不容易形成垄断,DPU的生态是开放的

而规模化落地最大的挑战是应用,这就需要考验软件栈是不是成熟,兼容性是不是做的够好。对于DPU而言,DPU性能好不好取决于硬件,好不好用则是软件说了算。只要软件生态的兼容性做得好,很多上乘的应用都可以无缝迁移到上面,彻底打开DPU的应用窗口。

据张宇告诉笔者,跟GPU芯片不同,DPU面对的是不同的应用场景、不同的客户,从最终客户落地的应用场景来看,DPU不是一个垄断的行业,而是一个开放的、有事实标准的。DPU的生态更加开放。DPU的生态更多的是端,它的上端对接的是现在已有的各种开发平台,另外一端是真正对接到不同的DPU设备驱动层的东西。下面这一层是每家都自己做的,上面那一层开放的水平要比GPU清晰的多。只有开放,才能让更多的应用更方便地导入到DPU平台上面。

在软件方面,驭数科技于2022年12月8日发布了HADOS 2.0版本,这是国内第一个开放DPU软件栈,在系统适配性方面,HADOS完成了与十余个主流操作系统以及七种主流CPU架构的适配工作,为用户提供更多的自主选择权。驭数科技也正在与行业内的伙伴一起构建HADOS DPU生态的坚实基础,帮助开发者快速构建DPU应用和服务

HADOS全景视图(图源:中科驭数)

结语

中科驭数此次K2 DPU的成功点亮,是驭数DPU走向成熟的一大步,也是整个国产芯片又一重要的里程碑。K2将为行业提供一个比较完善的功能平台,对生态直接助力,也为接下来DPU生态扎根提供了一个很好的土壤。

210dpu2000和150dpu3000哪种好

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

苹果全球降价

本栏最新
全站最新