2021年10月19日,杭州,云栖大会正式开幕。大会上,阿里巴巴正式发布自研云芯片倚天710,这是阿里云推进“一云多芯”策略的重要一步,也是阿里第一颗为云而生的CPU芯片,将在阿里云数据中心部署应用。
会上,阿里云还推出了面向云原生时代的“磐久”自研服务器系列,首款搭载自研芯片倚天710的磐久高性能计算系列也同时亮相,该款服务器将在今年部署,为阿里云自用。
同时,从现场获悉,阿里平头哥宣布开源玄铁RISC-V系列处理器,并开放系列工具及系统软件。全球开发者可下载玄铁源代码,平头哥也将持续开源稳定的、全栈一体的RISC-V IP核,并提供技术支持和应用服务。
下面,就为各位深度解密这些重磅技术和产品。
一 倚天710有何特点?
倚天710有何特点?和2019年发布的AI推理芯片含光800不同,倚天710是一颗通用服务器CPU芯片。CPU是计算机系统最核心的单元,负责接收、处理、运算计算机内部的所有信息。
倚天710采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到3.2GHz,能同时兼顾性能和功耗。在内存和接口方面,集成业界最领先的DDR5、PCIe5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。在SPECInt2017基础测试平台上,跑分达到440分,是性能最强的服务器芯片,超出业界标杆20%,能效比优于业界标杆50%,能有效帮助数据中心节能减排。
二 研发这颗芯片最大的难点是什么?平头哥做了哪些自研技术和创新?
CPU是半导体行业设计门槛最高的芯片之一,倚天710采用了很多最领先的技术,包括ARMv9、DDR5、PCIe5.0等等,同时也引入了许多自研技术。平头哥从前端架构设计到后端物理实现都是自研,既要克服工艺以及IP不成熟带来的困难,又要针对云场景的独特要求做定制化设计,技术上保障性能、功耗的均衡。
在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到DRAM地址的转换机制,支持安全、非安全隔离、多NUMA、异常通道隔离多种特性,同时DRAM读写效率大幅度提升;在后端物理实现方面,灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术,此外平头哥还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。
三 5nm先进工艺对芯片有何价值?对平头哥的挑战是什么?
芯片也可以称为集成电路,其内部是由大量晶体管组成的复杂电路,其中晶体管的栅极是最窄的线条,这个线条的宽度就代表了工艺的大小。工艺越小,单位面积所能容纳的晶体管就越多,而芯片的性能也会越强,但这一数值越低,对技术的要求也越高。
在此之前,服务器芯片最先进的工艺仍为7nm,倚天710率先实现了更高的工艺,是第一颗采用5nm工艺的服务器芯片,5nm工艺下的倚天710共容纳了600亿晶体管。5nm工艺对能量密度、芯片内部结构的布局有极高的要求,研发过程中我们灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术,此外平头哥还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。
四 该芯片对阿里云以及云上客户有何价值?
性能、成本和功耗是云服务商及云上企业关注的核心,倚天710针对云场景的高并发、高性能和高能效需求而设计,将领先的芯片设计技术与云场景的独特需求相结合,最终实现了性能和能效比的突破。此外,倚天710与飞天操作系统协同,能为云上客户提供高性价比的云服务。2019年云栖大会问世的含光800已规模化部署于阿里云,基于这颗自研芯片的阿里云为云上企业提供了差异化选择,目前已应用于搜索推荐、视频直播等场景。此次发布的倚天710将在阿里云数据中心部署,并逐步服务云上企业。
五 从专用芯片走向通用芯片的研发,这对平头哥来说意味着什么?
通用处理器芯片是数据中心最复杂的芯片之一,其架构设计复杂,对性能、功耗要求极高,截至目前具备这一技术实力的企业也寥寥可数,目前,Intel、AMD、AWS以及阿里平头哥等少数公司在此之列。
过去,平头哥已积累了丰富的AI芯片及处理器IP设计经验,这是平头哥突破通用芯片研发技术的基础。对于平头哥而言,倚天710芯片是首个通用服务器芯片,倚天芯片的研制成功,标志着平头哥已经具备大型复杂芯片的研发设计能力,并进入一流芯片公司的行列。
六 相比其它企业,平头哥研发芯片有何优势?
和绝大多数芯片企业不同,平头哥的目的并非售卖芯片,已全面布局处理器IP、AI芯片、通用服务器芯片等技术。在处理器IP方面,平头哥核心团队拥有十年以上的CPU IP和芯片研发经验,长期从事自研指令集架构、CPU微体系结构与系统芯片产品的研发,累计开发了十多款玄铁系列嵌入式CPU IP核,这些产品均已得到大规模量产的验证,累计出货量超过25亿颗。在云端芯片方面,背靠全球前三的云平台阿里云,平头哥能深刻理解数据中心业务场景和需求,因此能够更高效地研发业界一流的芯片,目前,平头哥已拥有含光800 AI推理芯片、倚天710通用芯片,这两颗芯片均实现了性能的突破。
七 阿里与 ARM、Intel 之间将保持什么样的合作关系?
阿里云「一云多芯」和「做深基础」的商业策略,目前阿里云已全面兼容x86、ARM及RISC-V等芯片架构,此次发布倚天710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM等合作伙伴保持密切合作,为客户提供更多选择。
八 目前平头哥有哪些产品?
随着倚天710的发布,平头哥已拥有处理器IP、AI芯片及通用芯片等产品家族。其中,玄铁系列为AIoT终端芯片提供高性价比IP;AI芯片含光800通过阿里云为人工智能场景提供极致AI算力;通用服务器芯片倚天710则通过阿里云为云上客户提供差异化的顶级算力。
在此之前,平头哥旗下玄铁系列处理器出货量已达25亿颗;两年前问世的阿里第一颗芯片含光800已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。
九 平头哥为何开源玄铁 RISC-V 系列处理器?
平头哥坚持自研,同时也拥抱开源,特别是对于正在上升期的RISC-V架构技术而言,只有更多的开发者和企业使用,才能共同推进生态进步,真正让这一技术在芯片和操作系统等软硬件层面实现繁荣,平头哥也会从中受益。
同时,玄铁RISC-V处理器系列开源,将持续提供技术和服务更新,帮助企业和开发者从开源中真正落地,走向商业成功,共同繁荣“云端一体”的AIoT生态。
阿里云智能总裁张建锋表示,“经过3年努力,我们今天又发布玄铁RISC-V系列开源版。未来,我们将开源更多RISC-V处理器,也希望有更多的合作伙伴,在玄铁基础上研发出更多有价值的IP核和基础软件,共同构建开放、透明和普惠的RISC-V生态。”
十 阿里是否会坚持自研芯片,自研芯片对阿里巴巴有何价值?
平头哥于2018年成立,过去三年已推出多款业界领先的芯片类产品,未来阿里巴巴会继续坚持投入芯片的研发。
芯片是计算系统的核心,也是所有互联网应用、创新科技的基础。阿里巴巴集团横跨电商、物流、云计算、大数据、全球化等场景,拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。与此同时,阿里云稳居全球云计算厂商前三、亚太第一的位置,倚天710、含光800等自研芯片还可通过阿里云输出给全社会,以更高的性能和更低的成本赋能更多的企业,让企业随时随地可以享受到极致算力。
随着“倚天”和“磐久”的面世,阿里云完善了全栈云基础设施的最后一环,实现从芯片、部件到整机的技术及架构创新和自研。
本届云栖大会自19日至22日,除了主论坛的精彩发布,在这届云栖大会中有96小时的“云栖数字谷”极致体验,100+场的前沿论坛共创数字新思想、450+最新科技新品重磅呈现以及数字创新者的跨圈交流。