AI算力,在服务器中重要性越来越高了。
今年3月~4月,AMD、英特尔、英伟达三家芯片巨头,各自发布了服务器CPU,无一不在强调AI运算与生态。
连制造GPU的英伟达为了提高服务器的AI算力,都亲自下场制造CPU,希望打破传统服务器的AI算力瓶颈。
英伟达声称,其CPU在与GPU协作AI运算上,相比x86有10倍的性能提升。
尤其引人关注的是,采用英伟达CPU的首台AI超级计算机ALPS,将于2023年交付瑞士国家超算中心。
届时,这台专为AI而生的超算算力将达到20EFLOPS,把目前全球最快超算“富岳”的AI算力(1.4EFLOPS)远远抛在身后。
其实,何止最尖端的超算,AI已经悄悄重塑了服务器行业。
据浪潮透露,2020年全球交付的AI芯片算力已经超过了通用计算芯片,预计到2025年,AI加速芯片将占到全球总算力的80%。
AI芯片和服务器之所以快速爆发,和市场的需求是分不开的。
随着计算机视觉技术日渐成熟,产业界把目光瞄准了下一块“难啃的骨头”——自然语言处理(NLP)。
NLP对算力的需求到底有多恐怖?
2020年OpenAI公布的超大自然预言模型GPT-3,拥有1750亿参数,训练所需算力相当于一块GPU运算355年,今年谷歌发布的Switch Transformer参数量超过万亿。
AI对算力的需求正以每年一个数量级的速度增长。
而英伟达的超算ALPS训练一个GPT-3仅需2天时间,如此惊人的AI运算速度无疑给NLP等技术的未来带来了无限遐想。
那么,在国内,我们的AI超算中心发展到哪一步了呢?浪潮在刚刚举办的IPF上交出了多份答卷。
原来,上至探索宇宙的中国天眼,下至手机语音助手,背后都有浪潮AI服务器的身影。
在2021年IPF(浪潮合作伙伴大会)上,浪潮联合国产AI芯片厂商寒武纪,共同发布了中国最强AI服务器“扬子江”。
“扬子江”AI服务器搭载了8颗AI加速卡寒武纪思元290,单机输出AI算力高达4096TOPS。
英伟达ALPS为了打破数据传输瓶颈,使用NV Link技术取代PCIe获得超过10倍以上的通信带宽,而“扬子江”也使用了寒武纪的MLU-Link多芯高速互联技术,让AI加速卡之间带宽达到600GB/s,最高可提供2048TOPS的AI训练性能、4096TOPS的AI推理性能。
“聚是一团火”,浪潮不仅发布了AI服务器单品,由国产AI服务器组成的智算中心也已经建成。
这个坐落于南京的智算中心由浪潮和寒武纪联合打造,搭载寒武纪最新的思元270和290人工智能芯片。目前,已经投入运营的规模已经达到了E级AI算力,即每秒百亿亿次AI基本运算。
南京智算中心将成为一个AI算力支撑中心,为金融科技、智慧教育、智能制造、智慧交通、智慧医疗、智慧零售等领域的应用创新提供支持。
除了与国产AI芯片合作外,浪潮还与英伟达合作打造了全球最强AI服务器NF5488,这款服务器支持8颗英伟达A100,并使用浪潮自研通信技术实现CPU到GPU单层Switch通信,效率提升1倍。
之所以称之为最强,是因为NF5488在全球权威AI基准测试MLPerf中共创造19项性能纪录,成为创纪录最多的AI服务器。
浪潮表示,相比上一代的计算产品,NF5488性能最高可达20倍的提升。
NF5488可应用于海量数据的预处理、清洗、训练,由于其巨大的算力,可为用户缩短一半的开发周期。
在IPF2021上,浪潮还发布了AI视频加速器VPU产品M10A。
VPU即视频处理单元(Video Processing Unit),可以加速视频的编码、解码、转码、画质及分辨率转换等各种处理,为行业视频应用带来高效能的加速计算。
为何发布这样一款产品?浪潮AI&HPC产品线总经理刘军表示,网络上90%的流量是视频,如果用VPU处理可以大大节约其他硬件计算资源。
搭载浪潮M10A的AI视频服务器,单机就能提供1280路全高清AI视频加速能力,相当于300台通用双路服务器,而功耗仅为后者的1%。
此外,浪潮还为AI边缘计算任务推出了微服务器EIS800系列,可提供100TOPS的边缘AI算力,提供防水防尘的型号,供智慧交通这类户外恶劣场景使用。
浪潮也不仅仅是一家仅负责交付硬件的服务器厂商。
从2019年开始,浪潮提出了“元脑生态”计划,打造基于AI硬件的服务平台,目的是打破AI技术与需求之间的隔阂:拥有AI技术的企业找不到落地场景,拥有AI需求的企业不具备技术能力。
在浪潮的“元脑生态”概念中,AI技术企业是“左手伙伴”,传统产业是“右手伙伴”,浪潮则充当二者之间的桥梁。
那么,这2年来元脑生态到底发展得怎么样?
据浪潮透露,元脑生态的左右手伙伴已经发展到2000多家,生态伙伴服务的客户不乏像西湖大学这样的高端研究机构。
为了帮助西湖大学打造全球领先的AI计算平台,浪潮与荣联科技、趋动科技携手,用顶级的AI算力配置+AI集群优化+实施运维能力,交付了组建顶级智算中心的方案。
今年今年元脑生态升级到2.0,其中最大的变化是一个全新的智算产业聚合平台“AI Store”诞生了。
AIStore就是AI产业的线上“应用商店”。
过去两年间,浪潮为元脑左右手伙伴举办了50多场线下招募会。但线下的力量终究是有限的。
AIStore能够在线上高效完成双方的需求对接。左手伙伴的AI能力获得浪潮认可后,就可以在AIStore上发布产品,而那些传统企业右手伙伴,可以在AI Store上“选购”符合需求的AI产品。
AI技术企业好比应用商店中的“软件开发商”,传统企业就好比“下载用户”,如此一来大大提高了沟通效率。
说到AI,我们常常忽略服务器厂商在其中的作用。全球最强AI超算ALPS的背后,不仅有全球头号AI芯片公司英伟达,也有全球第二大服务器厂商HPE的身影。
任何芯片交付到用户手中,都需要服务器厂商对硬件与软件的打磨,不同厂商芯片的通信协议各不相同,能兼顾不同硬件就是一项重要能力。
尤其是今年以来,全球GPU芯片供货紧张,能为用户提供灵活多变的AI服务器就显得尤为重要。
而浪潮在国内AI服务器行业充当着行业第一的角色,在国内已经连续4年市场占有率超过50%。
其中一项重要原因就是浪潮是全球多个AI硬件组成的重要成员,具备提供全栈AI产品的能力。
浪潮的AI服务器也已经渗透到生产、科研、生活的方方面面。
除了前面提到的为西湖大学提供智算中心,连“中国天眼”FAST背后也有浪潮AI助力。
中国天眼是世界最大的射电望远镜,帮助科研人员观测暗物质、测定黑洞质量,这样一台巨型设备每秒就能产生38GB的数据。
浪潮的AI微模块数据中心为中国天眼服务器的运行和30PB分布式存储平台提供强有力的支撑。
此外,浪潮还与OPPO合作打造智算基础设施,支撑着每月交互次数高达20亿次的OPPO小布语音助手。
“计算力就是生产力”,各行各业正在用浪潮的AI证明这句话,浪潮也在用算力推进AI产业的前进。
“