中国算力大会联想展台,钛媒体App拍摄
(资料图片)
通用人工智能时代到来,大模型训练的参数量突破万亿级关卡,AI算力已成为企业训练开发使用人工智能的硬门槛,以及算力基础设施的重要发展方向。据IDC报告显示,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力,AI算力已成为算力发展的主要方向。
同时,中国信通院发布的数据也指出,截至2021年底,基础算力稳定增长,规模为95EFLOPS,增速为24%,占比为47%。智能算力增长迅速,2021年规模达到104EFLOPS,增速为85%,占比为51.5%。智能算力的比重提升代表智算应用场景的不断丰富,智能算力成增长动力。
联想中国区基础设施业务群服务器事业部总经理陈振宽
联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽表示,AI算法模型的变革使AI算力需求进入爆发式增长阶段,2010年之前,训练算力的增长率约20个月翻一番;2012年深度学习来临,训练算力每6个月翻一番;2018年以来基于Transformer架构的大模型训练算力需求每年数百倍增长。
“AI算力已经成为中国算力发展的主要方向,根据IDC统计,中国AI算力持续高速增长,2022年规模达268百亿亿次/秒(EFLOPS)。同时未来几年的复合增长率高达52.3%。”
相比较通用算力,AI算力有着明显的差异。从千万级的参数到千亿级的参数,从深度学习需要中等规模的训练和推理到现在要全面地去实现超大规模的训练,AI算力需要依据AI数据和算法的特性设计和优化,具体到AI算力基础设施层面就需要根据特性进行针对性的优化。
此前,在联想集团2023/24财年第一季度业绩会上,联想集团执行副总裁兼中国区总裁刘军透露,联想在AI的基础设施上,也有比较前瞻和显著的布局。截至目前,有60多款产品都是AI基础设施产品,包括推理服务器、训练服务器、AI存储等。
钛媒体App了解到,普慧算力包含“普适”和“智慧”,是联想算力发展的战略方向,也是联想的价值主张。其中,普适是指希望算力能够像水和电一样,可以人人即取即用而不必见;智慧更多是指人人可以随需使用而不必问,人们无需在使用算力前,询问它能否满足要求,需要使用、随需使用就可以。
陈振宽称,联想AI算力战略有两大特征,一个是AI赋智,二是绿色赋能。其中,“AI赋智”即让100%算力基础设施产品支持AI,50% 基础设施研发投入在AI领域,全面AI技术覆盖全域AI应用;“绿色赋能”则是全面布局和引领液冷技术,打造液冷集群方案灯塔,以绿色算力基础设施助推智算产业可持续发展。
在中国算力大会上,联想发布了两款全新AI服务器产品—联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。联想方面表示,在通用算力向AI算力发展的当下,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器两款新品将分别满足不同类型的AI应用场景需求。
联想问天WA7780 G3
具体来看,联想问天WA7780 G3是一款专为AI大模型训练所打造的服务器,采用了三重独立风道设计,预留了液冷冷板,基于第四代英特尔®至强®可扩展处理器,将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。
联想问天WA5480 G3
联想问天WA5480 G3 AI训推一体服务器是一款4U机架式AI服务器,支持多元算力和丰富的生态,采用2颗第四代英特尔®至强®可扩展处理器,支持最新PCIe 5.0。通过PCIe扩展,最多可以支持10张包括最新NVIDIA H800 GPU在内的,多类型、多品牌AI加速卡。
在联想的理念中,兼顾不同算力形态,会从不同场景上提供全面的产品来满足不同算力需求。这次推出的这两款产品比较偏向于大规模的推理和大规模的训练,就是大规模和超大规模。同时,两款AI服务器新品也可以配合联想的边缘计算的产品来实现边缘推理。
联想集团董事长兼CEO杨元庆在业绩会上表示,在未来三年里会追加投入10亿美元(70亿人民币)在人工智能方向的所有领域,这个领域包括适合人工智能计算需要的服务器存储的产品,包括给云计算厂商的,也包括企业级的。
面向未来的发展,陈振宽称,联想也在积极了解客户在不同领域上的需求和痛点,以AI导向的基础设施助力人工智能加速,通过AI技术,覆盖全域应用,加速实现普慧算力。(本文首发钛媒体App,作者/杜志强,编辑/钟毅)
关键词: