
21世纪经济报道记者 陈归辞
近日,浪潮金融行业部方案架构师马宏宾在上海金融展上接受21世纪经济报道记者采访时透露,受益于智算需求的爆发式增长,以及金融、互联网等行业加快建设安全可靠AI基础设施,浪潮搭载国内GPU和CPU的服务器规模今年将大幅增长。
生成式AI和智能体应用加速落地,正在推动中国算力产业进入新一轮扩张周期。中国信通院数据显示,今年一季度国内AI算力需求同比暴涨417%,而供给增速仅128%。
供需失衡之下,算力市场正步入量价齐升期。而对安全可靠算力的需求亦在加速释放。
金融与互联网自主算力需求强劲
作为国内头部算力基础设施厂商,浪潮计算机主营业务涵盖服务器、PC等计算产品。金融是其业务中的一个重要板块。
“金融行业对安全可靠的要求很高,也是安全可信路线推进最快、标准最严的领域。”马宏宾指出。
随着生成式AI与智能体加速在金融机构的业务场景中落地,行业算力需求结构正发生显著变化。信贷审批、合规审核、保险理赔等场景对算力的消耗量激增,这类业务往往需调用征信信息、资产数据、监管政策等信息与数据,并进行多轮推理与交叉验证,单次业务流程可产生海量Token需求。
除了金融行业外,教育、政务、能源、交通、医疗、电信、电力、航空航天等行业也在加速推进安全可靠算力基础设施建设。
作为产业链上游的服务器厂商,浪潮计算机直观感受到此轮需求的快速升温。浪潮计算机AI产品线负责人刘伟透露:“今年公司搭载国内CPU及GPU的AI服务器出货规模将显著增长,实际上今年我们有机会做到更大。”
刘伟称,浪潮计算机国内工厂扩建,包括液冷产线扩建,都在如火如荼地推进,接下来全国还会进行大规模算力基础设施建设。
算力Token化提升20%存量GPU算力利用率
在算力需求快速扩张的同时,如何管理复杂的算力资源,并以更低的Token成本将AI转化为业务能力,成为需求端的新诉求。
以金融行业为例,当前算力消耗模式已经发生根本性改变。过去,一次请求对应一次推理的短时调用;而随着AI进入业务流程,一个业务流程往往需要多个智能体协同、多轮推理与工具调用,导致Token消耗呈链路级放大且难以预测。
与此同时,金融机构普遍面临多元异构算力资源分散、跨云部署调度难等痛点。一个常见的状况是,总行、分行、研发中心等不同部门各自采购和管理资源,导致一方面部分业务面临算力紧张,而另一方面部分算力资源却处于闲置状态。
“金融机构尤其是从今年开始已经完全意识到了这个问题,不能再让各部门以服务器整机或卡的形式使用算力,而要统一用Token这样的标准化单位,像水电一样来明确计量各个部门需要多少算力资源。”马宏宾表示。
在这一背景下,浪潮推动“算力Token化”变革,将GPU算力资源抽象为可计量、可调度、可计费的Token,像水电一样按需分配、跨池调度。
据马宏宾介绍,目前头部金融机构已开始探索统一算力调度平台建设,浪潮计算机正在参与相关建设。相比之下,中小金融机构仍处于AI应用初期阶段,更多采用独立部署模式,统一纳管和调度尚需时间推进。
据悉,从经济账来看,算力Token化将帮助实现存量GPU算力利用率提升不低于20%、新购买算力成本节省不低于10%。
