浪潮计算机：今年国内AI服务器规模大幅增长

受益于智算需求的爆发式增长，以及金融、互联网等行业加快建设安全可靠AI基础设施，浪潮搭载国内GPU和CPU的服务器规模今年将大幅增长。

21世纪经济报道记者陈归辞

近日，浪潮金融行业部方案架构师马宏宾在上海金融展上接受21世纪经济报道记者采访时透露，受益于智算需求的爆发式增长，以及金融、互联网等行业加快建设安全可靠AI基础设施，浪潮搭载国内GPU和CPU的服务器规模今年将大幅增长。

生成式AI和智能体应用加速落地，正在推动中国算力产业进入新一轮扩张周期。中国信通院数据显示，今年一季度国内AI算力需求同比暴涨417%，而供给增速仅128%。

供需失衡之下，算力市场正步入量价齐升期。而对安全可靠算力的需求亦在加速释放。

作为国内头部算力基础设施厂商，浪潮计算机主营业务涵盖服务器、PC等计算产品。金融是其业务中的一个重要板块。

“金融行业对安全可靠的要求很高，也是安全可信路线推进最快、标准最严的领域。”马宏宾指出。

随着生成式AI与智能体加速在金融机构的业务场景中落地，行业算力需求结构正发生显著变化。信贷审批、合规审核、保险理赔等场景对算力的消耗量激增，这类业务往往需调用征信信息、资产数据、监管政策等信息与数据，并进行多轮推理与交叉验证，单次业务流程可产生海量Token需求。

除了金融行业外，教育、政务、能源、交通、医疗、电信、电力、航空航天等行业也在加速推进安全可靠算力基础设施建设。

作为产业链上游的服务器厂商，浪潮计算机直观感受到此轮需求的快速升温。浪潮计算机AI产品线负责人刘伟透露：“今年公司搭载国内CPU及GPU的AI服务器出货规模将显著增长，实际上今年我们有机会做到更大。”

刘伟称，浪潮计算机国内工厂扩建，包括液冷产线扩建，都在如火如荼地推进，接下来全国还会进行大规模算力基础设施建设。

在算力需求快速扩张的同时，如何管理复杂的算力资源，并以更低的Token成本将AI转化为业务能力，成为需求端的新诉求。

以金融行业为例，当前算力消耗模式已经发生根本性改变。过去，一次请求对应一次推理的短时调用；而随着AI进入业务流程，一个业务流程往往需要多个智能体协同、多轮推理与工具调用，导致Token消耗呈链路级放大且难以预测。

与此同时，金融机构普遍面临多元异构算力资源分散、跨云部署调度难等痛点。一个常见的状况是，总行、分行、研发中心等不同部门各自采购和管理资源，导致一方面部分业务面临算力紧张，而另一方面部分算力资源却处于闲置状态。

“金融机构尤其是从今年开始已经完全意识到了这个问题，不能再让各部门以服务器整机或卡的形式使用算力，而要统一用Token这样的标准化单位，像水电一样来明确计量各个部门需要多少算力资源。”马宏宾表示。

在这一背景下，浪潮推动“算力Token化”变革，将GPU算力资源抽象为可计量、可调度、可计费的Token，像水电一样按需分配、跨池调度。

据马宏宾介绍，目前头部金融机构已开始探索统一算力调度平台建设，浪潮计算机正在参与相关建设。相比之下，中小金融机构仍处于AI应用初期阶段，更多采用独立部署模式，统一纳管和调度尚需时间推进。

据悉，从经济账来看，算力Token化将帮助实现存量GPU算力利用率提升不低于20%、新购买算力成本节省不低于10%。

相关新闻