深圳AI芯片企业突围,国产算力从“能用”走向“好用”

2026年04月15日 13:00   南方+

大模型火了两年,企业老板们开始算一笔账:技术够酷,但钱花得到底值不值?

这股“算账”的压力,正沿着产业链一路向上,最终落到了芯片厂商的肩上。

2026年开春,深圳江原科技有限公司联合创始人、首席战略官刘江贤发现,客户的问题变了。去年见面还在追问“峰值算力多少”,今年开口就是:“单Token成本能不能再降降?”(注:Token是大模型的计价单位,一个Token大约对应一到两个汉字的处理量。)

这家扎根深圳的AI芯片企业,近年来已完成从云端推理芯片到本地化部署终端的国产化布局。在刘江贤看来,之前的竞争只能算“热身”,2026年,推理算力的硬仗才算真正打响。

推理算力超7成 ,国产成必答题

“过去几年谈芯片,比的是训练算力。但今年,推理算力需求占比已经超过七成,主角换了。”

这意味着竞争规则也在改写。

单 Token 成本、部署密度、能效比,取代单纯峰值算力,成为客户选型第一指标。以单 Token 成本为例,之前,普通用户刷App感觉不到Token存在,那是平台悄悄担了成本。近期DeepSeek等厂商接连新增产品分层模式,被视为迈向收费的明确信号。从免费到收费,大模型全面进入算账阶段。而对一天调用几百万次的企业客户来说,每一分Token成本都写在盈亏表上——背后的决定因素,就是芯片的算力效率和功耗。

竞争格局也在重塑。高端GPU的外部供给持续收紧,倒逼国内云厂商和智算中心加速建立第二供应链,国产替代的窗口期已经打开。IDC数据显示,2025年中国AI加速卡出货约400万张,国产厂商拿下约四成份额,英伟达市占率从几乎垄断降至五成出头。国产算力,正抢下越来越多的市场。但窗口打开不等于自动入场,性能和功耗的硬仗,一步也省不了。Chiplet、HBM这些后摩尔时代的技术,已成高端芯片绕不开的标配。

“高端GPU买不到,国内需求又在井喷,国产化已经不是选做题,是必答题。”刘江贤说。机构预测中国AI芯片规模将在2030年逼近两千亿美元。谁能拿出便宜又好用的算力,谁就能切走最大的蛋糕。

江原破局,全栈自主是底气

风口来了,如何接住?

江原的打法是:全栈自研、全境内制造、全场景覆盖。从芯片设计到算力卡,从服务器到国产操作系统适配,整条链路握在自己手里。

“外部环境逼着云厂商和智算中心必须建第二条供应链。以前我们是备选,今年已经成了不少头部客户的主力。”刘江贤说。

国产替代不是一颗芯片的事,是整条产业链的协同。江原科技四地布点,两百人的团队里八成是研发人员。目前,首款全国产推理芯片D10已稳定出货,与国内头部晶圆代工厂建立稳定产能合作,确保“能设计出来,也能稳定交付”。资质方面,公司已获得中国通信学会信创数智技术服务能力等级证书,为进入政务、国企等核心信创领域打通了通道。

产品端,江原科技抓住“大显存+低功耗”这一差异化突破口。D20算力芯片基于国产先进流片工艺,专攻推理场景,“一卡双芯”的设计把单芯片功耗压在72瓦,双芯合体也不过145瓦。基于这颗芯片搭建的AI一体机,单机算力冲到5P,显存顶到4TB。

值得关注的是,江原科技新一代在研芯片瞄准高端训推一体场景,有望进一步缩小与国际领先水平的差距。

从智算中心到桌面,让算力“触手可及”

芯片的价值,最终要在应用场景中验证。江原科技不仅造芯片,更让算力“触手可及”。

基于D20,江原已经推出了面向不同场景的终端设备。“品原AI一体机”是本地部署的国产化算力终端,主攻智算中心和企业机房。另一款AI PC桌面静音一体机,瞄准的是个人和中小企业。

在展厅里,它没有震动,几乎听不到风扇声。“搁办公桌底下,跑一天千亿模型你都感觉不到。数据不出门,隐私不用愁,桌面级的算力自由,就是这个意思。”

在江原自己的团队里,AI一体机已经当“数字员工”用了。客户与产品支持负责人说,团队有了三位数字同事:“以前处理工单,光填信息就要磨蹭5到10分钟。现在数字人自己判断优先级,分析严重程度,还能上网查背景资料把系统填好,一句话的事。”

外部落地也铺开了。税务上,企业用一体机本地跑税务大模型自查财务,数据不出公司门。纪检监察领域,本地部署的模型做谈话实时转写、银行流水分析,案子处理从一天4个人变成一小时1个人。医疗场景里,离线一体机解决了偏远地区网络差的难题。智慧校园中,本地化部署的智能分析设备能同时处理上百路视频,学生有异常行为马上预警。

但挑战还在后面。

刘江贤指出,当前行业的最大瓶颈已不在硬件性能,生态够不够成熟、能不能和上下游深度联调、大规模交付的工程能力跟不跟得上,这些才是真考验。

“芯片不是孤岛。跟AI框架、大模型、服务器集群磨不好,算力就放不出来。”

为此,江原正在加紧推进芯片与国产深度学习框架、大模型平台的适配,补齐高端算力短板。与ISV(独立软件服务商)、SI(系统集成商)、云厂商、智算中心及整机厂商深度协同,联合开发优化方案,降低客户使用门槛。同时,重点拓展智算中心、信创领域、商业领域及本地化部署四大方向。

目标很明确:推动国产算力生态从“单品可用”走向“系统好用”。

深圳的土壤,长得出硬科技

一家芯片企业能跑这么快,离不开脚下的土壤。

在刘江贤看来,深圳有三样东西。

场景够密。深圳有智算中心、互联网大厂、制造业、政务系统等密集场景,产品出来就能试,试完马上改。

产业链够全。从设计到封测再到集成,都能在短时间内找到供应商,极大缩短生产周期,节省研发成本。

人够拼,也够多。“在这里,市场是冷是热你最先知道,碰到问题也最快能找到能解决的人。”

江原科技表示,会继续扎在湾区,参与“广东强芯工程”,把智算中心的建设往深里做,把AI往各行各业推。

从“能用”到“好用”,就两个字,背后是国产半导体几十年的追赶。2026年推理算力这波浪潮,是技术迭代,更是话语权的重新洗牌。

“直面挑战,把成本控到极致,把生态做到开放,信任自然就来了。”刘江贤这句话,说得冷静,也说得实在。

在深圳这片创新的热土上,属于国产AI芯片的规模化应用大幕,才刚刚拉开。

关注我们