给AI“投喂”精粮!广州数据要素改革放大招

2026年05月20日 16:30   南方+

戴上千问AI眼镜,一句简单的问候后,它能结合天气与时间,在你通勤前主动提醒带伞;

对着精智未来的呼气分析仪轻吹两分钟,一份关于癌症早筛的VOC全谱分析报告便悄然生成;

里工实业的“如意数采套件”更是将工人的每一次拧螺丝、每一次腕部翻转,都精准捕捉为机器可读的数据。

5月20日,这些看似科幻的场景出现在全国高质量数据集与数据标注产业供需对接活动现场。现场发布多项重磅成果:广州市高质量数据集征集启动,广州人工智能数据训练中心正式启用,启动全国首个数据纠纷调解E站,广州城市可信数据空间激励机制发布。

如果说人工智能是蓬勃发展的引擎,那么高质量数据就是驱动前行的不竭燃料。这场全国高质量数据集与数据标注产业供需对接活动的举行,展示广州打响了一场关于“数据质量”的攻坚战,一系列大动作的背后,是一座城市抢占数字经济制高点的决心。

起跑:不只是征集,更是“掘金”

没有高质量的数据,就没有高水平的人工智能。5月20日,广州向全社会发出了一封特殊的“英雄帖”——广东省高质量数据集创新大赛(第二期)与广州市高质量数据集征集同步启动。

戴上手套,扣紧头盔,背上轻便行囊。当工人拧动螺丝、装配零件时,指节发力、腕部翻转、目光游移——这些曾经只属于人类肌肉记忆的细节,如今正被一一捕捉。这是里工实业在活动现场展示的“如意数采套件”。

这套轻量化装备曾在广交会引发关注。里工实业市场经理曹煜然说,一位荷兰客商敏锐地捕捉到了其中的潜力,次日便预约实地探访。对他们而言,将真实作业流转化为机器人训练数据,不仅是技术创新,更是对传统制造逻辑的重构。

这也折射出广州布局高质量数据集的深层逻辑:当AI深入产业腹地,真正的瓶颈不再是算法与算力,而是源于真实场景的“高质量数据”。

因此,当天的这场征集更是一场针对高价值数据资源的“摸底”与“提纯”。广州发布了详细的人工智能高质量数据集征集通知,政府不仅“喊话”,还给出了全链条支持,官方认证、政策激励、项目推荐,目的很明确:通过“以赛促建、以征提质”,把那些藏在角落里的优质数据资源,真正变成驱动产业升级的“真金白银”。

“首先客观来说,具身智能领域的工业场景数据具有很强的定制化和专有性,目前公开的通用数据集更多覆盖基础视觉、通用动作等领域,在精密装配、特种作业等工业细分场景的适配性还比较有限。因此我们现阶段更多是作为数据生产者,积极参与政府主导的高质量数据集共建工作。”曹煜然说,公司下阶段任务,就是利用如意套件,把更多来自真实产线的操作技能数据标准化、规范化,为整个行业提供高质量的数据底座。

先锋队:国企的“数据觉醒”

这场战役中,谁在担当先行探索的主力军?答案是国企。广东省国企高质量数据质效提升行动正式启动,多家穗企纳入首批试点。以前国企手握海量高可信数据,交通流量、能源调度、金融服务……却多是“沉睡资产”。现在,它们正加速从“数据拥有者”向“数据经营者”转变。“我们要做的,就是把沉睡的‘数据金山’唤醒,为AI产业提供源源不断的‘精粮’。”

新基建:大湾区有了AI“中央厨房”

有了原料,还需要强大的加工基地。当天,广州人工智能数据训练中心正式启用。中心落地白云区,确立了“一中心四平台”的架构:产业数据生产平台、高质量数据集评测平台、数据智能体运营平台、产业人才实训平台。它聚焦自动驾驶、生物医药、具身智能、内容审核等前沿赛道,提供从清洗、标注到训练的一站式服务。

更值得关注的是它的“军令状”:力争三年内实现营收突破5亿元,培训人工智能训练师超3000人,创造就业岗位超2万个。

这意味着,大湾区的AI企业从此有了更便捷的“数据粮仓”,研发效率将大幅提升,广州也将借此全力打造“立足广州,链接粤港澳,服务全国”的数据标注产业集群核心枢纽。

同时,依托国家数据产业集聚区,黄埔与天河形成双轮驱动。黄埔凭借制造业底蕴,主攻“数据+制造”;天河则利用科创优势,打造服务与赋能中心。这种差异化布局,不仅避免了内卷,更构建起了从研发到应用的全链条生态闭环,让数据产业在这里实现了“就地转化”。

护城河:全国首创“数据法庭”,纠纷有了“灭火器”

数据交易最怕什么?怕纠纷、怕风险、怕“扯皮”没完没了。广州给出了极具创新的解法:启动全国首个数据纠纷调解E站。由广州互联网法院、广州市政务服务和数据管理局、广州数据交易所三方共建,作为全国首个由司法主导、行政指导、平台支撑的专业化涉数据纠纷调解平台,围绕数据权属确认、流通交易争议、个人信息保护、公共数据授权运营等关键场景深度协作。

这就好比给数据交易装上了“安全气囊”和“仲裁庭”。遇到权属不清、交易摩擦,不用直接对簿公堂,可以先来这里调解,走“专业调解+司法确认+诉调衔接”的全链条解纷模式。下一步还将通过共享专家智库、共建调解员队伍、共筑裁判规则,推动数据领域司法实践与行业治理双向贯通,做到让数据“敢流通、能流通、纠纷有人管”。

催化剂:发“激励券”,让数据流通“有利可图”

除了解决“怕”的问题,广州还要解决“愿”的问题。活动现场发布了城市可信数据空间激励机制。这不仅仅是一纸文件,更是一套精心设计的“运营方案”。

其核心逻辑是“让利赋能”,围绕三个层级展开。

平台引流(零门槛):空间为所有数据产品提供免费渠道,市场主体可零成本获取流量。如果是成熟的自研产品,空间甚至不参与分润,还通过主页推荐、视频宣传、路演帮你推广。

收益分成(高比例):在参与运营服务的情况下,收益以专区运营方为大头,且运营分润比例随交易规模提升。

年终激励(强刺激):年底将从运营收益中提取一定比例,对年度最强“小生态”、年度“招牌”应用场景、年度“爆款”产品等予以额外奖励。

“城市可信数据空间本质上是一个经济生态系统,必须以规则和激励为内核,真正驱动其实现经济自循环。”广州市政务和数据局负责人表示。这套机制旨在打破“数据孤岛”,构建一个“平台引流—专区壮大—生态繁荣”的经济自循环,让市场主体不仅“敢共享”,而且“想共享、抢着共享”。

所有的布局,最终都要服务于现实。

2026年是“数据要素价值释放年”,随着“数据要素×”的不断推进,数据正加快释放出千姿百态的乘数效应,“数据飞轮”加速旋转,带动数据产业乘势起飞。

作为国内首个获批教研类垂类大模型的人工智能大模型企业,广州云蝶科技股份有限公司副总裁罗崇键表示,基于广州深厚的数据根基、持续沉淀的海量行业数据,该公司聚焦真实应用场景与核心数据资源,深耕教育、医疗、工业各大垂直行业,打造贴合行业需求的高质量数据集。真正实现优质数据和AI应用能力的良性循环,强化数据飞轮效应释放。

在广州,数据正在让城市治理变得更聪明;蘑菇物联等工业企业正在用数据让生产线变得更节能;左木莲安等出海企业正在用数据让供应链变得更安全;里工实业、中建普联等制造企业正在用数据驱动具身智能与建材供应链升级。数据,不再是冰冷的数字,而是变成了看得见、摸得着的生产力。

从“数据大市”迈向“数据强市”,广州的路径愈发清晰:一手抓供给,一手抓制度;一手建平台,一手拓场景。这场关于数据的改革,正在为广州这座老城市的新活力,写下最生动的注脚。

关注我们