行业标准再升级!2025金融大模型评测体系在沪正式发布

2025年12月29日 16:58   21世纪经济报道 21财经APP   余纪昕

21世纪经济报道记者 余纪昕 上海报道

12月26日,“2025金融大模型评测体系暨金融评测基准”在上海市委金融办、上海市委网信办、上海市经信委及上海徐汇区人民政府指导、由上海人工智能实验室与上海库帕思科技有限公司联合主办的发布会上正式落地。

记者现场了解到,当下,金融大模型仍存在着实时性与动态适应性不足、偏见和公平性、数据安全与隐私、领域知识深度不足及透明度和可解释性薄弱等相对局限性。

针对以上痛点,该项最新评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据,坚持科学与鲁棒的评测过程,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化,为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估,助力机构选型、优化及风险把控。

 该体系在标准引领、数据驱动、安全可信与生态共建四大维度实现全面升级,首次构建覆盖金融全场景的评测基线,为行业提供统一、权威、可操作的技术评估框架,标志着“人工智能+金融”进入高质量发展的新阶段。

该场发布会上,上海市委金融办副主任、一级巡视员葛平指出,人工智能正在深刻重塑金融行业发展格局,大模型技术在应用场景深化、‌关键要素强化‌和应用生态协同推进三方面加速赋能‌。

他强调,去年由库帕思、上海人工智能实验室等机构发布的全国首个“以金融业务为中心”的金融大模型评测体系,为行业提供了科学选型与能力对标的重要“标尺”。今年评测体系的全面升级,将助力上海建设具有全球影响力的金融科技中心。

有业内人士表示,本次发布会不仅是金融大模型评测体系技术成果的集中展示,更是上海深化“模塑申城”工程在金融领域落地的关键一环。随着评测体系的广泛应用,金融行业未来将有望迎来更高质量、更可信赖的智能化转型新阶段。

关注我们