拒绝“裸奔”!隐私计算,如何保护你的个人信息?

2021年11月02日 19:37   21智库   研究员/黄婉仪,王婷婷
互联网“裸奔”时代或终结。

11月1日,“双11”购物狂欢节的第一天。

“熬夜剁手”到凌晨的你,早上终于平复心情开始一天的工作,结果发现自己的电脑频频收到昨晚搜索却没有下定决心购买的物品。

这让你很是感叹:明明自己是在另一家平台上搜的这些商品,其它平台竟能如此准确迅速的知晓了你的需求。

大数据时代,相信很多人都有过上述类似的经历。

这背后,是每个人或被动或主动,不断留下的“数据足迹”。而一旦相关企业没有做好数据防护或者存在过度使用数据的行为,那么个人信息就会被无声使用。

事实上,近年来,已就有不少互联网平台因数据安全和隐私泄露问题频频上话题热搜。10月中旬以来,互联网券商富途控股、老虎证券就在用户信息安全和跨境数据传输方面引发合规风险争议,争议发酵至今已另股价分别跌去36%、38%。

针对此,11月1日,《个人信息保护法》正式实施。这是国内首部个人信息保护方面的专门法律,其对个人信息处理规则、个人信息跨境传输、个人信息处理活动的权利、信息处理者的义务、监管部门职责以及罚则等作出了全面的规定。

另一边,数字经济却在成为促进中国经济发展的关键力量

11月1日,在国务院新闻办公室举行的国务院政策例行吹风会上,国家知识产权局局长申长雨介绍,近年来,我国数字经济蓬勃发展,有关白皮书显示,2020年规模已经达到了39.2万亿元,占GDP比重达38.6%。

如此,在大力推进数字经济建设的背景下,我们究竟该如何平衡隐私安全监管和数据产业发展之间的关系?在这个问题上,隐私计算正被政策界、产业界、投资界寄予厚望。

什么是隐私计算?它会怎样影响着我们的生活?这个新兴的产业又在发生着哪些故事?本文试图从法律和产业的角度,带你全面了解隐私计算发展历程。

一、政策篇

1、因监管而生

自疫情以来,全球数字经济迎来爆发式增长机遇。同时,各国政府对隐私和数据安全问题越来越重视。

2021年我国两部重磅的数据安全和个人信息基础性法律接连落地。9月1日起实施的《数据安全法》,对我国境内数据收集、存储、使用、加工、传输、提供、公开等数据处理活动作出了基础性法律依据。11月1日起实施的《个人信息保护法》明确不得非法收集、使用、加工、传输他人个人信息,个人信息权益受到法律保护,企业等组织对个人信息的处理需要合法合规。

立法落地,是对层出不穷的数据隐患的最有力回击。事实上,近年来不少互联网平台因数据安全和隐私泄露问题频频上话题热搜。打车软件滴滴出行APP被网信办通报存在严重违法违规收集使用个人信息问题,至今依旧被各大应用商店下架。随后,国家组织开展对关键信息基础设施采购网络产品和服务活动的网络安全审查,进一步防范采购活动、数据处理活动以及国外上市可能带来的国家安全风险,对滴滴、运满满、货车帮、BOSS直聘等有美股上市实体的平台启动网络安全审查。此外,10月中旬以来互联网券商富途控股、老虎证券在用户信息安全和跨境数据传输方面引发合规风险争议,争议发酵至今已另股价分别跌去36%、38%。

海外也同样存在监管部门集中对隐私数据安全问题调查的情况,其中欧盟对美国互联网科技巨头频频出手。

根据7月30日亚马逊向美国证监会提交的公告,因违反欧盟数据保护法《通用数据保护条例》(GDPR),亚马逊被处以7.46亿欧元(合约57.29亿元人民币),这是欧盟有史以来针对数据隐私泄露开出的最高罚单。根据GDPR的规定,欧盟监管机构可以对违规企业处以年全球销售额4%的最高罚款。面对指控,亚马逊坚持自己“没有数据泄露,也没有客户数据被暴露给任何第三方”。

另一家美国互联网巨头脸书在欧洲也遭遇不幸。9月3日旗下即时聊天软件WhatsApp同样因违反欧盟数据保护法GDPR,被爱尔兰数据保护监管机构处以2.25亿欧元(合约6.66亿元人民币)罚款。

在隐私监管方面遭遇滑铁卢,互联网巨头们不仅开始落实更为严格的用户隐私保护政策,也在数据技术前沿领域开疆拓土。

据脸书产品营销副总裁Graham Mudd在8月11日发表的博客文章中透露,去年脸书开始测试一项名为Private Lift Measurement的解决方案,该方案使用了一种叫作“安全多方计算的隐私增强技术”,这项技术在帮助广告商了解广告投放活动信息的同时,还增加了额外的隐私层用来限制广告商或脸书可以了解的信息。

Graham Mudd表示,随着苹果和谷歌继续对浏览器和操作系统进行更新以及隐私监管环境的变化,数字广告必须发展以减少对个人第三方数据的依赖。“这就是为什么我们一直在投资多年的努力来建立一个隐私增强技术的投资组合,并在这些和其他支持下一个时代的标准上与业界合作。”

谷歌也在紧锣密鼓布局隐私计算技术。9月9日,谷歌副总裁Suzanne Frey向用户宣布,在安卓12测试版中推出一项“隐私计算服务”,不仅能够保证用户设备信息的私密性,还可让设备在调用云端功能的时候不用付出隐私方面的代价。

也就是说,“隐私增强”,即“隐私计算”,既能继续支持企业的数据处理活动,又能满足用户隐私保护需求,可以在数据价值和隐私合规之间求得“双赢”

中国信息通信研究院安全研究所发布的《隐私保护计算与合规应用研究报告(2021年)》指出,诸多现实场景中,只有足够的数据量、丰富的特征维度才能得到真正有意义的结果,往往需要多个实体机构共同提供数据。传统的、集中式的数据使用方式存在数据安全、法律合规等诸多风险。隐私保护计算从技术上,实现原始数据不出库,数据“价值”和“知识”流通的目标,促进跨领域多维度数据的融合,构建“数据可用不可见”的合作新模式。

2、迎政策红利

“隐私计算”是实现数据“可用不可见”的重要技术,在处理和计算的过程中能保持数据不透明、不泄露、无法被计算方以及其他非授权方获取。“隐私计算”是一套人工智能、密码学、区块链等的技术整合,包括联邦学习、安全多方计算、机密计算、差分隐私、同态加密等技术。

2020年,《麻省理工商业评论》将“隐私计算”评为全球十大突破性技术之一,足以说明这项技术的颠覆性。据IT咨询与研究机构Gartner分析,受限于分析能力、隐私安全性等原因,大约有97%的数据尚未被利用起来;到2025年,将有一半的大型企业机构使用隐私计算在不受信任的环境和多方数据分析用例中处理数据。

受数据产业发展和隐私安全合规的双重驱动,隐私计算行业迎来增长机遇和政策红利。

2016年12月,工信部发布《大数据产业发展规划(2016-2020年)》提出,要支持企业加强多方安全计算等数据流通的关键技术攻关和测试验证。

2019年9月,中国人民银行发布《金融科技(FinTech)发展规划(2019-2021年)》提到,利用包括多方安全计算在内的技术提升金融服务安全性。

同年同月,工信部发布《工业大数据发展指导意见(征求意见稿)》提到,在工业领域积极推广隐私计算技术以促进工业数据安全流通。

2020年12月18日,中国信息通信研究院与50多家企业共同发起成立了“隐私计算联盟”,以进一步推动隐私计算生态建设及行业应用。

今年以来,关于隐私计算的相关利好支持在多份文件中持续不断出现。5月26日,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,提出“试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境,提高数据流通效率。”

6月29日,中国支付清算协会发表《多方安全计算金融应用评估规范》,是金融领域第一个针对多方安全计算技术对进行详细定义和规范的文件,也是隐私计算技术落地的重要政策。

7月12日,工信部发布《网络安全产业高质量发展三年行动计划(2021-2023)(征求意见稿)》,提出针对数据安全共享需求,大力推进安全多方计算、联邦学习、可信计算等技术的研究攻关和部署应用,促进数据要素安全有序流动。

9月,国内首个以“隐私计算”命名的城市级政策文件新鲜出炉,珠海市发布《关于加强隐私计算在城市数字化转型中应用的指导意见》。《意见》明确提出,珠海要培育一批基于隐私计算的数据应用场景,在保护各参与方数据隐私的前提下,完成多方参与的联合计算任务,促进多方数据可信协同,打破数据孤岛,释放数据价值。

显然,“隐私计算”在发挥数据价值和安全流通上正在被政策寄予厚望。

3、为合规赋能

隐私计算技术研发进展和商用落地,离不开数据安全和隐私保护的合规驱动。那么,隐私计算技术在帮助企业应对法律合规挑战方面究竟能起到什么作用?

根据《数据安全法》规定,数据处理包括数据的收集、存储、使用、加工、传输、提供、公开等。开展数据处理活动,应当遵守法律、法规,尊重社会公德和伦理,遵守商业道德和职业道德,诚实守信,履行数据安全保护义务,承担社会责任,不得危害国家安全、公共利益,不得损害个人、组织的合法权益。

《个人信息保护法》也规定,个人信息的处理包括个人信息的收集、存储、使用、加工、传输、提供、公开、删除等。个人信息处理者应当对其个人信息处理活动负责,并采取必要措施保障所处理的个人信息的安全。

对照上述法律相关规定,可以看出隐私计算技术在数据、个人信息的使用、加工、传输等环节能够解决数据共享和流动的合规问题。随着人工智能、云计算等技术产业的商用落地,金融、医疗、工业、政务、交通各类应用场景对海量数据的需求越来越多,技术只有结合精准、可靠的用户数据,才能创造出更智能的商用产品,而隐私计算技术恰恰能为这些应用场景的落地解决数据共享和利用的合规问题。

然而,“隐私计算”并非企业解决数据处理活动所有合规问题的万能钥匙。需要注意的是,企业在使用隐私计算技术实现数据“可用不可见”的前提是数据被允许“可用”,也就是征得个人信息主体的的授权同意。事实上,《个人信息保护法》明确规定,个人被赋予对其个人信息的处理享有知情权、决定权,有权限制或者拒绝他人对其个人信息进行处理。

《腾讯隐私计算白皮书2021》指出,由于隐私计算技术正处于快速迭代和发展的阶段,目前仍在实现用户授权同意、数据存储安全、信息主体权利保 障等关键合规要求的有效性上存在争议,这些争议在一定程度上限制了隐私计算的推广应用。

具体而言,一是采用隐私计算,仍需明确用户授权同意机制;二是隐私计算应用过程中也需重视数据安全风险;三是隐私计算应用过程中个人信息主体权利请求的实现仍需进一步探索。

因此,企业面对数据合规的监管压力,在大力研发“隐私计算”技术解决方案的同时,还应当加强学习《个人信息保护法》《数据安全法》等法律知识,从根本上参透数据安全和隐私保护合规的立法逻辑。

二、产业篇

从产业的角度来看,隐私计算总体尚处于起步阶段, 但经过近几年的发展,目前在数据协作需求量大的行业已经率先商用落地,以金融、医疗、政务等应用场景为主,并有望随着行业纵深发展,拓展到更多行业领域。

1、应用场景

2021年9月,中国人民银行发布《征信业务管理办法》,《办法》以明确征信业务边界、加强信息主体权益保护为重点,主要内容针对信用信息的采集、整理、保存、加工、提供、信息安全的合规管理。

此前,央行有关负责人在回答记者有关《办法》的提问中指出,互联网平台开展助贷等相关业务符合征信业务定义的,适用本办法。

随着《征信业务管理办法》即将落地,助贷行业征信的“断直连”步伐加速。所谓“断直连”,是指平台机构在与金融机构开展引流、助贷、联合贷等业务合作中,不得将个人主动提交的信息、平台内产生的信息或从外部获取的信息以申请信息、身份信息、基础信息、个人画像评分信息等名义直接向金融机构提供,在个人信息与金融机构之间实现“断直连”。

而当前互联网助贷业务涉及大量用户信息和借贷信息的采集,但这些信息数据的采集普遍直连金融机构,未通过征信机构传输。在金融领域个人信息的“断直连”要求,一方面需要助贷平台调整业务模式,加强和征信机构的合作;另一方面,面对个人信息“断直连”,金融行业还可通过“隐私计算”技术研发满足业务合规要求。“隐私计算”技术能够在个人信息不出平台或金融机构的情况下,依旧实现对用户画像的精准捕捉和风控把握。

个人信息的“断直连”要求是隐私计算技术能够赋能金融领域的典型例子。金融行业的发展需要依赖大量用户数据的采集和分析,但同时也面临着隐私合规方面的强监管,正是由于这种数据需求和合规的双重复杂性,金融行业较早成为隐私计算应用落地的场景之一。金融行业里的隐私计算使用,在信贷风控、反金融欺诈、保险定价等细分领域均有不俗的前景。

除了金融领域,医疗、政务、电信等重点行业,对“隐私计算”技术也有充分的落地需求

以医疗行业为例,通常情况下,医疗数据存储在不同医疗机构。出于对患者隐私保护的考虑,这些医疗数据无法在各个医疗机构之间直接共享流通。基于这样的现实情况,引入隐私计算技术解决方案,可以在不共享医疗数据的情况下,实现医疗机构对医疗数据的分析计算,推动医疗研发工作。

《腾讯隐私计算白皮书2021》指出,目前虽然隐私计算的场景主要聚焦金融、医疗等领域,但随着其产品化、商业化的进程的加速,以及用户对隐私计算的接受度的提高,隐私计算也正往交通、教育、工业等领域延伸,并且将形成跨机构、跨企业、跨行业的多类应用场景,有望在更多行业进行拓展应用。

2、企业入场

根据IT咨询与研究机构Gartner预测,到2024年,全球隐私驱动的数据保护和合规技术支出将突破150亿美元。毕马威的预测数据则表示,国内隐私计算市场规模在三年后技术服务营收有望触达100-200亿人民币的空间,甚至撬动千亿级的数据平台运营收入空间。

顺应越来越多行业面临数据采集的合规监管以及数据分析计算的业务需求,不少行业头部企业陆续布局“隐私计算”技术和产品,一批数据垂直企业和创业公司也涌入隐私计算赛道

目前,招商银行、微众银行、蚂蚁集团等金融机构、腾讯、百度、京东等互联网企业均已布局隐私计算产品,数据垂直企业和创业公司的代表则有华控清交、同盾科技、富数科技、光之树等。上市企业也主动在近期的公告披露中透露对隐私计算的布局。安恒信息在2021年半年报中提到,今年公司发布AiLand数据安全岛平台,是在隐私计算领域推出的前瞻性产品。

此外,2020年12月18日,中国信息通信研究院与50多家企业共同发起成立了“隐私计算联盟”,以进一步推动生态建设及行业应用。

随着越来越多市场参与者入局,隐私计算商用落地也在向更高的技术规范和安全性能迈进。日前,中国金融认证中心CFCA公布首批多方安全计算金融应用产品测评通过名单,百度点石联邦学习平台、京东万象+隐私计算开放平台、矩阵元隐私计算服务系统、腾讯云安全隐私计算、云从科技隐私计算平台5个企业产品通过测评,同行竞争加剧。

2021年4月,毕马威与微众银行联合发布的《深潜数据蓝海——2021隐私计算行业研究报告》分析指出国内的隐私计算玩家各有差异:“各家的资源生态、技术路线和行业布局均有不同,由此产生了不同的战略大法。互联网大厂体系玩家的主要优势是丰富的数据生态和应用组件;产业背景公司的主要优势是垂直行业的专注积淀和应用能力;创业公司的主要优势是中立性和贴近客户的服务能力。”

报告指出,一个典型的隐私计算业务场景包含三类参与方使用数据的业务方,如金融机构、政府机构等要应用数据服务于自身业务,是隐私计算服务的客户;作为数据源的数据方,如各地的大数据局、征信公司、拥有用户数据的互联网公司等,原始数据不出本地,将经过处理后的秘密信息发到中间方服务器上计算;隐私计算技术服务商,为客户搭建整个计算系统,提供计算服务。

在隐私计算落地的众多遐想中,其与区块链技术的结合受到强烈关注。区块链技术对数据存储具有去中心后、可追溯、不可篡改的特性,而隐私计算实现的是对数据“可用不可见”的计算分析。因此,隐私计算技术在加密状态下对数据进行计算分析提取数据价值,区块链技术又为数据价值的转移提供基础。

目前,行业对隐私计算和区块链结合的普遍做法是采用“双系统架构”,这意味着企业需要采购、配置两套系统才能实现数据协作目标。在2021杭州云栖大会上,蚂蚁集团蚂蚁链技术总监闫莺提到,未来的行业协作中,数据隐私保护将成为底层需求,隐私计算应直接原生在区块链网络平台上。区块链与隐私计算的结合并不是一个简单的1+1组合问题,实现数据价值的转移需要面向数据全生命周期来思考。

3、商业布局

国盛证券在今年年初发布研究报告分析称,“市场低估了数据隐私计算的市场机会。市场对隐私计算这类新兴加密和算法技术认知不够充分。”

研报指出,早在2016-2017年,矩阵元、蚂蚁金服、微众银行等企业就将隐私计算作为重要方向,随着2018年欧盟GDPR的落地,数据隐私监管变得原来越严厉,关注隐私计算赛道的企业开始增加,时至今日,一级市场此类企业正快速出现,2020年正成为隐私计算元年。从投资角度看,目前隐私计算尚处于技术提升期,还未形成新的商业模式,但随着Gartner将其纳入2021年重点深挖的9项技术之一,隐私计算在二级市场风口日益临近

由于隐私计算行业刚刚兴起,其商业模式尚处于早期发展阶段的探索过程,目前大多数市场参与者以销售模式和服务模式为主。随着行业参与者数量渐增和商用落地逐步深入,隐私计算未来有望形成更多元化的商业模式。

隐私计算技术服务商对业务主要有4种基本营收方式:销售模式、服务模式、调用模式和分润模式。根据毕马威与微众银行联合发布的隐私计算行业报告的梳理,销售模式收取一次性技术系统搭建费,这是最经典的软件系统销售模式,每单从数十万到数百万不等,差异较大;服务模式收取年度系统维护和服务费用,因为隐私计算算法本身和应用场景中的模型更新较快,需要及时调整;调用模式收取数据使用费,这部分费用主要归属于数据方,收费标准根据数据种类和价值而定,按照数据调用次数收取;分润模式根据业务运行效果获取收益分成。

在4种营收方式中,分润模式因通过参与系统运营获得持续分成,成为被广泛看好的商业模式。上述报告分析称,对于早期起步的创业团队,销售系统和收取服务费固然是最快和最主要的营收模式,能快速获得经营性现金流。但是从长远看,由于开发和部署系统需要做不少定制化工作,系统销售所收取的费用是一次性、低毛利的,技术服务商不能从中获得稳定、较高的利润,就希望结合分润模式,从实际运营中获得长期可持续的收入。

此外,从业务模式角度分析,隐私计算开源框架更具有竞争力。开源技术能够让服务商的产品和服务渗透到行业技术工具的各个角落,成为头部企业的业务主流模式。根据不完全统计,目前已推出的隐私计算开源项目有谷歌的Asylo、脸书的CrypTen、腾讯的FATE。

随着越来越多支持隐私计算的利好政策落地,隐私计算在持续推进技术研发突破的同时,也需在商业模式方面进行创新,以获得投资者青睐。

三、互联网“裸奔”时代或终结

2020年,堪称是隐私计算元年。

这一新兴的技术赛道,正吸引不少企业的大力布局。有招商银行、微众银行、蚂蚁集团这样的金融机构,也有腾讯、百度、京东这样的互联网企业,还有一批专注于隐私计算业务的垂直领域创业公司。这背后是数据合规监管压力的使然,更是抢占先机的发展需求。

从投资角度看,目前隐私计算尚处于技术提升期,还未形成新的商业模式,但随着Gartner将其纳入2021年重点深挖的9项技术之一,隐私计算在二级市场风口日益临近。

而与普通人而言,未来随着隐私计算应用在多种业务场景中不断推广,自己的个人信息也会得到更有效的保护。

有媒体举了这样一个例子:因业务所需,A希望了解多位客户的工资总和(已获得个人同意且符合个人信息处理的其它合规要求)。如果使用传统方式,A需要直接采集他们的工资记录,然后求和。相比之下,“隐私计算”可以在不直接采集工资详细记录的情况下计算出工资总和,最后A所获得的输出结果就只有工资总和数值。

可见,隐私计算可以帮助我们极大地避免眼下这种骚扰、精准电话犹如“家常便饭”的尴尬。

当然隐私计算并不是万能的。目前其在实现用户授权同意、数据存储安全、信息主体权利保 障等关键合规要求的有效性上仍存在争议,但它却让我们看到了“互联网里不‘裸奔’的希望。

关注我们