隐私计算:守护数字经济走向春暖花开时

日期:2023-03-24

人工智能(AI)是数字经济时代的核心技术之一,ChatGPT的腾空出世再度掀起了AI的浪潮。

微信图片_20230327101711.jpg

数据、算力、算法是数字经济背景下驱动AI前进的三驾“马车”,海量的数据是AI训练的首要条件,其次才是算力和算法——“数据”是时代进步的产物,是每个个体都具备的重要资产。


2023年“十四大”会议中,国务院机构改革方案中“成立国家数据局”的提案获准,标志着我国在“数据基础制度建设”、“数据资源整合与共享”、“数据管理、开发与利用”上迈出了关键的一步。


国内数据安全意识觉醒晚于国外,直到2019年《数据安全管理办法》在数据的采集存储、处理使用、安全监管等方面提出要求,数据安全才正式引起社会各界的重视。


数据就像“发动机”,政策的支持提供了燃料,将快速推动数字经济发展,为GDP增长注入新力量。


数字经济下,实体企业不想被淘汰就得加速转型,把数据从线下搬到线上、让算力代替劳动力,如果人是实体企业的第一生产力,那么数字企业的第一生产力则是“数据”。


数据不能“只存不用”,不能“只为我用”,因此让数据“流”(流通)和“动”(应用)起来尤为关键,企业急需一项有力且可靠的技术来保护数据源以及“流动”中数据的安全,业内公认这项技术是——“隐私计算”。

(注:本文中“流动”的含义为“流通与应用”)



我国在“数据二十条”提出“以模型、核验等产品和服务等形式向社会提供数据,实现‘数据不出域,可用不可见’”,坐实了隐私计算是辅助数据“流动”必不可少的一项基本技术。


全球权威IT研究与咨询机构Gartner更是将隐私计算评为“十二大”技术趋势之一,据其测算,2024年全球近60%的大型企业将使用一种或多种隐私增强计算技术,同时,隐私驱动的数据保护与合规技术支出将在全球突破千亿元人民币。

微信图片_20230327102422.png

「你了解隐私计算吗?」


数据的出给方和使用方都在本地部署计算平台,对数据进行加密处理,双方平台进行交互,对数据进行计算、分析,直接输出结果。





微信图片_20230327102519.png

图片:隐私计算的规则


我们常用的Google输入法就是一个应用“隐私计算”的成功例子,虽然用户数据没有离开过用户设备,但Google仍然能训练输入法的算法模型,从而达到改善输入体验的目的。


为什么数据“流动”离不开隐私计算?

数据已无处不在,几年前我国便意识到这个问题,开始布局数据基础设施建设,资金和资源向数据存储领域倾斜,而今数据存储赛道趋向饱和,数字经济的发展推动着数据应用需求觉醒,“数据二十条”更是明确了隐私计算是保护数据“流动”的核心技术。


其实“重用”隐私计算早已有迹可循,在满足企业实现“数据域内留,价值跨业飞”的应用需求上已有不少成功案例:银行通过电力局提供的数据审批贷款;船舶公司通过气象局提供的数据规划航线;金融机构通过电信公司提供的数据进行风险管理;通过地下管线数据分析、建模建设智能电网、智能气网和智能供排水保障系统……

微信图片_20230327102629.png

图片:隐私计算的应用



零散数据的价值是有限的,因此必须先通过数据流通使数据量最大化,再通过数据应用使数据价值最大化。而隐私计算正是数据流通与应用的前提,其“开源化”和“平台化”的趋势奠定了它是数据领域的抓手。“开源化”可以让更多人了解和应用隐私计算,从而加速技术的普及与迭代。


下一阶段的隐私计算技术不仅要求能同时保护和应用数据,更要为数据挖掘与分析开辟新径,通过技术开源让技术底层更加透明、提高其可信度,有助于提高数据分析的公正性和准确性。“平台化”则是为了促进数据供求方之间的合作,打造一个互利共赢的数据流通管道,并在其中逐渐完善数据行业的监管机制、形成数据处理的技术标准,从而建立起数据互通互享的护城河。


是时候重视数据“流动”中的问题了!

过去三年的“防疫大战”中,为了能够及时跟踪个人健康状况、行动轨迹,我们都被“健康码”、“行程卡”贴上了专属标签,系统采集个人信息并将用户数据储存于服务器中,能获得访问权限的人“可见也可用”,形成了数据流出的一个缺口。


2022年8月疫情仍然紧张之际,曾有不法分子在暗网论坛上以4000美元出售上海4850万居民随申码数据库,包含了姓名、手机号、身份证号、UUID等隐私信息,这些交易的数据可能会成为下季度销售冠军的“致富秘籍”,也可能会成为诈骗团伙的作案工具。

微信图片_20230327102712.png

*图源网络


通过数据交易可以实现数据在供求双方间精准对接,从而更大程度地释放数据的价值,数据一旦“流动”起来,供求双方可以享受数据互通互享带来的红利:供应方可以通过交易数据产生收益、通过数据分享开拓创新;需求方通过分析数据提高效率、通过应用数据创造价值。而当下数据行业的现状是:小微企业积累数据难,采集时间长、范围窄、量不足;成熟企业的合规压力大、分享数据难,只好独善其身,久之便形成了数据垄断。


因为在流通环节中数据不像存储那般可控,数据交易如今还没有完美的解决方案。为了让数据在“阳光”下流通,自2015年4月14日全国第一家数据交易所贵阳数据交易所正式挂牌运营之日起,至今我国已成立超过80家全国性或地方性大数据交易平台。尽管数据交易所的成立为数据流通搭起了桥梁,但由于数据“流动”中还存在着数据泄漏的安全隐患,供求双方都还望而却步。


最新数据显示,全球每年因数据泄露带来的经济损失超百亿美元,泄漏的数据不仅关乎个人隐私、商业机密,甚至有可能突破国家政务安全的防线,带来广泛、持续、致命的影响。



隐私计算守护数字经济走向春暖花开时

发展数字经济大势已定,在驱动AI前进的三驾“马车”中,数据因一直没有找到各方共赢的商业模式,发展落后于算力和算法。


从医疗图像数据产生的过程来看,患者就医、设备员操作仪器、仪器产生图像、器械自动分析结果、医生记录诊断……每一步都是数据形成所不可或缺的,通常只能确定最终数据的“持有权”归医院所有,而数据的“所有权”却难以确认。


当太多人可以分“蛋糕”的时候,参与者反而失去了热情,干脆不碰数据这块“蛋糕”了,但数据还是有望后来居上的,“数据二十条”中将“所有权”一分为三:分为“持有权”(资源持有)、“使用权”(加工使用)和“经营权”(产品经营),并据此设计出激励数据市场参与者“做大蛋糕”的体系,吸引更多玩家愿意共建数据市场。


目前能充分创造价值的数据只有冰山一角,数据行业迟迟未能释放其巨大的能量,那我们还能做些什么?西南交通大学隐私计算实验室教授、清华大学隐私计算领域研究校友认为:

“第一,提升企业信息化程度,鼓励搭建数据底座,使数据资产化;

第二,挖掘数据需求,实现数据在产业链中有效对接上下游,跨行业协同创造效益;

第三,规范行业标准,对经处理输出的合格数据形成统一画像,进行安全验证、审计,形成合规性要求。”


其实,在隐私技术能有效聚合数据资源、保护数据安全、促进数据应用、释放数据价值上业内早已达成共识,伴随着对数据保护与应用要求的不断提高,我们逐渐发现隐私计算不仅是一项高端的数据分析计算技术,更应是所有数据模型的底层技术。成立国家数据局可以进一步规范数据安全标准与监管要求,让隐私计算真正成为一项有力且可靠的技术,在此背景下,企业方才更放心地分享数据,从而实现数据自由“流动”;更充分地使用数据,从而在商业上创造更大价值,助力数字经济走向繁荣。




「本文特别鸣谢:西南交通大学隐私计算实验室教授、清华大学校友(WWW论文《一种不损失精度的基于随机性扰动的联邦学习防御方法(An Accuracy-Lossless Perturbation Method for Defending Privacy Attacks in Federated Learning)》的作者)进行交流与指导。」


关于澳银| 新闻资讯| 经典案例| 投资诠释| 联系我们| 法律申明|

深圳市南山区深南大道9996号深圳李宁中心12楼 联系我们:0086-755-26428841

Copyright © 2012-2025 深圳澳银资本管理有限公司 版权所有

技术支持:网罗天下

备案号:粤ICP备2022094367号-1

微信公众号

微信扫描二维码,关注公众号