【期刊信息】

Message

刊名:计算机光盘软件与应用
主办:中国大恒公司大恒电子出版社
主管:中国科学院
ISSN:1007-9599
CN:11-3907/TP
语言:中文
周期:半月
影响因子:0
期刊分类:计算机软件及计算机应用

现在的位置:主页 > 综合新闻 >

星云Clustar副总裁许振:隐私计算构建AI基础设施(2)

来源:计算机光盘软件与应用 【在线投稿】 栏目:综合新闻 时间:2021-06-29

作者:网站采编

关键词:

【摘要】以前做法很简单。比如互联网机构和银行做联合建模,利用消费行为评估信用等级,互联网公司就把数据拷到数据中心,这会导致数据的泄露,这是一种踏

以前做法很简单。比如互联网机构和银行做联合建模,利用消费行为评估信用等级,互联网公司就把数据拷到数据中心,这会导致数据的泄露,这是一种踏过红线的、打擦边球的做法。

第二种是数据脱敏,把关键字符,比如身份证号、手机号、家庭住址等等,做一些分析,然后再去做机器学习的模型,去探寻规律,这种方法的最后结果是不保真的。

而隐私计算是一种数据不用出本地的解决方案。比如两个机构可以通过联合建模的方法,在数据保持在本地的前提下,建出一个模型来为需求方做服务。这就衍生了一个非常好的商业优势,就是它保护了数据的所有权,使数据的所有权和使用权相分离。

以前如果要做一个数据的模型,我们需要把数据拷出去,而随着数据拷贝,这个数据的所有权也就丧失了。隐私计算是数据不出域的,也就是说你可以使用数据,但见不到数据,所以它保证了数据的所有权和使用权的隔离,这使得我们可以去激发整个市场数据。

我们国家一直强调要让数据成为生产要素。既然是生产要素,就是商品,就要定价流通,所以隐私计算的衍生品就是让数据可以变成商品,成为可流通的、有价值、可定价的东西。所以这是隐私计算的副产品,也是它未来可能对这个行业带来的最大的创新源泉。

说到隐私计算,内部还有细分,有三大门派。“华山派”就是指的比较早的可信计算、安全屋,比较流行的像英特尔和阿里蚂蚁的TEE,这种技术可以保证安全可信的计算环境;第二个叫“少林派”,指的是多方安全计算,它的做法就是用秘密分享,不经意传输,混淆电路等算法,保证你的数据既能使用又安全;第三个“武当派”,就是联邦学习,联邦学习是最近比较火的话题,就是在多个分布式的节点,使数据能够进行交互,最后不仅能训练出一个模型来,还能保证数据的隐私和安全性。从三个不同技术的对比可以看出来,联邦学习是最能保证数据的隐私,又能保证效果的一个方法。

现在的隐私计算在金融行业还是非常火爆的。第一,金融行业对外部数据的依赖程度很大,因为金融行业本身就比较闭塞,能够收集到的客户数据非常少,风险控制对于银行来讲是一个非常重要的部门,它要提高风险控制能力,降低坏账率,提高业务水平,所以隐私计算在金融行业是非常重要的。

其次,在一些其他的消费者隐私数据比较敏感的地方,比如医疗、政府等等大数据领域,甚至后边可以扩散到小微企业、产业链金融、还有工业,对个人数据价值的保护,还有数据资产的界定,隐私计算都是非常好的一种解决方案。现在我们正处于一个技术的启动期,大概在2019年的时候,各种技术已经基本成熟了,2020年有些产业开始做一些试点和试用(POC),还有一些点到点的打通。而到了2021年,这个产业就逐渐开始爆发。

举几个例子,隐私计算在金融的几个细分领域应用范围也是比较广的,主要是反洗钱、联合定价、联合信贷风控,还有客户价值的营销筛选模型,在这些领域中隐私计算都已经有落地案例了。

隐私计算的口号就是打破数据孤岛。

数据孤岛分为内部孤岛和外部孤岛。一个大型的集团,比如像长安这种汽车集团,它下面有很多分公司,比如有保险公司、金融公司、汽车公司、车联网公司,这些公司有各种各样的数据,如果长安集团想做数据打通,它是不能把数据拷在一起的,如果拷在一起就违反了《数据安全法》,就出域了。

另外一个,机构和机构之间的数据打通,比如要反洗钱,上海某个银行要和银联进行数据打通,银联的数据不能出来,银行的数据也不能出去,这种情况下就需要机构和机构之间的数据打通。

除了金融行业,还有其他行业,比如样本数据的共享,我们知道CV样本是很难获取的,因为有时候我们去检测缺陷,缺陷并不容易出现,一旦出现,我们即便是标注好了,它的数据样本依然是不够的,所以如果我们大量的人都参与这个行业,去标注自己的样本,样本又能共享,变成一个样本池。同时,这个样本又只属于我自己,你用我的样本,但不会拥有这个样本,这时候又生成了一个产业,对于CV数据的共享,隐私计算也能发挥非常大的作用。

这是金融行业几个比较典型的案例,包括增强风控能力,合规,还有小微企业的贷款几个方面。举个小例子,现在我们都讲供应链金融,想给小微企业贷款,很难,特别是它的信用贷,它没有办法证明自己的还款能力。什么能证明?发票,税务局有它的开票记录,有它的一切经营记录,这些经营记录可以作为它信贷风控的依据。但是这些数据在哪里,可能是在阿里,它可能是阿里上的小微企业,有它的交易流水记录,也可能在税务局,这个数据就在三个方面。用联邦学习的技术,进行数据打通,增加小微企业画像的完整度,银行就可以给小微企业做一个非常客观的信用评分,再给它一个授信额度,小微企业就得到了企业资金的满足。


文章来源:《计算机光盘软件与应用》 网址: http://www.jsjgprjyyy.cn/zonghexinwen/2021/0629/1449.html


上一篇:中考物理解析:难度适中考实验,计算大题挺费
下一篇:如何将电脑上文件刻录到光盘