微众银行杨强:针对中小微企业信贷评审数据稀缺等问题,联邦学习机制可提升模型的有效性
21世纪经济报道记者 胡天姣 深圳报道 近年来,微众微企问题联邦学习(Federated Learning)与安全多方计算、银行杨强业信有效区块链、针对中可信执行环境(TEE)成为隐私计算的贷评技术路径。
金融是审数升模联邦学习主要探索应用领域。联邦学习提供金融风控、据稀机制金融营销、联邦评分卡等业务场景的学习型的性多方数据源联合建模服务。随着行业应用的可提深化,可用性、微众微企问题效率等多维度被纳入整体技术框架,银行杨强业信有效“可信联邦学习”新范式应运而生。针对中
“需要在‘安全与效率’权衡中推演出一个恒定定律。贷评”微众银行首席人工智能官杨强在近日采访中对记者表示,审数升模根据论文《联邦学习中隐私与模型性能没有免费午餐定理》,据稀机制通过隐私与模型性能的“No-free-lunch”安全-收益恒定定律,可实现可信联邦学习中安全、效用、效率三者的协调。
杨强认为,“法律法规与技术有机且无缝的结合”是未来金融行业需要注意的关键。此外,如何设计巧妙的算法,使联邦学习能够应付可能的安全隐患是未来大规模运用至金融场景的重要挑战。
数据“安全-效用-效率”权衡间的保护机制
中国与美国正在引领全球联邦学习发展。据统计,在联邦学习领域,全球高被引论文领先的机构依次是谷歌、卡内基·梅隆大学、北京邮电大学及微众银行。
联邦学习是一种分布式机器学习技术,以实现“数据可用不可见”、“数据不动模型动”的应用新范式。
杨强表示,根据设定的四个维度(威胁的源头、威胁性质、隐私窥探的有意/无意及保护措施的严格程度),微众银行现正与各机构合作,推动基于“No-free-lunch”定律的新标准建设。
作为一种新范式,“可信联邦学习”增强了传统的联邦学习,使得在保证原始数据的隐私安全和模型的可证安全外,还保证学习过程的高效率和模型的可用性,模型决策机制的可解释性,模型的可溯源和审计监管。
“需要设计一种保护机制,在‘安全与效率’权衡中推演出一个恒定定律。”杨强指出,根据《联邦学习中隐私与模型性能没有免费午餐定理》,通过隐私与模型性能的“No-free-lunch”安全-收益恒定定律,可实现可信联邦学习的安全、效用、效率三者的协调,在保证数据隐私保护的同时,也最大化模型效用和学习效率。
“在中小微企业信贷场景中,针对中小微企业信贷评审数据稀缺、不全面、历史信息沉淀不足等问题。”杨强说,通过联邦学习机制,可在确保数据提供方数据安全以及隐私保护的情况下,为银行融汇企业经营数据、税务数据等多源信息,丰富建模特征体系,共同提升模型的有效性。
此外,通过将风险前置,从风险源头切入,隐私计算还可帮助金融机构过滤信贷黑名单客户。
杨强表示,所有金融场景的应用均有其共性(如风控、销售、服务),也有其特殊性(如偏重线上或线下,营销还是反欺诈),对此,可以设计不同的联邦学习引擎,最大化安全与效率的平衡。
巧妙打造“数据安全锁”
央行《金融科技发展规划(2022-2025年)》明确提出,加强金融科技伦理建设,深化数字技术金融应用,健全安全与效率并重的科技成果应用体制机制。
《金融领域科技伦理指引》也要求,金融机构充分获取用户授权,以最小必要原则采集数据,使用数据秉持“专事专用”原则,严格采取防护措施,依法合规共享数据。
杨强称,越来越多的金融行业在迈向数字化与智能化,二者联合起来可被称为“数智化”。数智化的一个重要驱动因素为数据要素流通是,即数据由一个地点流至另一个地点,这由此构成了金融业另一个发展特征:数据的可交易化。
在“流动”中才能更好地发掘应用数据的价值。杨强表示,在数据交易所内,所有数据均会被定价,且受到知识产权等认证。
“上述特点构成了未来金融生态的重要特征。他强调,通过提升数据的安全与可交易性,联邦学习将持续对金融业态的发展发挥关键作用。
针对目前联邦学习中同态加密、差分隐私等隐私保护方法可能带来计算和通信开销大、模型性能大幅下降的弊端,论文《FedCG: 联邦条件对抗生成网络》提出在横向联邦学习中将生成对抗网络与分割学习相结合,有效保护了参与方的数据隐私,同时保障了各参与方模型性能的竞争力。该论文提出了名为FedIPR的首个联邦学习模型版权验证框架。
“如何使技术与法律法规有机未来”是未来金融行业需要注意的关键。杨强指出,现有的数据安全法与相关规制一部分得以经由技术实现,另一部分却需要来自法律、法规的保障。“二者的有机、无缝结合是微众银行目前正在进行的尝试。”他补充,以增强整体决策过程的可解释性与透明度,同时更具可监管、可问询及可追踪性。
联邦学习也可被视为促使AI更有效落地的一项技术。“它是AI发展的下一站,也同样是大数据发展的下一站。”杨强说,其安全可信的数据保护措施下连接数据孤岛的模式,将不断推动全球AI技术的创新与飞跃。随着联邦学习在更大范围和更多行业场景中的渗透及应用,促进企业级数据合作。
他称,No-Free-lunch是一个亟待突破的瓶颈。数年前,计算机行业有过如多方安全计算等类似探索,但此类探索所产生的数据“安全锁”很难被打开,难以激发大规模的数据运用。“设计出巧妙算法,使联邦学习能应对可能的安全隐患是其未来大规模运用至金融场景的关键。”
(作者:胡天姣)
(责任编辑:焦点)
-
欢迎关注“新浪科技”的微信订阅号:techsina 文/荆玉来源:巨潮WAVEID:WAVE-BIZ)历经多年坎坷起伏,跨境电商这块万亿蛋糕,再次吸引了国内互联网巨头们的目光。10月17日,一款叫做T ...[详细]
-
2022年11月23日,上海市人大常委会第四十六次会议表决通过了《上海市浦东新区促进无驾驶人智能网联汽车创新应用规定》下称《规定》),这是上海市人大常委会根据全国人大常委会授权制定的第14部浦东新区法 ...[详细]
-
《推动提高上市公司质量三年行动方案(2022-2025)》印发 主要包括八方面重要举措
中证网讯记者 昝秀丽)中国证券报记者11月23日从接近监管部门人士处获悉,《推动提高上市公司质量三年行动方案2022-2025)》已印发,在八个方面提出具体措施。 具体包括:优化制度规则体系,提升监管 ...[详细]
-
在经历了两个月的动荡之后,英国养老基金正在评估其投资组合,并正考虑减持一些在危机最严重时期无法出售的私人股本和房地产资产。据了解,由于英国利率飙升导致衍生品损失,养老基金总计出售了数十亿英镑的股票和债 ...[详细]
-
新华社快讯:美元指数30日下跌,截至纽约汇市尾盘,衡量美元对六种主要货币的美元指数下跌0.06%至108.7730。 ...[详细]
-
截至11月19日当周,美国初请失业金人数为24万,为2022年8月13日当周以来最大增幅,预期为22.5万人,前值为22.3万人。至11月12日当周续请失业金人数为155.1万人,预期151.7万人, ...[详细]
-
小米Q3仍未回到正常增长轨道,王翔:高端战略速胜的想法是不正确的
11月23日,小米集团披露2022年第三季度业绩公告。财报显示,第三季度小米总收入达人民币705亿元,同比下降9.7%;经调整净利润人民币21亿元,同比减少59.1%,其中包含智能电动汽车等创新业务费 ...[详细]
-
转自:上海证券报上证报中国证券网讯记者 严曦梦 宋薇萍)上海市经济信息化委总工程师张宏韬11月23日在上海市政府新闻发布会上表示,依托“3+6”新型产业体系,上海已经具备发展未来产业的扎实基础,在未来 ...[详细]
-
SE《前线任务 1》重制版将登陆任天堂 Switch 平台,支持中文
IT之家 11 月 21 日消息,《前线任务》是 Squaresoft现 SQUARE ENIX)于 1995 年 2 月在 SFC 平台上推出的战略模拟游戏,以 2090 年的未来世界为背景,描写由 ...[详细]
-
币圈雷曼危机“连环爆”:FTX暴雷后,焦点转向“最大比特币基金”
来源:华尔街见闻外界担心,全球最大比特币基金——灰度比特币信托GBTC,或成为币圈雷曼危机“连环爆”的最新一环。在数字资产经纪商Genesis Global Trading宣布受FTX迅速崩溃影响,暂 ...[详细]