首页 > 专题  > 正文

郑方:电子银行的声纹识别技术时代已来临

2016-12-08 15:19
来源:中国电子银行网
作者:陈爱
字号:
核心提示: 郑方表示,生物特征分为两大类,第一类是生理特征,人脸、指纹、虹膜、视网膜、DNA等,这些特征的特点是相对稳定;第二类就是行为特征,其代表就是声纹。

  中国电子银行网讯 2016年12月8日,由中国金融认证中心(CFCA)举办的2016“科技+金融,启创银行未来”高峰论坛暨第十二届中国电子银行年会在北京举行。近四百位商业银行电子银行的负责人莅临此次年会,就区块链、金融大数据、银行机器人、移动金融、直销银行新业态等热点进行深入探讨与交流。《2016中国电子银行调查报告》和中国电子银行金榜奖同步对外公布。中国电子银行网全程直播此次盛会。

  清华大学语音和语言技术中心主任,北京得意音通技术有限责任公司董事长郑方博士出席并在此次论坛上发表主题演讲。郑方表示,生物特征分为两大类,第一类是生理特征,人脸、指纹、虹膜、视网膜、DNA等,这些特征的特点是相对稳定;第二类就是行为特征,其代表就是声纹。

清华大学语音和语言技术中心主任,北京得意音通技术有限责任公司董事长郑方博士
清华大学语音和语言技术中心主任,北京得意音通技术有限责任公司董事长郑方博士

  他指出生理特征具有稳定性,也具有相对的唯一性,这是其特点,因此识别率高,但是随之也就产生了一个问题,即一丢百丢,容易被模仿;而对于远程身份认证,声纹是最好的,没有之一。声音包含了辩证法的高度统一,声音看着很简单,但是它包含了丰富的信息量,比如语言的种类、口音、内容、性别、情感、身份,还有其他的信息。利用语音识别技术对内容进行识别和情感识别技术对情感进行识别,可以防止假冒,可以检测真实意图。

  以下为郑方在年会上的演讲实录:

  谢谢中国金融认证中心邀请我参加这个年会,各位领导、各位嘉宾大家上午好。我做的主题演讲主要是讲两个关键词,问题和解决方案。这个问题就是移动支付领域所面临的安全问题,解决方案就是声纹识别,尤其在手机银行领域。我今天用的词比较大,是时代。

  我重点介绍电子银行中的手机银行。2015年《中国电子银行调查报告》,给出了用户行为的分析:用户一旦开始使用手机银行后,逐渐形成首选使用手机银行的习惯,甚至只用手机银行的习惯,这就是金融业务移动化趋势。2015年《中国电子银行调查报告》还告诉我们用户数去年增长比例为81%,中国人民银行发布的《2015年支付体系运行总体情况》指出移动支付总金额增长比例是379.06%,这是非常剧烈的增长。从这个图上我们可以看出用户最喜欢的支付方式是手机银行,比第二喜欢的要高出一倍还多。我们发现还有一些不喜欢手机银行的,那么不喜欢的原因在哪呢?2015年《中国电子银行调查报告》也有一个数据,有63%的用户是因为感觉手机银行不安全所以不敢用。对于手机用户,一方面很多人喜欢用,一方面是由于感觉不安全所以很多人不敢用,这里的关键就是安全的“最后一厘米”。数据存储、传输等的安全,这个大家都熟悉,解决得也相对比较好;数据到人的最后一厘米,即人和手机之间的“人机一致性”的问题,还没有很好的解决方案,所以安全隐患非常大。你的手机丢了,被别人拿到,他就可以把你的几乎所有信息都获取到,包括账户信息、转款信息等,这是非常严重的问题。解决这个问题的主要方案是什么呢?我认为生物特征识别是一个非常重要而有效的手段,其实在座都是银行业的领导和专家,应该都有体会,有很多银行也都在进行研究,甚至有的银行已经开始使用,比如像人脸、指纹等等。我们把生物特征识别归为身份认证的第三代手段,前面两代是通过口令、密码等的(What You Know),以及通过U盾、IC卡等的(What You Have),第三代手段是通过验证“你是谁(Who You Are)”的。利用第三代认证手段,你不用带任何东西也不怕丢,这是非常好的。但是问题也来了,真的就不会丢吗?真的不会被窃取吗?大家是不是真的放心使用呢?可能并不像大家想象的那么好。

  生物特征分为两大类,现在人们通常所指的都是第一类,是生理特征,包括人脸、指纹、虹膜、视网膜、DNA等,这些特征的特点是相对稳定,一生都不怎么变,不变性和稳定性是其最主要的特征。大家说生物特征时往往都把第二类给忽略了,就是行为特征,行为特征的代表就是声纹。

  美国科学家已经有过预测。这是2012年《参考消息》上的报道,其中有一个预测说以后密码和口令都会消失,取而代之的就是生物特征,扩视网膜扫描、心跳和声音识别将会得到广泛的应用。生物特征是用来保证安全的,但是它真的就安全吗?如果保证安全的手段出现安全问题,你真的就不怕吗?所以,现在很多专家,包括公安部安全防范标准委员会人体生物特征识别应用分委员会,都在思考这个问题,就是:如果我的生物特征丢了怎么办?别人模仿我怎么办?如果这两个问题不解决你是不敢使用的。

  刚才讲生物特征的第一类是生理特征,具有相对稳定性,也具有唯一性,这是其特点,因此识别率会很高,但是它的问题也来了,就是“一丢百丢,容易模仿”,只要丢了就完了。比如说指纹,只要喝茶,别人可以拓出你的指纹,你也不能老戴手套吧?这就是一个问题。虹膜,2015年已经有人用高清照片可以把虹膜给攻击了,这是很严重的问题,类似用隐形眼镜,攻击者可以用最新的智能技术把虹膜信息、视网膜信息放上去,从而利用这个进入系统。指纹,这个已经被攻克,2014年在河南省高考代考事件就是找人用指膜混入考场,有一个人进场时被监考官发现了,才发现大批代考的,可见只要是远程没人监督情景下被模仿问题就很严重。还有就是人脸,这也很不安全,虽然现在使用一些检测活体的手段,如摇头、低头、眨眼睛、张嘴巴等,很容易计算机模拟,如斯坦福大学的Face2Face软件。人工智能技术的发展给人们带来方便,但是也会攻击带来新的手段。可见现在一些安全手段存在安全漏洞。

  声纹是最好的,没有之一,在远程身份认证中,为什么?《道德经》里面有两句话“大音希声 大象无形”保护很深的道理,声音就体现了辩证法的高度统一。声音看着很简单,是一维信号,但是它包含着非常丰富的信息量,因为这个我经过思考提出一个新的词叫“形简意丰”,声音信号是最简单的信号,包含什么呢?有语言的种类、口音、内容、性别、情感、身份,还有其他的信息。未来我会做一些跟中医合作的研究,因为语音中还有病理信息,听声就可以治病,所以语音信号信息非常综合,很简单的形态但是包含很多信息。这里可以看到,声音是变的,这跟其他特征不一样,我们说话时把不变的身份信息放在变的形式里面,验证时再从这些变的形式里面提取出不变的身份信息,这就使得模仿非常难。利用语音识别技术对内容进行识别和利用情感识别技术进行真实意图检测,可以防止语音假冒,可以防止被胁迫,即检测是否被人用刀逼着说话,这是非常好的。

  以上是分析。分析是否对,我们要看看实验的结果,这是2008年美国的若干从事指纹、人脸、虹膜等生物特征研究的科学家,做的研究报告,这个研究报告总共127页,这是中间的一个图,是DET曲线,不必关注别的,看哪条曲线离原点近相应的生物特征识别性能就好,这里面有人脸、指纹、手掌、虹膜、指静脉、声音。靠原点最近的是虹膜,是最好的,说最好是在不考虑被攻击的情况的,是只看识别性能的;其次的就是声音。如果把防攻击的因素考虑进去,把成本因素也考虑进去,那么声音就是最好的。所以我就说,在手机银行身份认证领域里,声音是最好的。我们在这方面做了一些实验和研究,有30多年的积累,2013年提出这个方案,把动态码的识别和人的身份的识别结合到一起实现双重的身份认证,这个做得比较不错,总结了几条特点,成本低廉,现在手机随处可见,手机用户已经超过6亿了,传输带宽小。隐私性低,用户不需要记忆,读的时间很短,体验较好,防闯入,密码随机产生,录音无效。可以跟业务结合,最后能够检测用户的真实意图。总之,有很多特点。

  理论的分析必须用实践证明,要用户投票才能证明你好。我们和建行合作现在已经在手机银行实现声纹身份认证,给大家看一下用户是怎么投票的。用户的增长曲线让我很兴奋,是呈指数级增长的,这是在没有进行市场营销和大规模宣传的情况下的数据,在第一个月用户增长已经达到某个生物特征一年的用户量。所以我们可以看到,从理论分析到最后用户投票,都证明了声纹是最好的远程身份认证方式,因此我今天用的题目是“电子银行如何迎接声纹时代的来临?”的确是声纹时代。现在这样说还不足够,再给大家讲一下下面的方案,你就真的能理解是声纹时代了。

  我们根据声音“形简意丰”的特点可以做一个综合语音平台,把所有东西都放在里面,比如“给张三转1000块钱”,这里可以同时做几个事情,识别业务指令、理解用户的意图、确认用户身份,然后就完成银行转账了。一句话就包含了这么多信息,不需要下拉菜单,不需要再配合别的方式,这语音就是最自然的方式。所以等我们把这个再实现了,声音就是最好的。我今天在这里与在座各位金融界的大咖分享我的想法,我斗胆说一句,也许大家过几年会发现我说的是对的。

  我们是谁?我们是得意音通公司,综合有语音识别、声纹识别、语言理解。我们进行了一些立体化的顶层设计,包括核心技术的研发、产品和服务的开发、专利墙的保护、标准的制定。我们是清华知识产权入股的公司,同时这个公司也向清华大学投资建立了声纹处理联合实验室。这是我刚才讲的产品,“声密保”,获得了中国语音产业联盟中国语音产品的创新奖。我们产品过硬,经过长时间、大规模的测试。有很多成功应用,在金融业和建设银行合作,现在手机银行已经开始使用;跟中国银联已经首先推出了声纹识别的认证平台,这个平台已经完成;在电子政务领域和国家信息中心合作,首先推出了声纹识别进行远程身份认证,包括电子签审环节;移动领域率先推出了指纹和声纹认证的平台;公安领域,这是我们做得最早的,在公共安全方面的。

  我们做了很多专利的保护,有14项发明专利,都是围绕声纹的,还有软件著作权。这里可以看到我们在声密保方面做的研究和积累,包括核心的算法如动态密码、快速算法、用户自定密码、方言识别等,功能性技术有录音情况检测、声纹自学习、业务相关、指纹声纹的融合、指纹人脸的融合、声纹手势融合等。这些都是我们完成的技术积累和进行的专利保护。

  我们负责一些标准的起草,到现在为止,我们是中国所有声纹相关标准的起草者,包括公安部、人民银行、工信部等的。这是已经颁布的中国第一个声纹标准,在工信部、公安部、信标委等相关领域。正在制订的包括手机银行标准,这是金标委唯一有关生物特征标准的,是声纹识别;信标委也有;公安部也在考虑未来进行远程身份认证时,怎么去进行一体化标准化建设,这里有14项待制订的标准。还有移动设备方面的标准制订,我们是首批8家全权会员单位之一。

  刚才我用比较短的时间给各位汇报了一下我们的情况。我希望通过今天的介绍让在座的各位能够更多了解声纹识别,也希望通过今天这个报告加强和各位的合作。谢谢各位!

 

责任编辑:王超

您有好的观点和精彩的文章,欢迎投稿。投稿邮箱:cebnetnews@cfca.com.cn 。

微信扫一扫,在这里读懂新金融。欢迎扫描下方二维码关注中国电子银行网官方微信、浏览手机网站或下载官方APP(半刻金融)。

中国电子银行网官方微信 中国电子银行网手机网站 中国电子银行网官方APP
 
 
 
总是会有福利从这里发出……
手机上省流量看资讯
创新引领 半刻不停

 

新闻推荐

Copyright 中国电子银行网 2009,All Rights Reserved 京ICP证05045998号—2. 京公网安备110102004896号

可信网站