2019年金融大数据应用的趋势、机遇和挑战(2)
这些另类数据可以应用到金融层面,无论是系统性的风险,还是大的趋势风险判断,都可以纳入另类数据。另一方面,另类数据对于股指、期货、大宗商品交易等等这些指数的预测,也会带来巨大的影响。另类数据在美国讨论也不过两年的时间,相信从理论到深度应用还有很多路需要探索。这就是我对另类数据的一些理解。谢谢。 氪信合伙人、副总裁高强 高强:我想和大家分享一下我们在实践当中的一些感受。氪信一直强调对数据的整合挖掘效果。氪信一直说是AI+大数据,为什么这么说呢?我们放到再远一点讲,每一次技术的革新,它的作用到底是什么?AI的这一次技术革命它的作用是什么?那么我们想一个新的技术,它实际上是在拓展我们人类对我们已有的这些资源的开发的能力。那么这一次我们讲AI和大数据,我们觉得AI这个工具它实际也是在拓展我们对我们业务资源的挖掘能力,这个资源就是数据。 那么我们在实际给金融机构做数据风控的时候,确实很深刻地感受到了新的技术突破以后,会使我们对已有资源利用能力扩展,尤其是像我们过去几年,大家都感受到一个是支付的变化,一个是消费金融的变化。在几年前,我们可能经常会用现金,今天我们很少会用。现在我们会在现场去完成,这是离不开AI的技术对我们新兴的各种各样的非结构化的数据还有传统数据之外的这些数据的解读。 如果没有这样一些新的技术的突破的话,按照传统的银行的这些做风控、评分卡的方式,很多我们借贷的场景或者借贷的需求是没有办法通过的,这是第一点。 第二点,我们刚才讲到了现在大多数的数据是非结构化的,比如说文本、比如说像一些图像数据、语音数据。刚才前面专家讲到了我们在证券领域有一些“情绪数据”。举例来看,就是我们在医院看病的时候,传统的时候我们可能看一下我们的化验报告,一些标准的指标。慢慢地,我们的技术发展了以后,我们可以看CT片,越来越精细的扫描的片子。那么现在其实我们在我们的一些实际的工作中,也开始用深度学习技术,把一些数据转化成图像的格式来分析图片。 这些新能力的出现,其实是得益于今天AI技术的发展。在整个新的数据时代,AI和数据的结合,当然还有包括云计算算法的结合,会产生非常巨大的能量。我感觉现在只是一个开始。 华创资本副总裁余振波 余振波:先回答主持人的问题。 华创对所谓金融大数据、非金融大数据的看法:总体来讲华创其实并没有严格地划一条线明确的区分什么是金融大数据、什么是非金融大数据。从华创的视角出发,金融大数据和非金融大数据其实并没有非常明确的分界线。 从投资的角度去看非金融数据,需要关注的有以下几点: 第一点,数据来源,数据的产品是不是可以规模化、标准化。这是取决于这个数据上面能长成一个标准化的产品,能够长出一些有意思公司的先决的条件。 第二点,这个数据是不是真的有很强的解释力和好的商业应用。比如说去预测估值的波动,比如二十天放大到两百天,在市场的异常情况下是不是很准。这其实是比较难判断的。 第三点,是不是有客户真正买单。这对于创业企业来讲是最重要的一条,是不是你的idea,你的观点真的别人会认可。我们自己其实投了一家所谓的做面向二级市场投资的创业公司,叫百观科技。 百观科技其实就是把一些传统的二级市场的标的,做二级市场的基本面分析的时候用不上的数据或者难以获取的数据,用互联网、大数据的办法采集过来,用他们自己的模型,去做出一个产品,这个产品去卖给二级市场的投资人。其实你们可以看到从数据的产生到中间的解释到最后有没有人买单这样形成了一个完整的闭环,所以我们觉得如果大家想创业的话,可以按照我刚刚所说的这三个方面去分析。 刘欢(主持人): 刚才几位嘉宾都聊到了整合数据、采集数据,那么在整合、采集的过程当中,我们会发现数据有多样性的:有社交数据、电商数据、交易数据、物流轨迹数据等等,在这些多种多样的数据里面,如果按照商业价值来衡量的话,各位嘉宾觉得哪一类数据它的商业价值含金量或可开发、可挖掘的价值更高一些呢? 于洋:一方面要看数据的规模,但规模不是单纯越大越好了。 另一方面,还得看产品的属性和应用。客户的需求是什么,那么数据种类也就相应的要适配什么。 作为一个量化指标,它应该不是单一一类。今天讲到了所谓的另类数据,其实它就是要寻求不同类型之间的数据的关系。 今天中译语通已经为美国海外众多知名企业提供大数据服务。今天讲的数据已经不是负面新闻是怎么样的,一定是负面新闻的规模有多大,影响有多大,以及它和其他因素的关联关系,不再是以一个单一主体去评价数据价值。 高强:主持人的问题其实对于数据来讲,它的价值跟它的应用场景是紧密相关,所以我们如果用投资领域来讲的话,其实不同的策略用到的数据不一样,那肯定体现的价值不一样。比如说做一些期货的投资,可能对它来说跟期货市场上的一些实际的市场的变化的情况或者是跟一些基本面相关。 氪信做的比较多的是银行风控的数据,对于信贷风控来讲,传统大家用的最多的其实是信贷类的数据,也就是说征信机构长期以来一直在积累的这些数据。这几年数据拓展了一些维度,用到了其他的行为数据,比如说通信的行为,比如电商消费的行为,包括日常的一些手机APP上的行为,现在大家都有在用。换句话说,不同的这些数据形成的变量对于我们最终在评估资产或者评估个人的时候,它起到的预测周期的能力是不一样的,比如说有的变量能够看到更长期的变化,产生更长期的变化的驱动力。有些则是短期的变化。 为什么氪信一直讲数据要整合,我们帮银行做的是各种各样的数据做整合。对于我们不同的金融产品,不同的借贷期限,比如说短期的,一个月或者多长的。长期一点的用到的数据不一样,关注点也不一样。所以这个其实跟我们的应用场景是有很大的关系的。 余振波:从投资角度判断数据价值有一些大的方向和判断标准: 第一个,我们觉得最有价值的有效数据,比如说上市公司财报数据当然是非常有效的数据。 第二个,它和现有的证明有效的数据有非常强的因果关系,比如一个成熟的电商网站的UV数,跟它的GMA有非常强的因子分析,这个我们认为也会是一个比较重要的数据。 第三个,可能到不了一个很强的关系,但是有一定的相关性,需要相关性的解释不像因果性的逻辑,很多时候需要你有创造力,或者自己新的想法,创业的机会也可能在这层数据上面。 从商业价值的角度来讲,这个跟你最后做的产品是什么样子比较有关系,如果你的产品比较标准化,或者解释性很强,付费的客户又是比较有钱的客户,比如对冲基金、银行的,这个东西本身价值可能会大一点。 (编辑:ASP站长网) |