从每秒20万个红包中揪出骗钱的“黑包”,腾讯怎么做到的?
过年了,全国的童鞋们或者缩在被窝里,或者葛优躺在沙发上,或者懒洋洋地走在路上。然而,这一切都是假象。 一旦手机中红包闪现,所有人都能在一瞬间聚集起豹的速度、鹰的眼睛、熊的力量,手指以迅雷不及掩耳之势直捣黄龙。几亿人为了哪怕几分钱的微信红包魂牵梦萦,时而大喜过望,时而捶胸顿足,时而悲愤难平,时而以头抢地。 在某一瞬间,我们俨然都成了一个巨大的“幼稚园”里的小朋友。 为了让这些“情绪不稳定”的小朋友好好享受红包带来的满足,“幼稚园老师”——腾讯,可谓煞费苦心。 因为,总有一些“坏小孩”,喜欢用“错误的姿势”玩红包,有的还喜欢欺负其他小朋友。 揪出“坏小孩”,就是人们所说的“风控”。 为了搞清坏小孩是怎么被揪出来的,小编()宅客频道特地请教了来自腾讯大金融安全的项目管理负责人周治明、风控策略专家吴鸣和风控技术专家于诗永。 所谓“红包是披上了温情的转账,转账是褪去了华服的红包。”从风控的视角来看,红包、转账、在微信支付和QQ钱包上买腾讯理财通、信用卡还款、给手机充值等等都是支付行为,区别只有额度和风险的不同。首先,他们讲解了一下什么是支付过程中的“错误姿势”。 一、哪些红包/支付姿势是不对的1、用“别人”的钱支付虽说“能用别人的钱发红包”是很多人的理想,但如果你真的这么做了,麻烦就大了。因为,如果想用别人的钱发红包,首先你要盗取别人的账号或银行卡信息(直接盗取账号然后转移其中的资产;或者盗取他人银行卡信息,与其它微信号绑定后转移资金)。 不用多说,这是最典型的账号欺诈,当然是不正确的发红包姿势。 这里,请注意关键词:“别人”,假如你的女朋友夺过你的手机反剪双手逼迫你说出密码,然后拉过你的手指按在指纹识别处,那么跪在键盘上的你是无力回天的。 2、“猪油蒙心”式支付你也许听说过这样一种“兼职”方法。那就是为某个电商刷单。对方承诺你先自己垫付一些钱购买指定的商品,不久会返还你的货款还有额外的“报酬”。 事情的结局是:你垫付了资金,骗子却无影无踪。只留你在原地悲叹“城市套路深”。 其实,几乎所有的诈骗都无外乎趋利、避害这两种让人“猪油蒙心”的骗术。仿冒打车 App、电商或快递公司的客服,告诉你要先交保证金再退款的骗术等等都属于这个范畴。 值得注意的是,还有骗子会编造一串理由让你把微信付款码或上方的注册码(注意,是上面的那串数字!)发送给对方,然后进行盗刷。 出于对“小朋友”的保护,这种遭受诈骗而发出的红包和转账,显然被认定是不正确的支付姿势。 3、“明知故犯”式支付有诗云:“爱情不是你想买,想买就能买。”除了爱情,还有很多东西是你不能买的。比如:黄、赌、毒。在“黄赌毒领域”,几乎所有的支付行为都是“明知故犯”的,比如为色情 App 充会员、为赌博网站充值、 买宋冬野的CD 等等。(好像混进了奇怪的东西) 为了世界和平,这些支付姿势当然也不正确。 二、好小孩和坏小孩正如我们之前的比喻,在幼稚园里面对无数个小朋友,老师怎么知道哪个是好孩子哪个是坏孩子呢? 首先,就是要掌握这些孩子的“数据”。 在支付场景中,这些“孩子”就对应了一个个的账号,围绕账号的风控数据主要包括“交易类的数据”“实名类数据”和“社交数据”。 也就是说,可以作为安全考核的数据维度有:设备指纹、网络环境、支付动作(下单、确认支付、输入密码、确认交易)、转账的金额和时间、实名注册人背景信息、关系网深度、账号新旧程度等等。当然,这些数据都是基于隐私保护的原则脱敏的。 其中很多交易数据都由埋设在程序中的“探针”获取。我们把数据放好备用,先来看看已经被发现的“坏小孩”究竟什么样。 1、坏小孩什么样?虽然无法时刻看护园中的每一个孩子,。但是没关系,微信、QQ 的客服可能会接到举报和投诉(微信似乎是常用 App 里举报入口最多的,没有之一),涉及资金最常见的有以下几种情况: 我的微信/QQ 号码被盗了,钱被别人转走了。 我受骗了,钱是通过微信 /QQ 付出去的。 我在微信/QQ 上看到了传播的黄赌毒网站。 这不正对应之前说到的三种错误的支付姿势吗?这些经过人工确认的恶意行为样本,就成为了风控系统最好的学习材料。 当然,这些数据并不是全部,周治明告诉我们, 总体来说,交易类和实名类数据来自微信/QQ 的内部闭环,除此之外还有很多其他数据来源。例如腾讯的电脑/手机管家终端,也会搜集大量和支付相关的诈骗、黄赌毒网址样本。管家有全球最大的恶意网址数据库。对于社交类数据,会和合作伙伴之间进行沟通交流。当然,专家也会根据举报的线索对犯罪团伙身份进行挖据,总体来说样本量非常大。 在周治明和其他专家心里,这些统称为“情报”。 2、先揪出坏小孩数据有了,样本也有了。 接下来就到了见证奇迹的时刻。 于诗永告诉我们,通过对 2000 多个变量(来自不同维度的数据)进行一整套机器学习的计算,就可以找到这些“坏样本”的共同特征。 【来自不同维度的数据,经过机器学习之后可以生成一些独特的特征】 比如说,用户年龄可以作为一个判定条件,对于实名认证用户,如果认证是一个50岁以上的老人,却进行大额支付来购买大型网络游戏道具。根据风控模型,这个潜在的风险就很高。 再比如,一个微信账户在凌晨绑了卡,然后马上给另一个微信号大额转账,另一个微信号又马上提现。首先交易时间比较可疑。其次从两个账号的亲密度模型来看,之前两个号并没有交集,这也很可疑。另外,其中有一个号的社交活跃度很低,这也有问题。综合来看这就是很典型的转移资金的风险场景。 当然,对于风控系统来说,判断的规则比我们可以描述和理解的内容更复杂。针对这一套数据计算方法,吴鸣有一个更生动的比喻, 这和医生看病比较相似。如果要找出病人得的是什么病。需要化验血、做B超、检验各个器官等等,得到有关你身体的各项指标数据。 在血液这个维度里面,可能还会有一些模型进行分析,在各个器官的维度里,还会有各自的分析模型。这些维度经过数据分析后,某些可能是异于常人的。 把这些异于常人的维度进行综合评估,才能得知你究竟患了什么病。 也就是说,一个好的风控系统,应该像一个老医生,通过观察一个“账户”的各个指标,在“大脑”里计算出这个账户究竟哪些方面不对劲。从而判断它是盗卡账户,被盗账户还是骗子账户。 (编辑:ASP站长网) |