一种针对数据中台的实时欺诈行为识别架构
该架构包括用户申请、消息传递、图特征生成、标签特征生成、模型运行、规则判断、业务管理反馈等环节,涉及Kafka消息队列、知识图谱平台、标签管理平台、机器学习建模平台、决策引擎平台、业务管理系统等平台和系统。 用户申请 用户通过大促活动、贷款申请、浏览器等入口,申请权益、资金或访问指定网站。 消息传递 由于上述场景往往涉及诸多用户的集中申请,短时间内有多个申请行为,而且要求系统对用户的行为实时反馈,因此将用户的申请行为、申请信息,连同时间、地点、设备等信息一起,通过Kafka消息队列向下传递。 图特征生成 本架构充分考虑到欺诈行为之间的相关性,即往往紧邻的欺诈行为或用户之间具有某种内在关联,如同地址、同设备等。因此,通过知识图谱平台实时对紧邻申请行为之间的相关性进行分析并生成图特征,如同IP地址段客户数、账号类似客户数等。 标签特征生成 如果说图特征关注的是申请行为之间的关联,那么标签特征更多的是关注申请用户及其行为本身的特征,如是否黑名单、是否白户、是否首次访问等,这些标签组合在一起刻画了用户的行为特征,这些特征的生成基于通用的实时标签管理平台。 机器学习建模 在本架构中,并不直接将图特征和标签特征用于欺诈识别,二是将这两组特征组合在一起,利用有监督或者无监督学习的方法构建欺诈客户识别模型。当有新的客户特征进来的时候,运行该模型并给出行为属于欺诈的概率。#机器学习# 当然,也可以根据需要,直接利用图特征和标签特征进行判断。 规则判断 将用户行为的欺诈概率作为一条规则,当概率高于某一阈值时视为存在欺诈行为,否则视为不存在,并将这一规则部署到决策引擎平台上。当一个新的申请行为经过机器学习模型判断后,即生成判定概率,继而通过决策引擎的规则判断。 (编辑:ASP站长网) |