EAST+“三个聚焦”贯通融合多技术工具深化非银领域应用——湖北金融监管局非银EAST应用创新团队申报材料
按《关于国家金融监督管理总局第一届EAST系统应用劳动竞赛的通知》(金非银检函〔2024〕174号)要求,湖北监管局科技监管处牵头成立了跨分局、跨科室、跨层级非银EAST应用创新团队,团队共有6名成员,分别为来自省局科技监管处张鹏、姚理铭,随州分局保险监管科邹益招、鄂州分局监管二科徐雷、襄阳分局现场检查科赵威、恩施分局统信科肖倩。
湖北非银创新应用团队通过贯通银行EAST+保险EAST系统,自主搭建财产险公司全局视图,运用机器学习数据挖掘工具JupyterNotebook、金融机构股权及关联关系图谱、知识图谱、空壳公司模型、监管大数据平台等多种技术工具,聚焦机器学习算法和知识图谱算法,对海量数据的多个风险特征进行识别,并对特征权重进行排序,提炼后进一步对模型进行训练,实现模型的自我学习和进化迭代。深入知识图谱应用,强化风控“透视雷达”能力,增强风险监测穿透性和可视性。多种工具融合使用从而提升风险识别的精准度,不断推进EAST系统在非银条线应用深度和广度。
一、聚焦影响保险稳定的“关键事”,保险EAST+小切口,有效助力监管现场检查
分析总局前期共享非银模型后发现,大部分模型需要导入外部数据后运用银行EAST数据进行分析。本创新应用团队立足保险EAST数据,从保险违规的小切口,打造全国通用保险应用模型组,助力现场检查筑牢保险安全稳定防线
(一)模型应用实例:“带病投保”模型
(1)研究背景与思路。大额保单一般经过保险公司风险评估再加层层审核,在一至两个月内即出险很不正常。运用保险EAST数据,查找大额投保保单,运用函数筛查在两个月内即理赔的大额可疑保单。
(2)模型图示。
(3)疑点线索。首次核实发现中国人民财产保险湖北省分公司充当通道,协助湖北消费金融公司掩盖不良贷款。如人保财险湖北分公司保单编号为PXAP202342010000000001保单,保险EAST系统显示投保申请及签单日期均为2023年10月30日,保险品种:银行机构贷款损失类信用保险,保费9399838元,2023年11月20日核赔,仅投保20天即出险理赔,扣除通道费用后,赔付金额8602563.7元。进一步追踪理赔资金流向,发现理赔资金并未用于偿还保单记载的借款人逾期贷款,而是用于冲减以前年度逾期贷款余额。
另外还发现部分农业保险存在投保后两月内即理赔的疑点线索待查158条。
(二)“大车拉小货”未按规定使用批准保险费率模型
(1)研究背景及思路。各家保险机构向总局报备了车险条款和费率,货车按照吨位数可划分4类,不同吨位对应不同费率。从监管实践中来看,各家保险公司向业务员下达不切实际的保费增长任务,部分业务员未按照规定的保险费率执行,公司核保人员核保不严,导致高吨位数的车辆按照低吨位数的货车保费承保,俗称“大车拉小货”。根据车险标的信息对车辆吨位统计分析,关联保单信息表筛查对应费率信息。
(2)模型图示。
(3)疑点线索。运用该模型对中国平安财产保险股份有限公司湖北省分公司发现大车拉小货疑点线索6346条、及保费7.62万元,经核查,平安产险武汉中以上重型货运车按照5-10吨货车承保,沙及签单保162万元,连同其它问题一并被行政处罚54万元。
(三)无赔款优待系数NCD系数适用不规范
(1)研究背景及思路。机动车商业保险无赔款优待优化方案(2020版)规定,根据客户近三年投保及出险情况确定了10个等级的无赔款优待系数。其他条件一样的情况下,投保年限越长且无出险次数越少的车辆,将获得更低的NCD系数和保费,从而达到鼓励驾驶人谨慎驾驶、减少事故发生、降低整个保险市场的赔付率,提高行业的盈利能力和可持续性的目的。新车及过户车首年投保NCD系数为1;三年无赔款对应系数0.6,四年及以上无赔对应系数0.5。根据NCD系数规则,确定两个建模方向,一是新车及过户车首年保单NCD系数不等于1,二是续保保单有赔案但NCD系数小于0.7。
(2)模型图示。
(3)疑点线索。
运用该模型对中国人寿财产保险股份有限公司湖北省分公司进行了筛查2023年以后新车及过户车当年保单适用不为1的无赔款优待系数疑点线索1827条。适用三年及四年无赔优系数但续保保单有赔案的车辆疑点线索20345条。抽查过户车保单2户2笔、保费金额0.41万元,均查实,已印发金融监管意见书督促整改。
二、聚焦破坏保险市场秩序的“关键行为”,银行保险EAST贯通融合+机器学习+知识图谱,助力车险欺诈风险模型
随着保险业的蓬勃发展,有组织的保险诈骗活动、职业化第三方骗保、保险公司内部人员误导或怂恿保险客户非正常退保等损害消费者合法权益的保险欺诈行为频繁发生,其中车险欺诈在保险欺诈中占比高达80%,是保险欺诈的重灾区,每年涉案金额保守估计高达200亿元,严重扰乱保险业正常经营秩序。
创新点:一是建立了湖北产险公司EAST全局视图,将全辖机构视为“统一客户、同一业务”,有效突破机构间数据壁垒,破解了数据在保险机构间、业务领域间分散孤立的局面。二是运用机器学习算法,创新探索搭建反欺诈数据专题集市,围绕涉案车辆、三方团伙、投保人、驾驶人、收款人、伤者、案件、保单等“人事物”8大维度42个风险特征项构建保险车辆反欺诈集市,构建银行与保险EAST数据通路,解决信息孤岛,深挖EAST数据运用维度,降低数据运用、共享、流通的难度,预测反保险欺诈车车辆及有关特征三是建立反欺诈知识图谱。通过融合知识图谱算法和数据挖掘技术,实现了从数据抽取、知识表示、知识推理到图谱凡用的端到端分析流程,旨在精准识别和挖掘保险欺诈行为以更直观方式呈现车险欺诈结果。
(一)车险反欺诈机器学习模型找重要特征
1.构建特征指标。围绕涉案车辆、三方团伙、投保人、驾驶人、收款人、伤者、案件、保单等“人事物”8大维度42个风险特征项构建保险车辆反欺诈集市,将全辖机构视为“统一客户、同一业务”,有效突破机构间数据壁垒,破解了数据在保险机构间、业务领域间分散孤立的局面。
特征名称 | 特征字段 | |
车辆维度 | 车辆识别码对应最大车牌数 | CHEPAI_CNT |
出险车型是否高档车 | GDCLBZ | |
外地车标志 | IS_OUT | |
损失标的是否含三者车车衣 | IS_CY | |
相同物损损失部位关联案件次数 | SAME_BW_CNT | |
车辆理赔率 | LP_RATE | |
投保前一段时间的违法次数 | VIOLAT_CNT | |
是否全损车辆再次索赔 | CLQSSP_CNT | |
关联三者车最大出险次数 | RELA_SF_CNT | |
关联的三方车对应案件全责次数 | RELA_SFQZ_CNT | |
车辆所有人证件号码 | CLSYRZJHM | |
投保人维度 | 涉案次数 | SACS |
涉案金额 | AMT | |
平均涉案金额 | AVG_AMT | |
涉及修理机构数量 | XLJGSL | |
持有过户车辆数 | GHCL_NUM | |
夜间出险次数 | YJCX_CNT | |
延迟报案次数 | YCBA_CNT | |
关联汽车数 | HAVE_CAR_NUM | |
是否投保多年标志 | iS_OLD | |
涉案涉及到多少车辆 | RELA_CAR_NUM | |
同一投保人投保的车辆大于等于3,且其中2辆车至少发生过1次事故; | CYDLC_TWO | |
投保人投保的N辆车发生事故的三者车相同; | CYDLC_SAME_SF | |
驾驶人维度 | 标的车车主曾为三方车驾驶员 | IS_SF_JSY |
标的车驾驶员曾为三方车驾驶员 | IS_BD_JSY | |
收款人维度 | 收款人是否关联多个案件 | SKR_RELA_CNT |
伤者维度 | 伤者关联案件数 | SZ_RELA_CNT |
相同伤者伤情关联案件数 | SAME_SQ_CNT | |
案件维度 | 赔案次数 | PACS |
违法处理时间与违法时间差的平均值 | VIOLAT_MEAN_TIME | |
保单维度 | 出险日期与保单终止日期间隔天数 | END_JGTS |
出险日期与保单开始日期间隔天数 | START_JGTS | |
出险日期是否临近保单终止日期 | UCX | |
一个保单期限内出险次数 | CX_CNT | |
保单期内发生理赔的金额的平均数 | CLAIM_MEAN | |
理赔金额标准差 | STD_AMT | |
三方团伙维度 | 三车成环(三辆车在三个案件传导成环) | IS_THREE_RELA |
一人四车成环(一个人是否关联多辆车且案件成环) | IS_FOUR_RELA | |
一人三车成环(两起案件三辆车且三车与同一人相关) | IS_SFTHGZ_3 | |
一人两车成环(一起案件两辆车且两车与同一人相关) | IS_SFTHGZ_4 | |
两人五车成环(两人通过三个案件关联五辆车间接传导成环) | IS_SFTHGZ_5 | |
两人四车成环(两人通过两个案件关联四辆车间接传导成环) | IS_SFTHGZ_6 | |
两人三车成环(两人通过一个案件关联三辆车间接传导成环) | IS_SFTHGZ_7 |
2.生成各类指标及衍生指标89个,通过特征重要性统计分析,对特征权重进行排序,剔除有关高度相似特征(图一),选定32个重要性较高并符合业务逻辑的指标作为入模指标。进行机器学习后发现,其中赔案次数、涉案车辆数、涉及修理机构数量、一个保单期内出险次数、涉案金额为排名前五的重要特征(图二)。
我们对比预测异常数据和全量数据的赔案次数,分析预测异常数据和全量数据的一个保单期内出险次数,可以发现异常数据的出险次数、涉案车辆数明显较高。异常数据的分布特征,也进一步印证了模型特征指标的现实可解释性(如下图一、图二、图三)。运用有关重要特征在保险EAST数据建立模型。
(二)EAST模型应用实例:多方团伙车险欺诈模型
(1)研究背景及思路。本模型采用机器学习反欺诈特征,通过交叉对比同一辆车分别作为标的车和第三方车高频次出险理赔,获得该车为高风险车辆参与团伙欺诈的疑点线索清单,再通过导出疑点清单与外部数据交叉核验,获取相关高风险车辆在多个暗案中分别作为三方车和标的车同出险的数据,且报案人与车辆驾驶员交叉重叠出-车-车闭环,即相关车辆作为道具车参与团伙欺诈的疑点数据。
(2)模型图示:
(3)疑点线索:通过模型筛选出高频次理赔的高风险车辆信息80余条,将此类高风险车辆信息导出,通过关联比对报案人和驾驶员信息,发现部分驾驶员和报案人在不同赔案的多辆高风险车中交叉出现,且分别是上述高风险车辆所有人,形成人、车闭环,与车险团伙欺诈案件的特征高度相似,由此形成车险团伙欺诈疑点清单,经过保险机构核验,识别恩施人保公司人-车-车三方欺诈环模型,本案涉及9家保险公司主体赔付金额68000元,证实其中存在三方团伙欺诈嫌疑,2024年9月25日刑侦部门将该团伙抓捕归案。
(三)建立车险反欺诈知识图谱Schema
(1)研究思路;一是基于近年辖内人保、平安、太保等保险公司理赔数据,整合车险车辆损失、车险标的和付费明细表等信息。二是梳理出索赔、车辆修理厂、保险机构、车辆、车辆驾驶员等七大类实体节点。三是抽象出业务实体与潜在欺诈团伙之间索赔关联车辆、索赔关联修理厂、索赔关联保险机构等七种风险联系。四是形成网状的关系结构,并据此构建车辆保险知识图谱。
(2)研究步骤:1.基于构建出的车辆保险知识图谱Schema和理赔数据,形成全量的知识图谱结构图。
2.利用群组划分和可疑团伙筛选两个步骤筛选出疑似团伙,其中群组划分利用标签传播算法、Louvain算法和联通分量等社区发现算法,识别出紧密相连的节点群体。
3.对团伙模型赋予图特征,通过特征筛选决策树模型构造规则,对群组中欺诈团伙进行筛选,初步生成可疑团伙的名单。(如下图)
(3)疑点线索:以上案例是基于群组划分和可疑团伙筛选出的团伙欺诈关系图,从图中可以看出,在索赔案件4093****7484中(最大红色五角星红点图),出险车辆(机动车号:LL22****567)短时间内频繁出险且事故类型相似,同时所属多个车辆所有人,且产生多个索赔案例,系统判定为疑似团伙欺诈;还再经业务专家对可疑团伙名单进行审查评估和专业分析,最终确定欺诈团伙名单。
(四)模型应用实例:车险“人伤黄牛”模型
(1)研究背景与思路。本模型通过筛选首次伤残鉴定机构、案件代理人及其所属机构、伤者开户银行高度集中的车险人伤数据,通过资金归集等线索查找“人伤黄牛”。
(2)模型图示:
(3)疑点线索:基于以上构建的知识图谱和筛选流程,从近300个理赔案例中共筛选出4个疑似团伙欺诈案例,从图中可以看出,以上案例是基于群组划分和可疑团伙筛选出的团伙欺诈关系图。从图中可以看出,在索赔案件4093****7484中(最大红色五角星红点图),出险车辆(机动车号:LL22****567)短时间内频繁出险且事故类型相似,同时所属多个车辆所有人,且产生多个索赔案例,系统判定为疑似团伙欺诈;还再经业务专家对可疑团伙名单进行审查评估和专业分析,最终确定欺诈团伙名单。
三、聚焦可能造成保险重大金融风险“关键人”,银行EAST+机器学习,助力识别保险机构股东及关联人风险
针对股东股权违法违规及穿透识别的难点痛点,探索利用银行EAST系统、图数据模型、机器学习算法等智能监管工具,实现对已经或者潜在存在重大违法违规行为股东的自动化、智能化分析预测,为总局开发的金融机构股权及关联关系图谱作有益补充,为持续性开展违法违规股东识别、公开和惩戒提供坚实基础。
(1)研究背景及思路。一些中小保险机构通过隐匿关联关系、设计复杂交易结构等方式规避监管、开展套利。如何加大穿透式监管,有效识别违法违规股东及不当关联交易行为,就显得极为迫切。研究思路:运用监管大数据平台对辖内法人保险机构查找股东股权关系,运用金融机构股权及关联关系图谱、银行EAST及机器学习,实现对股东及关联智能识别。
(2)模型图示:
1.监管大数据平台使用图示。以湖北法人机构合众人寿为例,在监管大数据平台查找股东股权关系,发现合众人寿法人代表戴浩是中发集团实际控制人,吉林亿联银行第一大股东(占比30%)穿透两层后,实际控制人戴浩,戴浩同时也是吉林亿联银行董事长。
2、运用湖北监管同前期银行EAST研发的股东及关联人智能识别模型,选用吉林亿联银行数据集,得出预测结果,该模型分为五个步骤(见下图一)。一是建立初如特征规则运用EAST对以贷入股、违规质押、股权代持等常见股权和关联交易违法违规行为(下图二),设计涵盖股东特征(34个)、关联方特征(31个)、交易对手特征(14个)等三个方面的79个初始特征规则(见下图三)。特别对股东资金交易分析,探查高频交易对手融资风险状况,找潜在的实际控制人等隐性关联方。二是建立股东客户特征矩阵,利用协方差计算,得到热点图,可视化出特征直接相关性,剔除剔除冗余特征(见下图三)。三是用孤立森林算法建模。四是随机森林样本训练。五是输出模型成果,机器学习结果预测46条疑点线索。
3.运用金融机构及股权关联关系图谱对发现疑点线索杳找关联关系。分别对合众人寿、吉林忆联银行和合众人寿大股东中发集团开展三层节点分析(见下图)。
4.将三层节点关联汇总形成361条大关联表,运用EAST分析在吉林忆联银行融资和保险保障情况(如下图1)。运用空壳企业评分疑似度模型,分析是否存在空壳企业(如下图2)。运用资金追踪工具查看股东及关联关系。(如下图3)
(3)疑点线索。
1.合众人寿保险公司与吉林亿联银行应纳入集团客户统一管理。运用监管大数据平台穿透分析发现,合众人寿法人代表戴浩是中发集团实际控制人,戴浩同时也是吉林亿联银行董事长。
2.合众人寿保险公司应加大股东关联方识别。预测45条吉林忆联银行控股股东及关联方,合众人寿保险公司应当将其纳入股东及重要关联关系人(截至目前,合众人寿EAST系统机构股权信息表、重大关联交易表、关联方信息表均为空值)。
3.发现空壳疑似公司。运用金融机构股权及关联关系图谱,将合众人寿、忆联银行及大股东中发实业集团三度关联方信息表导入空壳企业疑似度评分模型,发现中发实业集团三度关联关系人中缘京金国际贸易(北京)有限公司在该模型中评分达95分,高度疑似空壳企业,该公司与亿联银行股东斯迈特投资有限责任公司(占股18.48%)有同一联系电话13701125992。
4.中发实业集团与合众人寿股东斯迈特投资有限责任公司疑似一致行动人关系。从穿透后资金依存关系也可看到中发实业集团与拉萨星爵企业管理咨询公司重要自然人关联,拉萨星爵与拉萨创意国际信息科技有限公司同一注册地址,拉萨创意国际信息科技与斯迈特投资有限责任公司资金依存关系。
下一步,湖北监管局非银行EAST创新团队将进一步优化基础模型精确度和应用广度,融合多种工具结合运用,进一步提升EAST在非银领域风险探测自动化水平。