熵减思维幂数效应保险市场乱象整治"小齿轮"智能工具集——湖南局非银EAST系统应用创新团队申报材料
为落实保险新“国十条”严肃整治保险违法违规行为的要求,湖南局聚焦销售误导、“五虚”问题、“代理退保”黑产以及保险欺诈等违规行为,综合运用EAST系统、BERT深度神经网络技术、图技术等前沿技术,创新开发“小齿轮”智能工具集,以“智”提质,推动保险市场乱象整治。上述工具在省内18个检查项目使用,发现疑点数据1760笔、涉及金额951万元,查实违规问题28个、处罚240万元,向公安机关移交重要线索,并助力查出“杀父骗保案”“车险团伙诈骗”等案件,相关做法得到中国银行保险报、人民公安报等主流媒体宣传报道。
一、创新背景
销售误导、“五虚”“代理退保”黑产以及保险欺诈等市场乱象,既是当前保险监管的重点,也是保险行业发展的痛点,上述问题在市场上主要呈现三个特点:一是“问题多”,上述问题基本上在每家保险公司都不同程度的存在,且屡查屡犯、屡禁不止。二是“查处难”,违规行为呈现复杂化、专业化和团队化,传统监管手段已难以查深查透、形成有效震慑作用。三是“损害广”,上述乱象扰乱了市场秩序、增加了保险公司运营成本,更严重损害了保险消费者的合法权益。因此,我局积极探索科技赋能监管,用智能检查小齿轮推动保险市场乱象大整治,持续提升监管工作质效。
二、功能、作法及成效
保险市场乱象整治“小齿轮”智能工具集(以下简称“工具集”)包括销售误导智能识别工具、“五虚”及黑产智能追踪工具和保险欺诈联合行动机制3个部分,用科技赋能增加发现问题的概率,用协同联动提升打击违法的力度,
(一)销售误导智能识别工具。首次引入BERT深度学习神经网络算法,结合Tesseract光学字符识别、FunASR语音识别以及Python编程语言等,在局内网部署销售误导智能识别工具。通过批量上传产说会、培训会课件、销售录音等资料,智能识别出其中包含捆绑销售、炒停售等虚假或夸大表述以及给予合同外利益等销售违规行为线索,推动销售行为监管“加速度”。
工具使用最新训练集强化对BERT-Base-Chinese的训练,具有12层结构,每个隐含层有768个神经元,参数总量达1.1亿个。训练数据主要来源于泰康人寿、财信吉祥人寿总公司电销录音,数据经文本、语音识别后,由监管人员手动标注、工具自动识别、人工复核后确定训练样本。目前训练数据经多次迭代已超13万条,训练用时35.5小时,正例的精确率(是指识别正确的正例数量/识别出的疑点数量。)为95.55%。
附图1:训练样本
附图2:训练结果
该工具可应用于筛查培训资料、销售录音、举报投诉等保险销售全链条监管。在省内财信吉祥人寿、人保寿险湖南省公司现场检查中使用,核实准确率超九成。通过人机替代,检查精准性大幅提高,检查时长缩短近九成。相关代码已封装上线,可延伸应用于理财产品销售合规性、违规“代理退保”识别等领域。
(二)“五虚”及黑产智能追踪工具。利用开源ETL技术Kettle工具,同时链接银行、保险EAST数据库,分别建立筛查模型9个,每个结果保存为高内聚、低耦合的子模块,各模块间灵活组合、形成网状联系,既可作为最终结果输出,也可作为中间结果辅助其他筛查,按下乱象整治“快进键”。
以筛查代理黑产为例,从保险EAST数据的《付费明细表》中筛查退保客户信息,形成子模块,并在此基础上筛查保险客户获得退保资金后的流水,锁定多名客户将资金转入某一公司或个人的情形。结合使用图技术、“Mac”地址等建立关联关系圈,对于多户退保资金流入同一“关联账户”的情况也纳入计算。任何一笔交易分析都无法判断是否存在违规,单一维度筛查会出现“拒真”“纳伪”,针对“代理退保”黑产等复杂违规模式,则需使用内嵌子模块,通过Aprior算法,对单个子模块筛查出的可疑客户进行赋值,对重复出现在多个子模块结果中的客户重点筛查,通过试错测试,找出背后的代理中介或团伙,提高判断准确性。
附图3:工具架构及思路
该工具先后在辖内18个现场检查项目中使用,累计发现疑点数据353笔、涉及金额431万元,查实问题26个、处罚金额240万元。锁定“代理退保”可疑线索279条、核实151条,涉及退保金额941.55万元,并已向公安机关移送7条“黑产”线索。
(三)保险欺诈联合行动机制。2024年3月,湖南局与湖南省公安厅等多部门联合组建湖南省保险反欺诈中心,共同签暑《湖南省防范和打击保险领域违法犯罪地作建立“预警、筛查、打击”联动工作机制,并创建覆盖车险、农险和意外伤害险等骗保高发场景的“保险欺诈疑点筛查模型组",形成打击欺诈行为"组合拳”。
以打击车险欺诈为例,应用《车险承保信息表》、《车辆损失信息表》等EAST数据,筛查某一团伙成员以不同身份频繁出险报案、筛查某一客户在报案之前集中投保情况、筛查投保人收入与投保金额明显偏差、筛查理赔资金流向特定团体等可疑情况。使用Python语言、Echarts分析创建“资金流向图谱+事故全景图谱+员工关联图谱”,并综合投保情况、出险频率、赔付资金流向和事故原因等挖掘数据背后隐藏的逻辑。
附图4:资金流向、事故全景、员工关联图谱
今年以来,运用模型筛查发现重要疑点数据57条,移送重大案件线索4条,其中1条被省公安厅纳入重点督办案件。如湖南安化某男子“杀父骗保”案,利用银行、保险EAST数据,建模筛查发现当事人刘某在事发前一个月密集为事故死者投保17份意外伤害险,保费金额合计5.79万元,涉及保额1423万元。但其无正当职业、无固定经济来源、银行账户余额仅为44.06元,经济收入与保额明显不匹配。且事故车辆为案发前低价购置的二手车,该事故存在重大骗保嫌疑。针对此情况,我们联合保险行业协会、公安机关,进一步取证核实,目前已被当地公安机关立案,并列为省公安厅重点督办案件,刘某等7人已被刑事拘留。
三、主要特点及优势
(一)应用创新技术,运行效率大幅提升。该系统首次运用机器学习、语音识别和资金追踪等前沿技术,融合应用银行保险EAST数据,并强化与公安大数据、中银保信平台的资源集成,聚焦保险乱象整治,助力监管提质增效。在某中小寿险法人机构检查中,工具仅用10分钟就完成了40小时的销售录音识别,且准确率超过人工识别。
(二)聚焦监管实用,推广应用前景广阔。工具开发全部由团队人员完成,均为开源软件,无额外费用支出。并可根据监管需要,快速增加或修改模块,全国通用,操作便捷。工具使用后能自动“迭代”升级,运用越多、判断越精准。“小齿轮”推广后,大幅提升保险乱象查处概率,增加违规成本,维护保险行业市场秩序。