为提高数字化监管能力,进一步提升监管效能,督促保险资产管理公司主动强化数据治理,持续提升公司治理水平和风险管理能力,银保监会制定了《中国银保监会保险业监管数据标准化规范(保险资产管理公司版)》(以下简称《规范》),现印发给你们,并就有关事项通知如下,请遵照执行。
数据采集范围和报送时间
(一 ) 2023 年 10 月 15 日前,各保险资产管理公司应按照 《规范》要求,报送 2018 年 1 月 1 日至 2023 年 9 月 30 日期 间的全量标准化监管数据。
(二 )从 2023 年 11 月起,各保险资产管理公司应按照《规 范》要求, 于每月 15 日前(遇节假日顺延) 向监管部门报送 前一月的全量、增量及变化量标准化监管数据。
工作要求
(一 ) 各保险资产管理公司应高度重视标准化监管数据报 送工作,建立工作机制,明确牵头部门,指定专人负责,对照 本规范制定接口改造方案,加强实施进度管理,确保按时完成 标准化监管数据报送。
( 二 ) 各保险资产管理公司应严格落实标准化监管数据质 量管理责任,设置标准化监管数据报送电子台账,对报送数据 的一致性、真实性、及时性负责。银保监会将根据标准化监管 数据采集情况,适时组织开展数据质量检查。
( 三 ) 各保险资产管理公司要以标准化监管数据报送为契 机,提升业务数据治理水平,强化业务数据应用,促进公司经 营水平和管理能力不断提高。
(四) 标准化监管数据报送路径等相关事宜另行通知。
有关《规范》解释答疑事宜
(一) 请中保保险资产登记交易系统有限公司协助做好 《规范》印发后的解释答疑工作。
数据来源
包括但不限于以下信息系统:核心业务系统、财务系统、估值系统、交易系统、TA系统、风控系统、产品系统、人力资源系统等。如现有信息系统无法满足数据报送要求时,应及时采取措施,完善信息系统建设,并制定具体工作方案计划,以逐步达到数据报送要求。
数据结构
7个监管主题域、71张数据表、1884个数据项
采集模式
采集模式说明
数据采集分为集中采集和持续采集两种方式。集中采集指保险资产管理公司按本《规范》要求,首次集中向银保监会报送数据,持续采集是每个月15日前报送上个月的数据。
数据表根据性质可以分为明细类和状态类两种。明细类数据表包括:员工问责信息表、董监高处罚信息表、总账会计全科目表、会计凭证信息表、账户科目余额表、交易流水表、关联交易明细表;其他表属于状态类。
首次采集模式
保险资产管理公司首次按本《规范》集中报送数据时,员工问责信息表、董监高处罚信息表、总账会计全科目表、会计凭证信息表、自有资金投资账户科目余额表、自有资金投资账户会计凭证明细表、自有资金投资交易流水表、受托投资账户科目余额表、受托投资账户会计凭证明细表、受托投资交易流水表、产品账户科目余额表、产品账户会计凭证明细表、产品交易流水表、关联交易明细表按照通知定义的时间范围采集具体时间段内所有数据。其他数据表采集时间段内所有发生业务及存续业务在采集截止时间点上的状态,不追溯采集时间段前已结清业务在采集截止时间点上的状态。例如,集中采集时间段为2017年1月1日至2020年12月31日,则2017年到期终止的投资产品应当报送一条状态为“到期终止”的记录,而2016年到期终止的投资产品则不在采集范围内。明细类表按照集中采集通知定义的时间范围采集具体时间段内所有数据。
采集模式-全量
全量采集方式同集中采集的全量采集方式,指状态类表本次报送时间范围内所有发生业务及存续业务的全量数据在当期截止时间点上的状态。例如,2021年10月份应报送2021年9月份的数据,则员工信息表需报送2021年9月底仍在职的员工及2021年9月期间离职的员工信息,2021年8月已离职的员工不需报送。
采集模式-增量
报送明细类表在本次报送时间范围内产生的数据。例如,2021年10月份应报送2021年9月份的数据,则总账会计全科目表需报送会计期间为2021年9月的所有科目的数据,会计凭证信息表需报送记账日期为2021年9月1日-2021年9月30日的数据。
采集模式-变化量
报送状态类表较前一次采集有变更的记录,包括新增、更新、删除,例如机构名称变更则属于变化量数据。其中,“删除”可以理解为报送一条表示状态的数据项值置为“无效”或同等含义的新记录,并以“流水号”(保险机构代码+日期(YYYYMMDD)+10位流水)区分原记录。
采集模式-状态轨迹
报送状态类表本次报送时间范围内历次变更的记录,例如员工状态在1个月内变化了3次,则需报送3条状态不同的记录。
采集介质
各保险资产管理公司通过符合相应安全要求的专用网络报送数据,该网络应当与互联网物理隔离,数据采集部门应当根据本接口说明,制定传输要求,以确保数据安全不泄露。
数据分层存储
保险资产管理公司在向银保监会报送数据的同时,应在本地存储一份备份数据。存至本公司的数据要单独存放、隔离管理,并建立安全可靠的传输通道和保障机制,以支撑银保监会数据调阅与应用。该备份数据,未经银保监会许可,不得删改。
文件格式及命名
UTF-8编码(无BOM)的纯文本文件,扩展名为.txt。
原则上每个数据表生成一个数据文件,文件命名规则是:机构代码-表名对应字符串-YYYYMMDD.txt,其中分隔符“-”为英文短横线(ASCII码0x2D),“YYYYMMDD”为本次/本期采集的截止日期。如中国人保资产管理有限公司报送截至2020年3月31日的机构基本信息表数据时,文件名称应为:
913100007109314916-JGJBXXB-20200331.txt
每一个数据文件要同时生成一个同名的数据校验文件,数据校验文件的编码格式同数据文件,后缀名为.log,数据校验文件需要包含以下5行信息,定义如下:
文件名
文件大小(字节)
文件创建完成时间(YYYY-MM-DD HH:MM:SS)
文件是否正常生成(Y或N)
文件记录数(行数)
例如:
913100007109314916-JGJBXXB-20200331.txt
80896
2020-04-01 00:29:02
Y
25
数据项分隔与特殊字符处理
1.行分隔符:数据文件的一行数据对应一条数据库记录,各行之间分隔符为UNIX样式的换行符(ASCII码0x0A)。
2.数据项分隔符:数据项之间以^A(SOH,ASCII码0x01)进行分隔,每行末尾不需要添加数据项分隔符。
3.数据项首尾禁止使用双引号(ASCII码0x22)包夹,但数据项内容可以有双引号,且不需要进行转义。
4.数据项内子项分隔符:单个数据项中需要填报多个子项内容时,子项内容之间使用英文分号“;”(ASCII码0x3B)隔开。
5.在数据项中不允许出现ASCII码为0x00~0x1F、0x7F的各类控制字符和非可打印字符;若出现则统一替换为空格(ASCII码0x20)。
6.日期格式:YYYYMMDD。
7.以上字符均为英文半角。
空值与默认值处理
对于模型中要求必填的字段,但报送机构确无对应数据的情况,如数据项备注无特殊说明,可暂且按照如下默认值报送:
1.字符类型:
实际业务无需填写该字段时——填写“000000”;
实际业务需要填写,但因某些原因无法填写——填写“N/A”;
2.日期类型——默认值设为99991231;
3.年月类型——默认值设为999912;
4.时间类型——默认值设为99991231000000;
5.数字类型(整型)——默认值设为9999999999;
6.数字类型(小数型)——默认值设为0.0001。
隐私保护说明
涉及个人隐私数据的数据项详见《规范》及其报送说明,由保险资产管理公司在报送前进行脱敏处理,并保留一份未脱敏版本以备核查。
脱敏规则
本《规范》对于隐私数据均在数据项说明栏内做了注解,分为“隐私,暂不取”、“隐私,保险资产管理公司变形”两种情况。
脱敏规则-“隐私,暂不取”
1.个人电话号码
报送默认值“隐私”。
2.出生日期
报送默认值99991231。
脱敏规则-“隐私,保险资产管理公司变形”
1.个人姓名
(1)个人姓名(含自然人关联方、持有人、融资人和员工姓名),作有限暴露方式的脱敏处理,只保留最后一个字或最后一个单词;
(2)账户名称(含账户所属人、持有人账户名称)包含个人姓名的,作有限暴露方式的脱敏处理,只保留最后一个字或最后一个单词;
(3)自然人股东、法定代表人、实际控制人姓名不变形。
2.个人身份证件号码
(1)取个人姓名的第一个汉字(如果姓名是外文,取其UTF-8编码的前3个字节),后接身份证件号码,形成一个字符串(UTF-8编码,以居民身份证号码为例,为21字节);
(2)取上述字符串的SM3杂凑值,为64字节的字符串(小写形式表示)。SM3是GB/T 32905-2016信息安全技术SM3密码杂凑算法中定义的密码杂凑算法;
(3)取身份证件号码UTF-8编码的前6个字节,后接上述SM3杂凑值,得到70字节的字符串,为脱敏的最终值。
例:
姓名:张三,18位公民身份号码:33010219801212031X,变形后:
330102d204dec41ce67f4bb643b8a058fbfdfb0fcc962080c0209242a5bb5d436187c3
姓名:李四,15位公民身份号码:330102801212031,变形后:
330102e1fe0f51290d6a8f1cc2dee8d35aadeaa898e8bab6b6bb1a4416d004fd5c6067
姓名:李四,护照:E12345678,变形后:
E12345737e5c8e7d1d97cb1ecc007a2cb1b09ff42c05addbb0cf8e2cf84c5b40d705cb
3.包含个人身份证件号码的相关编号
若身份证件号码中有英文字母,应先统一转换成大写英文字母,然后将身份证件号码部分用身份证件号码全文UTF-8编码的SM3杂凑值替换,其余部分不变。
涉密信息处理
涉密业务的相关数据不在本《规范》的报送范围内。
数据约束
数据结构备注中主键为监管部门作为唯一性约束的参考条件,含有多个主键的,表示联合主键的参考,并不作为主外键唯一性约束的条件,可根据数据实际使用用途情况做出调整。
数据格式
字符串:若报送数据为字符串,则字符串中不能包含\n、\r、双引号等控制字符和转义字符,且字符串首尾不能包含空格。报送数据若为浮点数,则必须为123.789形式,前后不可补0、补+号。报送数据若为整数,则必须为123456形式,数值前不可补0、补+号,数值后不能带小数点。
外文:若报送数据内容为外文的,除外籍人员姓名、机构名称外,应统一转换成中文后报送。
金额类:金额类数据项如无特殊说明,均以元为单位填报。
数据质量管理
保险资产管理公司是数据质量的责任主体。各公司应当采取必要的措施来保证数据质量。《规范》同步印发的检核规则,只对最基础的格式进行校验,目的是保证数据能正常入库。数据校验通过并不代表所报送的数据没有质量问题。
附件:保险业监管数据标准化规范(保险资产管理公司版)
规范附件1:保险业监管数据标准化规范(保险资产管理公司版)报送说明.docx
规范附件2:保险业监管数据标准化规范(保险资产管理公司版)采集技术接口说明.docx
规范附件3:保险业监管数据标准化规范(保险资产管理公司版)数据结构一览表.xlsx
规范附件4:保险业监管数据标准化规范(保险资产管理公司版)业务代码表.xlsx
规范附件5:保险业监管数据标准化规范(保险资产管理公司版)数据检核规则.xlsx
规范附件6:保险业监管数据标准化规范(保险资产管理公司版)E-R图.jpg
规范正文——保险业监管数据标准化规范(保险资产管理公司版).docx
附件2:保险业监管数据标准化规范(保险资产管理公司版)调整记录-0831.zip