请输入
菜单

保险业监管数据标准化规范〔保险集团(控股)公司版〕 银保监办发〔2022〕119号

标签:EAST监管规范

为提高数字化监管能力,进一步提升监管效能,督促各保险集团(控股)公司主动强化数据治理,持续提升公司治理水平和风险管理能力,银保监会制定了《中国银保监会保险业监管数据标准化规范〔保险集团(控股)公司版〕》(以下简称《规范》)。

数据采集范围和报送时间

      (一)2023年7月15日前,各保险集团(控股)公司应按照《规范》的要求,报送2018年1月1日至2023年6月30日期间的全量标准化监管数据。

      (二)从2023年8月起,各保险集团(控股)公司应按照《规范》的要求,于每月15日前(遇节假日顺延)向监管部门报送前一月的全量、增量及变化量标准化监管数据。监管部门可根据监管工作需求,调整报表报送频度。

工作要求

       (一)各保险集团(控股)公司应高度重视标准化监管数据报送工作,建立工作机制,明确牵头部门,指定专人负责,对照本规范制定接口改造方案,加强实施进度管理,确保按时完成标准化监管数据报送。

       (二)各保险集团(控股)公司应严格落实标准化监管数据质量管理责任,设置标准化监管数据报送电子台账,对报送标准化监管数据的一致性、真实性、及时性负责。银保监会将根据标准化监管数据采集情况,适时组织开展标准化监管数据质量检查。

       (三)各保险集团(控股)公司要以标准化监管数据报送为契机,提升业务数据治理水平,强化业务数据应用,促进公司经营水平和管理能力不断提高。

       (四)标准化监管数据报送路径等相关事宜另行通知。

有关《规范》解释答疑事宜

请中保保险资产登记交易系统有限公司协助做好《规范》印发后的解释答疑工作。

数据来源

       保险集团(控股)公司根据《规范》要求,从本公司相关信息系统中获取数据。如现有信息系统无法满足数据填报需求时,应及时采取措施,完善信息系统建设,并制定具体工作方案计划,以逐步达到数据报送要求。

数据结构

包括 5 个监管主题域、48 张数据表、1179 个数据项。

采集模式

采集模式说明

       数据采集包括集中采集和持续采集两种方式,其中集中采集指保险集团(控股)公司按本《规范》首次集中报送数据,持续采集是每个月 20 日(与通知正文15日报送存在矛盾前报送上个月的数据。

数据表根据性质可以分为状态类和明细类两种。其中明细类包括:处罚信息表、问责信息表、总账会计全科目表、会计凭证信息表、交易流水表、关联交易明细表、风险事件信息表;其他表属于状态类。

       本《规范》定义的各张表在集中采集和持续采集阶段的报送模式详见表清单。

 

首次采集模式

        保险集团(控股)公司首次按本《规范》集中报送数据时,处罚信息表、问责信息表、总账会计全科目表、会计凭证信息表、交易流水表、关联交易明细表、风险事件信息表按照通知定义的时间范围采集具体时间段内所有数据。其他数据表采集时间段内所有发生业务及存续业务在采集截至时间点上的状态,不追溯采集时间段前已结清业务在采集截至时间点上的状态。例如,集中采集时间段为2017年1月1日至2020年12月31日,则2017年到期终止的投资产品应当报送一条状态为“到期终止”的记录,而2016年到期终止的投资产品则不在采集范围内。

采集模式-全量

        全量采集方式同集中采集的全量采集方式,指状态类表本次报送时间范围内所有发生业务及存续业务的全量数据在当期截至时间点上的状态。例如,2021 年 10 月份应报送 2021年 9 月份的数据,则员工信息表需报送 2021 年 9 月底仍在职的员工及 2021 年 9 月期间离职的员工信息,2021 年 8 月已离职的员工不需报送。

采集模式-增量

        报送明细类表在本次报送时间范围内产生的数据。例如,2021 年 10 月份应报送 2021 年 9 月份的数据,则总账会计全科目表需报送会计期间为 2021 年 9 月的所有科目的数据,会计凭证信息表需报送记账日期为 2021 年 9 月 1 日-2021 年 9 月 30日的数据。

采集模式-变化量

        报送状态类表较前一次采集有变更的记录,包括新增、更新、删除,例如机构名称变更则属于变化量数据。其中,“删除”可以理解为报送一条表示状态的数据项值置为“无效”或同等含义的新记录,并以“流水号”(统一社会信用代码+日期(YYYYMMDD)+10 位流水)区分原记录。

采集模式-状态轨迹

        报送状态类表本次报送时间范围内历次变更的记录,例如员工状态在 1 个月内变化了 3 次,则需报送 3 条状态不同的记录。

采集介质

       各保险集团(控股)公司通过符合相应安全要求的专用网络报送数据,该网络应当与互联网物理隔离,数据采集部门应当根据本接口说明,制定传输要求,以确保数据安全不泄露。

数据分层存储

       保险集团(控股)公司在向银保监会及属地银保监局报送数据的同时,应在本地存储一份备份数据。涉及个人隐私数据的数据项,由保险集团(控股)公司在报送前进行脱敏处理,并保留一份未脱敏版本以备核查。

       存至本机构的数据要单独存放、隔离管理,并建立安全可靠的传输通道和保障机制,以支撑银保监会数据调阅与应用。该数据未经银保监会许可,不得删改。

文件格式及命名

       文件格式:UTF-8 编码(无 BOM)的纯文本文件,扩展名为.txt。

       命名规则:原则上每个数据表生成一个数据文件,文件命名规则是:保险集团(控股)公司的统一社会信用代码-表名对应字符串-YYYYMMDD.txt,其中分隔符“-”为英文短横线(ASCII 码 0x2D),“YYYYMMDD”为本次/本期采集的截至日期。如中国人民保险集团股份有限公司报送截至2021年3月31日的机构信息表数据时,文件名称应为:

911000001000237368-JGXXB-20210331.txt

每一个数据文件要同时生成一个同名的数据校验文件,数据校验文件的编码格式同数据文件,后缀名为.log,数据校验文件需要包含以下 5 行信息,定义如下:

文件名

文件大小(字节)

文件创建完成时间(YYYY-MM-DD HH:MM:SS)

文件是否正常生成(Y 或 N)

文件记录数(行数)

例如:

911000001000237368-JGXXB-20210331.txt

80896

2021-04-01 00:29:02

Y

25

数据项分隔与特殊字符处理

      1.行分隔符:数据文件的一行数据对应一条数据库记录,各行之间分隔符为 UNIX 样式的换行符(ASCII 码 0x0A)。

      2.数据项分隔符:数据项之间以^A(SOH,ASCII 码 0x01)进行分隔,每行末尾不需要添加数据项分隔符。

      3.数据项首尾禁止使用双引号(ASCII 码 0x22)包夹,但数据项内容可以有双引号,且不需要进行转义。

      4.数据项内子项分隔符:单个数据项中需要填报多个子项内容时,子项内容之间使用英文分号“;”(ASCII 码 0x3B)隔开。

      5.在数据项中不允许出现 ASCII 码为 0x00~0x1F、0x7F 的各类控制字符和非可打印字符;若出现则统一替换为空格(ASCII 码 0x20)。

      6.日期格式:YYYYMMDD。

      7.以上字符均为英文半角。

小数值、空值与默认值处理

对于模型中要求必填的字段,但报送机构确无对应数据的情况,如数据项备注无特殊说明,可暂且按照如下默认值报送:

1.字符类型:实际业务无需填写该字段时——填写“000000”;

实际业务需要填写,但因某些原因无法填写——填写“N/A”;

2.日期类型——默认值设为 99991231;

3.年月类型——默认值设为 999912;

4.时间类型——默认值设为 99991231000000;

5.数字类型(整型)——默认值设为 9999999999;

6.数字类型(小数型)——默认值设为 0.0001。

隐私保护说明

保险集团(控股)公司在向银保监会及属地银保监局报送数据的同时,应在本地存储一份备份数据。涉及个人隐私数据的数据项,由保险集团(控股)公司在报送前进行脱敏处理,并保留一份未脱敏版本以备核查。

脱敏规则

本《规范》对于隐私数据均在数据项说明栏内做了注解,分为“隐私,暂不取”、“隐私,保险集团(控股)公司变形”两种情况。

脱敏规则-“隐私,暂不取”

对于“隐私,暂不取”数据,报送时按照以下规则进行处理:

1.个人电话号码:报送默认值“隐私”。

2.出生日期:报送默认值 99991231。

脱敏规则-“隐私,保险集团(控股)公司变形”

1.个人姓名:

(1)个人姓名,做有限暴露方式的脱敏处理,只保留最后一个字或最后一个单词;

(2)账户名称包含个人姓名的,做有限暴露方式的脱敏处理,只保留最后一个字或最后一个单词。

(3)自然人股东、法定代表人、实际控制人姓名不变形。

2.个人身份证号码:

(1)取个人姓名的第一个汉字(如果姓名是外文,取其UTF-8编码的前3个字节),后接身份证件号码,形成一个字符串(UTF-8编码,以居民身份证号码为例,为21字节);

(2)取上述字符串的SM3杂凑值,为64字节的字符串(小写形式表示)。SM3是GB/T32905-2016信息安全技术SM3密码杂凑算法中定义的密码杂凑算法;

(3)取身份证件号码UTF-8编码的前6个字节,后接上述SM3杂凑值,得到70字节的字符串,为脱敏的最终值。

3.含个人身份证号码的相关编码:

若身份证件号码中有英文字母,应先统一转换成大写英文字母,然后将身份证件号码部分用身份证件号码全文UTF-8编码的SM3杂凑值替换,其余部分不变。

涉密信息处理

涉密业务的相关数据不在本《规范》的报送范围内。

数据约束

数据结构中“是否主键”为监管部门作为唯一性约束的参考条件,含有多个主键的,表示联合主键的参考,并不作为主外键唯一性约束的条件,可根据数据实际使用用途情况做出调整。

数据格式

字符串:若报送数据为字符串,则字符串中不能包含\n、\r 等控制字符和转义字符,且字符串首尾不能包含空格。报送数据若为浮点数,则必须为 123.789 形式,前后不可补 0、补+号。报送数据若为整数,

则必须为 123456 形式,数值前不可补 0、补+号,数值后不能带小数点。

外文:若报送数据内容为外文的,除外籍人员姓名、机构名称外,应统一转换成中文后报送。

金额类:金额类数据项如无特殊说明,均以元为单位填报。

数据质量管理

保险集团(控股)公司是数据质量的责任主体。各公司应当采取必要的措施来保证数据质量。《规范》同步印发的检核规则,只对最基础的格式进行校验,目的是保证数据能正常入库。数据校验通过并不代表所报送的数据没有质量问题。

附件:中国银保监会保险业监管数据标准化规范〔保险集团(控股)公司版〕

规范附件1:保险业监管数据标准化规范〔保险集团(控股)公司版〕报送说明.pdf

规范附件2:保险业监管数据标准化规范〔保险集团(控股)公司版〕采集技术接口说明.pdf

规范附件3:保险业监管数据标准化规范〔保险集团(控股)公司版〕数据结构一览表.xlsx

规范附件4:保险业监管数据标准化规范〔保险集团(控股)公司版〕业务代码表.xlsx

规范附件5:保险业监管数据标准化规范〔保险集团(控股)公司版〕数据检核规则.xlsx

规范附件6:保险业监管数据标准化规范〔保险集团(控股)公司版〕E-R图.jpg

规范正文:保险业监管数据标准化规范〔保险集团(控股)公司版〕.docx

 

 

分享文章
最近修改: 2023-11-30