一、概述
本文档主要描述依据《保险资管公司支持“五篇大文章”信息登记数据规范》(以下简称《数据规范》)向中保登报送有关数据的形式和有关技术要求,包括数据报送机构、数据报送方式、数据报文要求、数据校验注意事项、数据传输安全措施等。
本文档适用于报送系统有关数据报送机构的运营和技术人员。
二、数据报送机构
数据报送品种和报送机构如下表1所示,报送要求详见《数据规范》。
表1数据报送机构
数据规范 |
主题域 |
子域 |
报送机构 |
《保险资管公司支持“五篇大文章”信息登记数据规范》 |
保险资管公司支持“五篇大文章” |
主题产品 |
保险资产管理机构 |
主题资产 |
保险资产管理机构 |
||
其他 |
保险资产管理机构 |
三、数据报送内容
数据报送内容包括结构化数据和非结构化文件,详见下表2:
表2 数据报送内容
子域 |
结构化数据表 |
非结构化附件 |
报送机构 |
主题产品 |
主题产品信息表 |
- |
保险资产管理机构 |
主题资产 |
主题资产表 |
- |
保险资产管理机构 |
主题资产综合投资收益率情况表 |
- |
保险资产管理机构 |
|
底层企业情况表 |
- |
保险资产管理机构 |
|
底层项目情况表 |
- |
保险资产管理机构 |
|
其他 |
企业年金/职业年金管理情况表 |
- |
保险资产管理机构 |
保险资管公司数字化转型情况表 |
- |
保险资产管理机构 |
四、数据报送方式
(一)报送操作方式
各报送机构应在报送系统中开立操作用户,根据实际发生业务情况在报送系统中分别报送数据。报送系统提供两种数据报送方式,一是逐笔手工录入形式填报;二是以符合要求的数据报文形式批量导入。非结构化附件文件,不支持批量导入,只能在系统中手工上传。
(二)数据报送模式
报送系统数据采集分为初始化采集和持续采集,其中初始化采集指报送机构按有关《数据规范》首次初始化采集报送数据,持续采集每期报送时间根据《数据规范》具体要求。
非结构化附件文件,仅在首次报送时上传,不需重复上传。
结构化数据表根据性质可分为状态类和明细类两种,详见下表3:
表3 数据报送模式定义
数据性质 |
解释说明 |
报送模式编码 |
状态类表 |
报送截至首次初始化采集截止日期,所有存续品种的状态信息 |
A1 |
期末报送所有品种应报期期末最新状态(全量) |
A2 |
|
T+5日内报送新增品种或原有品种发生变更最新状态(增量/变更) |
A3 |
|
明细类表 |
报送截至首次初始化采集日期,所有存续品种存续期间的明细数据 |
B1 |
期末报送所有品种发生在应报期的全部明细数据(增量) |
B2 |
|
T+5日内报送已发生的明细数据(增量) |
B3 |
根据《数据规范》要求,各数据表的报送模式详见下表4:
表4 数据表报送模式
子域 |
数据表名称 |
表类别 |
初始化报送 |
持续报送 |
主题产品 |
主题产品信息表 |
状态类表 |
A1 |
A2 |
主题资产 |
主题资产表 |
状态类表 |
A1 |
A2 |
主题资产综合投资收益率情况表 |
状态类表 |
A1 |
A2 |
|
底层企业情况表 |
状态类表 |
A1 |
A2 |
|
底层项目情况表 |
状态类表 |
A1 |
A2 |
|
其他 |
企业年金/职业年金管理情况表 |
状态类表 |
A1 |
A2 |
保险资管公司数字化转型情况表 |
状态类表 |
A1 |
A2 |
五、数据报文要求
(一)数据报文
数据报文是系统导入数据操作的基本文件单位,具体要求如下:
1.报文组织形式
报文文件按照《数据规范》中同一主题域和批次为一个报文文件,一个报文文件中包含该项下所有数据表的数据文件以及相对应的数据检查文件。
2.报文文件格式
数据报文格式为压缩文件,扩展名为.zip。
3.报文文件命名
命名规则是:机构的统一社会信用代码-主题域编号-YYYYMMDD.zip,其中分隔符“-”为英文短横线(ASCII码0x2D),“YYYYMMDD”为《数据规范》中本次/本期采集的“数据日期”(非报送日期)。如XX资产管理有限责任公司报送截至2024年12月31日的保险资管公司支持“五篇大文章”主题域下各表数据时,文件名称应为:
91XXXXXXXXXXXXXXXP-WPDWZ-20241231.zip
补正报文文件在原有命名规则基础上增加变更报文标识“C”,标识本报文为数据补正报文(补正报文内部的数据文件只能是补正数据文件),并增加本期顺序号,起始001,如:
91XXXXXXXXXXXXXXXP-WPDWZ-C-20241231-001.zip
其中,主题域编号详见《数据规范》中数据结构一览表。
(二)数据文件
数据文件是数据报文中承载各类数据内容的载体,具体要求如下:
1.数据文件格式
UTF-8编码(无BOM)的纯文本文件,扩展名为.txt。
2.数据文件命名
原则上每个数据表生成一个数据文件,文件命名规则是:机构的统一社会信用代码-表编号-YYYYMMDD.txt,其中分隔符“-”为英文短横线(ASCII码0x2D),“YYYYMMDD”为《数据规范》中本次/本期采集的“数据日期”(非报送日期)。如XX资产管理有限责任公司报送截至2024年12月31日的保险资管公司支持“五篇大文章”主题域下,主题产品信息表数据时,文件名称应为:
91XXXXXXXXXXXXXXXP-WPDWZ_A101-20241231.txt
补正数据文件在原有命名规则基础上增加变更报文标识“C”,标识本数据文件内所有数据皆为补正操作数据,如:
91XXXXXXXXXXXXXXXP-WPDWZ_A101-C-20241231.txt
其中,表编号详见《数据规范》中数据结构一览表。
3.文件内容要求
每个数据文件中,每行记录的每个数据项必须按照《数据规范》中规定的数据项顺序排列。
在报送补正报文时,除要求报送所有数据项以外,在每行数据第一个数据项前增加一个数据项,标识本条数据补正方式(填写英文标识):
A:新增
D:删除
M:修改
(三)数据检查文件
每一个数据文件要同时生成一个同名的数据检查文件,数据校验文件的编码格式同数据文件,后缀名为.log,数据检查文件需要包含以下5行信息,定义如下:
文件名
文件大小(字节)
文件创建完成时间(YYYY-MM-DD HH:MM:SS)
数据文件MD5编码(32位)
文件记录数(行数)
例如:
91XXXXXXXXXXXXXXXP-WPDWZ_A101-20241231.txt
80896
2025-01-01 00:29:02
21232f297a57a5a743894a0e4a801fc3
25
(四)数据项分隔与特殊字符处理
1.行分隔符:数据文件的一行数据对应一条数据库记录,各行之间分隔符为UNIX样式的换行符(ASCII码0x0A)。
2.数据项分隔符:数据项之间以^A(SOH,ASCII码0x01)进行分隔,每行末尾不需要添加数据项分隔符。
3.数据项首尾禁止使用双引号(ASCII码0x22)包夹,但数据项内容可以有双引号,且不需要进行转义。
4.数据项内子项分隔符:单个数据项中需要填报多个子项内容时,子项内容之间使用英文分号“;”(ASCII码0x3B)隔开。
5.在数据项中不允许出现ASCII码为0x00~0x1F、0x7F的各类控制字符和非可打印字符;若出现则统一替换为空格(ASCII码0x20)。
6.以上字符均为英文半角。
(五)数据项格式要求
1.报送数据为字符串,则字符串中不能包含\n、\r等控制字符和转义字符,且字符串首尾不能包含空格。
2.报送数据若为浮点数,则必须为123.789形式,前后不可补0、补+号。
3.报送数据若为整数,则必须为123456形式,数值前不可补0、补+号,数值后不能带小数点。
4.要求必填的字段,报送机构确无对应数据的情况,如数据规范无特殊说明,在数据文件中可按照如下方式填写:
(1)字符类型——因某些原因无法填报,数据文件填写“N/A”;
(2)日期类型——因某些原因无法填报,数据文件填写“N/A”;
(3)年月类型——因某些原因无法填报,数据文件填写“N/A”;
(4)时间类型——因某些原因无法填报,数据文件填写“N/A”;
(5)数字类型(整型)——因某些原因无法填报,数据文件填写“9999999999”;
(6)数字类型(小数型)——因某些原因无法填报,数据文件填写“9999999999”。
六、数据校验
(一)数据约束
《数据规范》的数据结构说明中“是否主键”作为唯一性约束的参考条件,含有多个主键的,表示联合主键的参考,并不作为主外键唯一性约束的条件,可根据数据实际使用用途情况做出调整。
(二)数据类型
《数据规范》的数据元说明中规定了每个数据项的数据类型,必须严格按照规定类型填写,如:数值型不可以填字符串等。
(三)非空检查
《数据规范》的数据结构说明中“是否必填”定义每个数据项的填写完整性要求,所有为“是”的数据项必须填写,不能为空。
(四)数据长度
《数据规范》的数据元说明中定义了每个数据项的最大长度或固定长度,所有数据项数据内容不得超过规定长度。
七、数据安全
(一)登录认证安全
报送系统采用机构统一社会信用代码、用户名、密码三级用户身份认证。
(二)数据传输安全
机构须通过专线访问报送系统,并进行数据传输和交互。应急场景可临时申请VPN用户访问。
(三)数据管理安全
机构应加强自身报送数据的管理,保留各期报送数据,以便对监管部门依据数据得出的分析结论或排查工作,做到可以追溯。