国家数据局综合司 公安部办公厅关于印发《全国数据资源统计调查制度》的通知
国数综资源〔2025〕26号
各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门、公安厅(局)及网络与信息安全信息通报机制成员单位,有关中央企业,有关行业协会:
为贯彻落实《数字中国建设整体布局规划》工作部署,进一步摸清全国数据资源底数和发展趋势,我们根据《中华人民共和国统计法》《部门统计调查项目管理办法》相关规定,制定了《全国数据资源统计调查制度》(见附件1),经国家统计局批准(国统制〔2025〕24号),自2025年1月开始实施,有效期3年,现予印发,请遵照执行,并就有关事项通知如下。
一、报送时间和方式
1.本年度全国数据资源统计调查工作开展时间为2025年2月18日至3月14日。调查标准时点为2024年12月31日。
2.按照《全国数据资源统计调查制度》要求,调查对象登录全国数据资源调查平台填报相关调查表,平台地址为https://wenjuan.data-smp.cn,开放时间为每日09:00—19:00。公安部组织定点单位填报调查表,具体工作要求另行通知。
二、有关要求
1.全国数据资源统计调查工作组联合各省级数据管理部门共同组织开展专题培训(见附件2),请各省级数据管理部门、有关中央企业、有关行业协会于2月24日前,传真或电子邮箱反馈工作联系人信息(盖公章,见附件3)。
2.请各单位高度重视,认真履行统计职责,严格按照《中华人民共和国统计法》《全国数据资源统计调查制度》《关于防范和惩治数据资源统计调查造假弄虚作假责任制规定(试行)》有关要求,组织实施好数据资源统计调查工作,压实相关工作人员责任,保证调查数据的真实性、准确性和完整性。各级数据管理部门未经国家数据局授权,不得对外提供、发布统计调查数据。
附件:
全国数据资源统计调查制度
一、总说明
(一)调查目的
贯彻落实《数字中国建设整体布局规划》工作部署,摸清全国数据资源底数,准确、及时、全面反映我国数据资源全貌,为国家分析数据发展趋势,制定促进导向政策和实施行业管理提供依据。
(二)调查对象和统计范围
本制度所称数据是指任何以电子或其他方式对信息的记录。数据资源是指具有价值创造潜力的数据的总称,通常指以电子化形式记录和保存、可机器读取、可供社会化再利用的数据集合。
本制度的调查对象包括合法拥有或控制数据的国家行政机关、事业单位、企业、社会团体等。统计范围为全国(不包括港澳台地区)。主要包括:
1.各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门,公安厅(局)及网络与信息安全信息通报机制成员单位。
2.国家实验室、全国重点实验室、国家科学数据中心等单位。
3.企业包括:
(1)中央企业。
(2)部分银行业金融机构。
(3)数据交易机构。
(4)数据服务方:从事信息传输、软件和信息技术服务业务,开展大数据、人工智能、区块链、云计算、先进存储等数据技术和产品研发应用,主营业务年收入2000万元以上且数据技术和产品研发投入不低于主营业务收入的10%,具有独立法人资格的企业。
(5)数据应用方:主营业务年收入1亿元以上,自建算力中心、数据中心或搭建私有云存储,具有独立法人资格的企业,信息传输、软件和信息技术服务业除外。
4.重点行业协会商会:服务于制造业,信息传输、软件和信息技术服务业等行业的协会商会。
(三)调查内容
本制度主要调查数据资源指标,包括数据生产、存储、计算、流通、应用和安全等内容。
(四)调查频率和时间
本调查制度按报告期别为年报。调查时期为上一年度1月1日—12月31日统计数据。
(五)调查方法
本调查制度采用全面调查与重点调查相结合的方法。
(六)组织实施
本制度由国家数据局统一组织,公安部、金融监管总局共同参与,各地区、各行业、各部门分级实施。
1.国家数据局负责管理各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门,中央企业、重点行业协会商会、数据交易机构、数据服务方和数据应用方企业的数据资源统计调查工作,综合编制、汇总全国数据资源统计资料。其中:
(1)根据国家统计局的“在地统计原则”,各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门负责本行政区域内政府公共数据资源统计报送工作,以及按照数据资源调查工作要求,落实、督促所在地区国家实验室、全国重点实验室、国家科学数据中心、数据交易机构、数据服务方和数据应用方企业报送工作,各被调查对象通过全国数据资源调查平台报送,各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门对数据进行审核,上报国家数据局数据资源司核定。国家实验室名单见附录(一),国家科学数据中心名单见附录(二)。全国重点实验室、数据服务方、数据应用方企业由各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门按照调查范围确定。
(2)各有关中央企业负责本集团数据资源统计报送工作,中央企业总部按照数据资源统计指标,汇总、审核企业总部及各省、自治区、直辖市分公司或子公司数据,通过全国数据资源调查平台报送国家数据局数据资源司。中央企业名单见附录(三)。
(3)各行业协会商会负责行业重点产品数据资源统计报送工作,督促重点企业填报相关产品数据,汇总、审核后通过全国数据资源调查平台报送国家数据局数据资源司。行业协会商会名单见附录(四)。
2.中华人民共和国公安部(以下简称公安部)负责全国数据安全情况统计报送工作,各省、自治区、直辖市及计划单列市、新疆生产建设兵团公安厅(局)负责组织网络与信息安全信息通报机制成员单位统计、填报、审核、汇总本地区数据安全情况数据,上报公安部网络安全保卫局,公安部网络安全保卫局审核、汇总后,报送国家数据局数据资源司。
3.国家金融监督管理总局(以下简称金融监管总局)主要负责金融行业(证券业除外)数据资源的统计报送工作。政策性银行、国有大型商业银行、股份制商业银行将法人机构数据资源调查表报送金融监管总局科技监管司。城市商业银行、农村商业银行、农村合作银行、农村信用社将法人机构数据资源调查表报送所在辖区省监管局(对于核心系统托管在省联社等情形的银行机构,如无法识别独立法人机构数据资源,可由托管机构整体报送调查表,并对包含的机构范围进行说明)。各省监管局审核、汇总辖区机构数据资源调查表后,报送金融监管总局科技监管司。金融监管总局科技监管司审核、汇总数据资源调查表后,报送国家数据局数据资源司。
(七)报送要求
报送时间为次年2月28日前;公安部、金融监管总局审核、汇总各省、自治区、直辖市及计划单列市、新疆生产建设兵团公安厅(局)及网络与信息安全信息通报机制成员单位、金融监管局的统计数据,通过纸质、传真或电子邮件方式报送国家数据局数据资源司;其他统计数据报送方式均通过全国数据资源调查平台(报送网址:https://wenjuan.data-smp.cn)报送。
(八)质量控制
各调查对象应根据硬件设备、系统软件及数据相关业务开展实际情况填报数据,并严格按照表内各项指标审核关系,不符合的应及时修订。
各汇总单位在汇总数据时,应对调查表各项指标进行同比和环比审核,对变化幅度较大的指标,应向填报单位进行核实。对发现错误的,应督促填报单位及时修正。
(九)统计资料公布
通过发布《全国数据资源调查报告》向社会公布有关数据。
(十)统计信息共享
全国数据资源统计调查结果与国家统计局、公安部、金融监管总局等部门依据相关法律规定实现共享,共享责任单位为国家数据局数据资源司,共享责任人为国家数据局数据资源司主管统计工作负责人。
(十一)使用名录库情况
本制度根据国家统计基本单位名录库信息,补充行业管理所需单位名录库信息,建立形成部门统计调查基本单位名录库。贯彻落实《国务院办公厅转发国家统计局关于加强和完善部门统计工作意见的通知》(国办发〔2014〕60号)和《国家统计局关于印发<部门共享国家统计基本单位名录库信息管理暂行办法>的通知》(国统字〔2016〕11号)精神,加强名录库信息互惠共享,减轻企业填报负担,避免重复统计。已获取的企业名录信息,指标自动维护到调查系统中,企业无需重复填报,企业如有变更可更新相关信息。同时,将统计调查中发现的新增、变更和消亡企业信息在调查结束后3个月内反馈国家统计局。
二、报表目录
二、报表目录 |
||||||
报表类型 |
表号 |
表名 |
报告期别 |
统计范围 |
报送单位 |
报送日期及方式 |
一、公共数据调查 |
公共1表 |
公共数据调查机构基本情况 |
年 |
各级数据管理部门 |
各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门 |
次年2月28日前网络填报 |
一、公共数据调查 |
公共2表 |
省级政府公共数据资源调查表 |
年 |
同上 |
同上 |
次年2月28日前网络填报 |
一、公共数据调查 |
公共3表 |
全国数据安全情况调查表 |
年 |
各省、自治区、直辖市及计划单列市、新疆生产建设兵团公安厅(局)及网络与信息安全信息通报机制成员单位 |
公安部 |
次年2月28日前以纸质、传真或电子邮件等形式报送国家数据局 |
一、公共数据调查 |
公共4表 |
金融领域数据资源调查表 |
年 |
政策性银行、国有大型商业银行、股份制商业银行、城市商业银行、农村商业银行、农村合作银行、农村信用社等银行机构 |
金融监管总局 |
次年2月28日前以纸质、传真或电子邮件等形式报送国家数据局 |
二、科学数据调查 |
科学1表 |
国家实验室及全国重点实验室数据资源调查表 |
年 |
国家实验室名单见附录(一)、全国重点实验室 |
国家实验室、全国重点实验室 |
次年2月28日前网络填报 |
二、科学数据调查 |
科学2表 |
国家科学数据中心数据资源调查表 |
年 |
国家科学数据中心名单见附录(二) |
国家科学数据中心 |
次年2月28日前网络填报 |
三、企业数据调查 |
企业1表 |
调查企业基本情况 |
年 |
全部被调查企业 |
全部被调查企业 |
次年2月28日前网络填报 |
三、企业数据调查 |
企业2表 |
中央企业数据资源调查表 |
年 |
中央企业名单见附录(三) |
中央企业 |
次年2月28日前网络填报 |
三、企业数据调查 |
企业3表 |
数据交易机构数据资源调查表 |
年 |
数据交易机构 |
数据交易机构 |
次年2月28日前网络填报 |
三、企业数据调查 |
企业4表 |
数据服务方数据资源调查表 |
年 |
从事信息传输、软件和信息技术服务业务,开展大数据、人工智能、区块链、云计算、先进存储等数据技术和产品研发应用,主营业务年收入2000万元以上且数据技术和产品研发投入不低于主营业务收入的10%,具有独立法人资格的企业 |
各被调查数据服务方企业 |
次年2月28日前网络填报 |
三、企业数据调查 |
企业5表 |
数据应用方数据资源调查表 |
年 |
主营业务年收入1亿元以上,自建算力中心、数据中心或搭建私有云存储,具有独立法人资格的企业,信息传输、软件和信息技术服务业除外 |
各被调查数据应用方企业 |
次年2月28日前网络填报 |
三、企业数据调查 |
企业6表 |
重点行业产品数据资源调查表 |
年 |
行业协会商会名单见附录(四) |
行业协会商会 |
次年2月28日前网络填报 |
四、主要指标解释
(一)公共数据调查机构基本情况(公共1表)
1.统一社会信用代码(18位):指按照《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》(国发〔2015〕33号)规定,由赋码主管部门给每一个法人单位和其他组织颁发的在全国范围内唯一的、终身不变的法定身份识别码。已经领取统一社会信用代码的法人单位和产业活动单位必须填写统一社会信用代码,无需填写组织机构代码。在填写时,要按照《营业执照》(证书)上的统一社会信用代码填写。
2.单位详细名称:企业以年末的企业名称为准,原则按企业公章的详细名称填写,不要填写简称。凡企业名称更名,而公章暂未换的,可用旧公章代替,但必须在本栏内予以说明。凡企业有几个厂名和公章的,应该在第一名称后填写第二厂名或第三厂名。军工保密企业的“企业名称”应填报本厂的第二名称(即可公开的厂名),不得直接填写保密厂名(即企业番号)。
3.单位所在地区划及详细地址:指单位主要经营地所处的详细地址。所有单位均填写本项。要求写明单位主要经营地所在的省(自治区、直辖市)、地(市、州、盟)、县(市、区、旗)、乡(镇、街道)、村(居)委会以及具体街(路)的名称和详细的门牌号码,不能填写通讯号码或通讯信箱号码。
4.联系方式:包括固定电话、移动电话、传真电话和邮政编码等能够与单位取得联系的信息。所有单位均填写本项。电话号码以填写固定电话号码为主,对于确实没有固定电话号码的单位,可以填写主要负责人的移动电话号码。
5.是否开展公共数据授权运营:是指报告期末是否存在公共数据的授权运营行为,填写是或者否。其中,公共数据是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。
6.公共数据授权运营机构名称:是指报告期末被官方或者拥有特定权利的机构正式授权,签订了公共数据授权运营协议,可以进行公共数据授权运营活动的单位或组织的官方称谓。
7.公共数据授权运营机构性质:是指报告期末签订了公共数据授权运营协议的不同运营机构的性质,包括央企、国企(非央企)、民企、数据交易机构、其他。
8.公共数据授权运营服务行业:是指公共数据授权运营所服务的行业类型,按国民经济行业大类,可填多个。
9.是否在政务场景开展AI技术的应用:是指报告期末政府机关或公共部门在进行日常管理和服务工作过程中,是否应用人工智能(AI)技术。
10.是否已经开展了本地区数据资源调查工作:是指本单位是否在本地区开展与数据资源调查相关的工作,如对辖区内重点企业、公共服务机构等开展数据资源调查等,请简要填写调查工作内容和成果。
(二)省级政府公共数据资源调查表(公共2表)
一、数据存储
1.数据存储总空间:是指报告期末所有可用的数据存储空间,包括本地存储和云存储的空间总和。计量单位:TB。
2.数据存储总量:是指报告期末包括原始数据所有备份数据在内的,在本地、云端等实际存储的数据总量。计量单位:TB。
云存储总量:是指报告期末存储在云端的数据总量。计量单位:TB。
备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
结构化数据存储总量:是指报告期末存储的结构化数据总量,其中,结构化数据是指一种数据的表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
物联感知数据存储总量:是指报告期末通过物联传感设备采集、捕获的数据总量,包含监控、摄像等类型数据。计量单位:TB。
3.冷数据占比:是指一年未访问的数据,如:企业备份数据、业务与操作日志数据、订单管理等一年不被访问的数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
二、数据流通
4.数据开放总量:是指报告期末对外公开、无专利或版权等限制,可自由访问和使用的数据总量。计量单位:TB。
5.开放数据集总数:是指报告期末对外开放共享的数据集数量,数据集是指资料集、数据集合或资料集合,是一种由数据所组成的集合。计量单位:个。
占全部数据集比例:是指报告期末开放数据集总数占总数据集的比例。计量单位:%。
数据集平均下载次数:是指报告期末所有开放数据集平均被下载的次数。计量单位:次。
6.申请共享的数据集数量:是指报告期末提出申请共享的数据集的数量。计量单位:个。
驳回申请的数据集数量:是指报告期末在提出申请共享的数据集中,被驳回的数量。计量单位:个。
7.公共数据授权运营数据总量:是指报告期末在公共数据授权运营过程中,被授权运营方所获得的数据总量。计量单位:TB。
8.公共数据授权运营收入:是指报告期末单位将公共数据授权给特定的企业或组织而形成的经济利益流入。计量单位:万元。
9.签订公共数据授权运营协议的运营机构总数:是指报告期末签订了公共数据授权运营协议的不同运营机构的总数。其中,运营机构是指按照规范程序获得授权,针对授权范围内的公共数据资源开展开发运营活动的法人组织。计量单位:个。
10.公共数据授权运营机构交付的数据产品数量:是指报告期末公共数据授权运营机构提供的基于数据加工形成的,可满足特定需求的数据加工品和数据服务总数。计量单位:个。
11.数据资源目录数:是指报告期末按照一定的分类方法,对数据资源进行排序、编码、描述后,所形成的目录条目的数量。其中,数据资源是指具有使用价值的数据,是可供人类利用的新型资源。如电子文件、电子表格、数据库、图形图像等。计量单位:个。
12.纳入全国一体化政务服务平台管理的政务服务事项数量:是指报告期末纳入全国一体化政务服务平台管理的政务服务事项数量。计量单位:个。
三、数据应用
13.公共数据服务产品数量:是指报告期末应用公共数据所开发的数据产品或服务数量。其中,公共数据是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。数据产品或服务,是指基于数据加工形成的,可满足特定需求的数据加工品或数据服务。计量单位:个。
移动APP数量:是指运行在Android/IOS等系统中的移动应用程序(APP)数量。计量单位:个。
日均使用次数:是指上述移动APP一天24小时内平均的使用次数。计量单位:次。
小程序数量:是指能够嵌入到支付宝、微信等平台或应用中的微型应用程序的数量。计量单位:个。
日均使用次数:是指上述小程序一天24小时内平均的使用次数。计量单位:次。
web应用数量:是指可以通过web浏览器访问的应用程序数量。计量单位:个。
日均点击次数:是指上述web应用一天24小时内平均的使用次数。计量单位:次。
(三)全国数据安全情况调查表(公共3表)
1.已备案网络系统总数:是指报告期末已经完成备案流程并记录在案的网络系统的总数。计量单位:个。
2.处理重要数据的网络系统数量:是指负责处理或存储重要数据的网络系统总数。其中,重要数据是指特定领域、特定群体、特定区域或达到一定精度和规模的,一旦被泄露或篡改、损毁,可能直接危害国家安全、经济运行、社会稳定、公共健康和安全的数据。仅影响组织自身或公民个体的数据一般不作为重要数据。计量单位:个。
3.处理核心数据的网络系统数量:是指负责处理或存储核心数据的网络系统总数。其中,核心数据是指对领域、群体、区域具有较高覆盖度或达到较高精度、较大规模、一定深度的,一旦被非法使用或共享,可能直接影响政治安全的重要数据。核心数据主要包括关系国家安全重点领域的数据,关系国民经济命脉、重要民生、重大公共利益的数据,经国家有关部门评估确定的其他数据。计量单位:个。
4.数据安全相关案件数量:是指与数据安全有关的案件总数。计量单位:个。
(四)金融领域数据资源调查表(公共4表)
一、数据采集汇聚
1.银行数据年度生产总量:是指报告期末银行通过硬件设备/软件系统直接采集、生成,或以共享、采购外部数据等形式产生的数据的年度总量,含数据备份。计量单位:TB。
业务经营中收集和产生的数据总量:是指报告期末在日常商业活动时所累积和生成的数据总量,如客户信息、产品信息、服务信息、市场分析、财务报表、交易数据等。计量单位:TB。
通过共享获取到的数据总量:是指报告期末通过免费共享、采购等方式获取的外部数据总量。计量单位:TB。
通过互联网获取的公开数据总量:是指报告期末通过互联网能够访问和收集到的不涉及隐私或保密信息的公开数据总量。计量单位:TB。
2.与上年相比,数据同比增长:是指与上一年相比数据生产总量的同比增幅。计量单位:%。
3.预计下一年数据总规模:是指对下一年数据生产总量的预测。计量单位:TB。
二、数据存储情况
4.数据存储总空间:是指报告期末所有可用的数据存储空间,包括本地存储和私有云存储的空间总和。计量单位:TB。
5.数据存储总量:是指报告期末在本地或私有云等实际存储的数据总量,含备份数据。计量单位:TB。
结构化数据存储总量:是指所有存储数据中以表格、数据库或其他可编程形式的数据总量,这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
原始数据存储总量:是指报告期末所有经业务系统直接生成且未加工数据的存储总量。计量单位:TB。
6.云存储总量:是指记录和保存在私有云端的数据总量。计量单位:TB。
7.备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
8.冷数据占比:是指一年未访问的数据总量,在数据存储总量中的占比。其中,冷数据如企业备份数据、业务与操作日志数据、订单管理等一年不被访问的数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
三、数据计算情况
9.算力规模:是指组织为执行计算密集型任务(如数据分析、人工智能计算等)而自行构建的计算能力的大小,包括GPU、CPU等算力。计量单位:TFLOPS。
智能计算服务器占比:智能计算服务器是指提供高强度AI计算能力的服务器,如机器学习、深度学习等AI模型的训练和推理等。占比计算方法为智能计算服务器的数据存储空间总量/所有服务器的数据存储空间总量。计量单位:%。
四、数据管理能力
10.数据标准化程度:主要指通过不同格式、尺度或者单位的数据转换到一个共同的标准,被统一化、规范化、标签化的数据规模占数据存储总量比例。计量单位:%。
11.数据质量问题闭环率:已发现并成功解决的数据质量问题占总发现问题的比例。计量单位:%。
五、数据开发利用
12.数据工程师投入:是指从事数据架构、数据存储、数据处理,以及数据维护等工作的专业人员投入,包含购买第三方工程师投入。计量单位:人月。
13.数据技术投入:是指企业在数据开发利用过程中的支出总额,如大数据采集、处理、分析、挖掘、管理等领域的技术研究、产品开发等投入。计量单位:万元。
14.大模型数量:是指参数规模达亿级以上的大模型数量。计量单位:个。
15.大模型数据集数据总量:是指大模型在训练过程中用到的数据集的数据总量。计量单位:TB。
六、数据流通交互
16.数据交互总量:是指报告期末企业与外部实体间传输和交换的数据总量。计量单位:TB。
17.数据接入总量:是指从外部平台、系统接入到企业软件系统的数据总量。计量单位:TB。
18.数据采购总量:是指购买外部数据总量。计量单位:TB。
数据采购费用:是指购买外部数据发生的费用。计量单位:万元。
19.数据流出总量:是指本企业软件系统向其他平台、系统以及监管报送等流出的数据总量。计量单位:TB。
七、数据安全防护
20.数据安全技术投入:是指为了保护数据不受未授权访问、泄露、篡改、丢失或破坏等威胁,进行的各种技术性支出。计量单位:万元。
(五)国家实验室及全国重点实验室数据资源调查表(科学1表)
1.数据生产总量:是指报告期末国家实验室及全国重点实验室在从事科研活动中生成、收集、购买和复制等过程中产生的科研数据总量,包括设备设施运行产生的数据、系统软件生成的数据、交互/交易获取的数据。其中,含当年产生但未存储的过程数据、测试数据等。计量单位:TB。
2.数据存储总量:是指报告期末包括原始数据所有备份数据在内的,在本地、云端等实际存储的数据总量。计量单位:TB。
原始数据存储总量:是指报告期末所有原始数据的存储总量。其中,原始数据是指初次产生或源头收集的、未经加工处理的数据。计量单位:TB。
衍生数据存储总量:是指报告期末从原始数据中通过一系列处理、分析或计算过程得到的新数据的总量。计量单位:TB。
备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
结构化数据存储总量:是指报告期末存储的结构化数据总量,其中,结构化数据是指一种数据的表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
3.云存储总量:是指报告期末存储在云端的数据总量。计量单位:TB。
4.数据边缘设备存储总量:是指在科学研究活动中,使用在网络边缘位置(靠近数据源头的一侧)部署的计算设备进行数据存储的总容量。计量单位:TB。
5.数据终端设备存储总量:是指在科学研究活动中,使用在终端部署的计算设备进行数据存储的总容量。计量单位:TB。
6.冷数据占比:是指一年未访问的数据,如备份的科研数据、科研系统日志数据等统计数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
7.开放数据集总数:是指报告期末对外开放共享的科研数据集数量。计量单位:个。
8.开放数据总量:是指报告期末对外公开、无专利或版权等限制,可供自由访问和使用的数据总量。计量单位:TB。
9.自建算力规模:是指组织为执行计算密集型任务(如数据分析、人工智能计算等)而自行构建的计算能力的大小,包括GPU、CPU等算力。计量单位:TFLOPS。
10.租用算力规模:是指组织为执行计算密集型任务(如数据分析、人工智能计算等)而租用第三方机构计算能力的大小,包括GPU、CPU等算力。计量单位:TFLOPS。
11.自建大模型数量:是指国家实验室及全国重点实验室搭建的参数规模达亿级以上的大模型数量。计量单位:个。
12.AI投入金额:是指报告期末国家实验室及全国重点实验室在人工智能(AI)相关技术开发、应用等环节进行的资金投入金额。计量单位:万元。
13.用于AI计算的数据集数据总量:是指报告期末国家实验室及全国重点实验室供给人工智能(AI)系统开发、训练和测试过程使用的数据集合的数据量。计量单位:TB。
(六)国家科学数据中心数据资源调查表(科学2表)
一、数据存储
1.数据存储总空间:是指报告期末所有可用的数据存储空间,包括本地存储和云存储的总和。计量单位:TB。
2.数据存储总量:是指报告期末使用数据库、服务器、云存储等方式存储的数据总量。包括原始数据所有备份数据在内的,在本地、云端等实际存储的数据总量。计量单位:TB。
原始数据存储总量:是指报告期末所有原始数据的存储总量。其中,原始数据是指初次产生或源头收集的、未经加工处理的数据。计量单位:TB。
备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
项目汇交数据存储总量:是指报告期内通过科研项目或数据汇交计划产生,科研人员或项目团队按照相关规定和标准,将科研过程中产生的科学数据整理、提交到指定的科学数据中心的数据总量。计量单位:TB。
云存储总量:是指报告期末存储在云端的数据总量。计量单位:TB。
结构化数据存储总量:是指报告期末存储的结构化数据总量,其中,结构化数据是指一种数据的表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
3.冷数据占比:是指一年未访问的数据,如备份的科研数据、科研系统日志数据等统计数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
二、数据流通
4.接入国外数据集数据总量:是指报告期末国家科学数据中心接入的来自国外的数据集的数据总量。计量单位:TB。
5.开放数据总量:是指报告期末对外公开、无专利或版权等限制,可供自由访问和使用的数据总量。计量单位:TB。
跨境开放数据总量:是指报告期末在总开放数据中跨越国界、在全球范围内开放共享的数据总量。计量单位:TB。
6.开放数据集总数:是指报告期末对外开放共享的数据集数量。计量单位:个。
7.平均每日接收数据总量:是指报告期内国家科学数据中心平均每日接收到的数据总量。计量单位:TB。
8.平均每日分发数据总量:是指报告期内国家科学数据中心平均每日向外部用户或系统分发的数据总量。计量单位:TB。
9.数据中心网站年访问次数:是指报告期末国家科学数据中心官网平台年度总访问次数。计量单位:次。
三、数据应用
10.数据产品/服务数量:是指国家科学数据中心所提供的数据产品或服务的总数。其中,数据产品或服务,是指基于数据加工形成的,可满足特定需求的数据加工品或数据服务。计量单位:个。
支撑科研项目数量:是指国家科学数据中心支撑科研项目的数量,包括科学数据中心主持或参与的项目总和。计量单位:个。
服务国家和地区数量:是指国家科学数据中心提供的产品及服务覆盖的国家和地区总数。计量单位:个。
服务行业数量:是指国家科学数据中心提供的产品及服务覆盖的行业数量,行业分类以国民经济行业分类为标准。计量单位:个。
服务企业数量:是指国家科学数据中心所提供的产品与服务所触及的企业数量,统计层级限于集团层面,集团旗下的子公司或分公司则不纳入此统计范畴之内。计量单位:个。
11.为大模型提供的数据总量:是指报告期内为大模型提供的数据总量,包括国家科学数据中心自建大模型以及其他企业或机构的大模型。计量单位:TB。
(七)调查企业基本情况(企业1表)
1.统一社会信用代码(18位):指按照《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》(国发〔2015〕33号)规定,由赋码主管部门给每一个法人单位和其他组织颁发的在全国范围内唯一的、终身不变的法定身份识别码。已经领取统一社会信用代码的法人单位和产业活动单位必须填写统一社会信用代码,无需填写组织机构代码。在填写时,要按照《营业执照》(证书)上的统一社会信用代码填写。
2.单位详细名称:企业以年末的企业名称为准,原则按企业公章的详细名称填写,不要填写简称。凡企业名称更名,而公章暂未换的,可用旧公章代替,但必须在本栏内予以说明。凡企业有几个厂名和公章的,应该在第一名称后填写第二厂名或第三厂名。军工保密企业的“企业名称”应填报本厂的第二名称(即可公开的厂名),不得直接填写保密厂名(即企业番号)。
3.单位所在地区划及详细地址:指单位主要经营地所处的详细地址。所有单位均填写本项。要求写明单位主要经营地所在的省(自治区、直辖市)、地(市、州、盟)、县(市、区、旗)、乡(镇、街道)、村(居)委会以及具体街(路)的名称和详细的门牌号码,不能填写通讯号码或通讯信箱号码。
4.行业类别:指根据其从事的社会经济活动性质对各类单位进行的分类。本项分两部分填写。
主要业务活动:指企业为完成经营目标而从事的日常业务活动中的主要活动。所有单位均填写本项。
行业代码:调查单位免填。由所在地普查机构根据各单位填写的主要业务活动,对照《国民经济行业分类》(GB/T4754-2017)填写行业代码(未做特殊规定的填写行业小类代码,下同)。
5.单位规模:根据《统计上大中小微型企业划分办法(2017)》规定,依据从业人员、营业收入、资产总额等指标或替代指标将单位划分为大型、中型、小型和微型。
6.从业人员期末人数:指年度最后一日在本单位工作,并取得工资或其他形式劳动报酬的人员数。该指标为时点指标,不包括最后一日当天及以前已经与单位解除劳动合同关系的人员,是在岗职工、劳务派遣人员及其他从业人员之和。其中不包括离开本单位仍保留劳动关系,并定期领取生活费的人员和在单位实习的各类在校学生。此指标为从后续表摘抄指标,调查单位免填。
7.营业收入:指企业从事销售商品、提供劳务和让渡资产使用权等生产经营活动形成的经济利益流入。包括“主营业务收入”和“其他业务收入”。根据会计“利润表”中“营业收入”项目的本年累计数填报。此指标为从后续表摘抄指标,调查单位免填。
8.主营业务收入:指企业经营主要业务所实现的收入。如果会计“利润表”列示“主营业务收入”项目,则根据其本年累计数填报;或者,根据会计“主营业务收入”科目的本年各月贷方余额(结转前)之和填报,如未设置该科目,以“营业收入”代替填报。此指标为从后续表摘抄指标,调查单位免填。
9.资产总计:指企业过去的交易或者事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源。包括企业拥有的土地、办公楼、厂房、机器、运输工具、存货等实物资产和现金、存款、应收账款和预付账款等金融资产。资产一般按流动性(资产的变现或耗用时间长短)分为流动资产和非流动资产。其中流动资产可分为货币资金、交易性金融资产、应收票据、应收账款、预付款项、其他应收款、存货等;非流动资产可分为长期股权投资、固定资产、无形资产及其他非流动资产等。根据会计“资产负债表”中“资产总计”项目的期末余额数填报。此指标为从后续表摘抄指标,调查单位免填。
10.营业利润:指企业从事生产经营活动所取得的利润。执行《企业会计准则》或《小企业会计准则》的企业,根据会计“利润表”中“营业利润”项目的本年累计数填报;执行《企业会计制度》的企业,根据会计“损益表”中“营业利润”项目、“投资收益”项目的本年累计数之和填报。此指标为从后续表摘抄指标,调查单位免填。
11.法定代表人(单位负责人):指企业法定代表人。企业按《企业法人营业执照》填写。如有特殊原因可填企业现负责人。
12.开业(成立)时间:指企业向工商行政管理部门进行登记、领取法人营业执照的时间。企业填写本栏“企业开业时间”时应注意①筹建企业免填;②1949年以前成立的企业填写最早开业时间;③合并或兼并的企业,按合并前主要企业的最早开业时间填写;④分立企业按分立后各自领取法人营业执照的时间填写;⑤与外方(含港、澳、台)合资企业,按合资企业所领取营业执照的时间填写。
13.联系方式:包括固定电话、移动电话、传真电话和邮政编码等能够与单位取得联系的信息。所有单位均填写本项。
电话号码以填写固定电话号码为主,对于确实没有固定电话号码的单位,可以填写主要负责人的移动电话号码。
14.机构类型:分为企业、事业单位、机关、社会团体、民办非企业单位、基金会、居委会、村委会、农民专业合作社、农村集体经济组织和其他组织机构。所有单位均填写本项。
企业:包括(1)领取《企业法人营业执照》(或新版《营业执照》)的各类企业法人;(2)个人独资企业、合伙企业;(3)领取《营业执照》的企业法人分支机构或经营单位,个人独资企业和合伙企业的分支机构;(4)未经有关部门批准但实际从事生产经营活动且符合产业活动单位条件的企业法人的组成部分。
事业单位:包括(1)经机构编制部门批准成立和登记或备案,领取《事业单位法人证书》,取得法人资格的单位;(2)事业法人单位的本部及分支机构或派出机构。
机关:包括国家权力机关、国家行政机关、国家监察机关、司法机关、政党机关、政协组织和其他机关法人;机关法人单位的本部,以及国家权力机关分支机构、国家行政机关分支或派出机构、监察机关分支机构、人民法院分支机构、人民检察院分支机构等。
(1)国家权力机关:指全国人民代表大会及其常务委员会、地方各级人民代表大会及其常务委员会和办事机构。
(2)国家行政机关:指国务院和地方各级人民政府及其工作部门,以及地区行政行署。
(3)国家监察机关:指行使监察职能的机关。
(4)国家司法机关:指国家审判机关和检察机关。
(5)政党机关:指中国共产党各级机关和所属办事机构、各民主党派各级机关和办事机构。
(6)政协组织:指中国人民政治协商会议全国委员会和地方各级委员会及其办事机构。
社会团体:指中国公民自愿组成,为实现会员共同意愿,按照其章程开展活动的非营利性社会组织。包括(1)经各级民政部门核准登记,领取《社会团体法人登记证书》的各类社会团体;(2)由各级机构编制管理部门直接管理其机构编制的群众团体;(3)经国务院批准可以免于登记的社会团体。
民办非企业单位:指企业单位、事业单位、社会团体和其他社会力量以及公民个人利用非国有资产举办的,从事非营利性社会服务的社会组织。民办非企业法人指经各级民政部门核准登记,领取《民办非企业单位登记证书》的民办非企业单位。
基金会:指民政部门核准登记的,颁发《基金会法人登记证书》的基金会。
居民委员会:由不设区的市、市辖区的人民政府决定设立的社区(居委会)。
村民委员会:由乡、民族乡、镇的人民政府提出,经村民会议讨论同意后,报县级人民政府批准,设立的村民委员会。
农民专业合作社:指以农村家庭承包经营为基础,通过提供农产品的销售、加工、运输、贮藏以及与农业生产经营有关的技术、信息等服务来实现成员互助目的的组织。包括(1)经各级市场监管部门核准登记,领取《农民专业合作社法人营业执照》或新版《营业执照》的农民专业合作社法人,领取新版《营业执照》的农民专业合作社联合社法人;(2)经各级市场监管部门核准登记的农民专业合作社(或农民专业合作社联合社)分支机构。
农村集体经济组织:在农村双层经营体制下,耕地、河道、灌溉设施等生产资料集体所有,合作经营、民主管理、服务村民的经济组织,主要是由原人民公社(现乡、镇)、生产大队(现村)、生产队(现村民组)建制经过改革、改造、改组形成的合作经济组织,包括经济联合总社、经济联合社、经济合作社、股份合作经济联合总社、股份合作经济联合社、股份合作社等。农村集体经济组织的设立需经县级及以上农业行政主管部门审核,颁发登记证书或证明书。
其他组织机构:指除企业、事业单位、机关、社会团体、民办非企业单位、基金会、居民委员会、村民委员会、农民专业合作社和农村集体经济组织以外的其他符合法人和产业活动单位条件的机构。包括律师事务所、基层法律服务机构和各类宗教活动场所等。
15.是否为央企子公司:是指被调查企业是否为中央企业作为母公司下设的具有独立法人资格的公司。
16.企业数据应用场景:是指企业应用数据的主要场景,包含研发创新、运营管理、生产优化、产品及客户服务、供应链优化、产业协同和风险预测。
17.数据资源入表科目:是指报告期末各种数据录入到会计报表中的会计科目,可选择存货、无形资产、开发支出。
18.是否开发AI产品:是指报告期末企业是否进行人工智能产品(AI)的研发,填写是或者否。
19.AI开发瓶颈:是指报告期末企业在人工智能(AI)技术发展和应用过程中遇到的限制因素或难以克服的技术难题。
20.AI产品主要应用形式:是指报告期末企业对外提供的人工智能(AI)技术在实际产品中的具体应用方式和形态。包括APP、网页、小程序、API、插件等形式,其他须注明。
21.企业未来需要加强数据应用的哪些能力:是指企业在未来加强数据应用时,为确保能够高效、安全、创新地利用数据资源,需要关注并提升的能力。如数据采集、数据处理、数据安全、数据创新应用等方面的能力。
22.企业在数据应用方面的瓶颈:是指报告期末企业在数据应用过程中遇到的限制因素或难以克服的技术难题。
23.企业数据管理能力成熟度等级(DCMM):是指取得评估企业在数据管理方面的能力和成熟度的认证,该认证共分为5个等级,从低到高分别为初始级、受管理级、稳健级、量化管理级和优化级。
(八)中央企业数据资源调查表(企业2表)
产品数据情况
一、产品销售及保有情况
1.产品全国销售量:是指报告期末企业生产的设备在全国的销售量。计量单位:台。
2.31省销售量:是指报告期末企业生产的设备分别在31个省的销售量。计量单位:台。
3.产品全国保有量:是指截至本年年底,企业生产的设备仍在正常使用的数量。计量单位:台。
二、产品数据生产情况
4.产品满负荷运行日均产生数据总量:是指报告期末企业生产的设备在满负荷运行下一天24小时产生的数据总量。计量单位:TB。
5.产品出厂后年均运行时长:是指报告期末企业销售的设备在应用企业年均运行时长。计量单位:天。
三、产品数据存储空间情况
6.产品平均存储空间:是指报告期末企业生产的设备的平均存储总空间。计量单位:TB。
7.产品平均存储空间利用率:是指报告期末企业生产的所有设备的平均存储空间利用率。计量单位:%。
四、产品性能与服务
8.主要产品平均使用年限:是指报告期末企业生产的主要设备产品的平均使用年限。计量单位:年。
9.具备联网功能的产品比例:是指报告期末企业生产的所有设备中具备联网功能的产品比例。计量单位:%。
10.能够提供远程运维服务的产品比例:是指报告期末企业生产的设备中具备远程运维功能或能够提供远程运维服务的产品所占的比例。计量单位:%。
企业数据情况
一、数据汇聚
11.设备设施采集数据总量:是指报告期末通过各类设备设施(如路由器、交换机、监控设备等)收集、采集到的数据信息的总量。计量单位:TB。
12.物联传感生产数据总量:是指报告期末通过物联传感设备(如激光扫描器、红外感应器、温度传感器、振动传感器等)采集、捕获的数据总量。计量单位:TB。
13.系统/软件生成数据总量:是指报告期末系统或软件通过创建、生成、备份等行为产生的数据总量。计量单位:TB。
14.数据存储总空间:是指报告期末所有可用的数据存储空间,包括本地存储和云存储的总和,不包含作为云服务商提供给其他企业或个人的数据存储空间。计量单位:TB。
15.数据存储总量:是指报告期末企业使用数据库、服务器、云存储等方式存储的数据总量。包括原始数据所有备份数据在内的,在本地、云端等实际存储的数据总量,不包含作为云服务商存储的其他企业或个人的数据。计量单位:TB。
研发设计数据总量:是指报告期末研发设计过程中产生的数据存储总量。计量单位:TB。
测试实验数据总量:是指报告期末测试实验过程中产生的数据存储总量。计量单位:TB。
生产制造数据总量:是指报告期末企业生产制造过程中产生的数据存储总量。计量单位:TB。
经营管理数据总量:是指报告期末企业经营管理过程中产生的数据存储总量。计量单位:TB。
运行维护数据总量:是指报告期末企业运行维护过程中产生的数据存储总量。计量单位:TB。
供应链服务数据总量:是指报告期末企业供应链服务过程中产生的数据存储总量。计量单位:TB。
安全能耗数据总量:是指报告期末企业按照要求或规定向政府提供的涉及安全生产、节能减排的数据总量。计量单位:TB。
16.原始数据存储总量:是指报告期末所有原始数据的存储总量。其中,原始数据是指初次产生或源头收集的、未经加工处理的数据。计量单位:TB。
17.衍生数据存储总量:是指报告期末从原始数据中通过一系列处理、分析或计算过程得到的新数据的总量。计量单位:TB。
18.备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
19.结构化数据存储总量:是指报告期末存储的结构化数据总量,其中,结构化数据是指一种数据的表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
20.云存储总量:是指报告期末本企业存储在云端的数据总量,不包含作为云服务商存储的其他企业或个人的数据。计量单位:TB。
公有云存储总量:是指报告期末存储在公有云的数据总量。计量单位:TB。
21.冷数据占比:是指一年未访问的数据,如企业备份数据、业务与操作日志数据、订单管理等统计数据,不包含作为云服务商存储的其他企业或个人的数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
二、数据开发
22.行业模型数据总量:是指报告期末专注于特定行业或应用领域的机器学习、深度学习等人工智能模型在开发、测试、优化等过程中所使用的数据总量。计量单位:TB。
行业大模型数据总量:是指报告期内参数规模达亿级以上的大模型在开发、测试、优化等过程中所使用的数据总量。计量单位:TB。
复用频率:是指报告期末上述模型周均使用频率。计量单位:次/周。
用户数量:是指报告期末上述模型注册使用的用户数量。计量单位:个。
23.数据开发工具数量:是指报告期内进行数据获取、处理和管理过程中所用到的工具,如数据模型化工具、数据可视化工具等。计量单位:个。
24.企业算力规模:是指报告期末单位为执行计算密集型任务(如数据分析、人工智能计算等)而构建的计算能力的规模,包括GPU、CPU等算力。计量单位:TFLOPS。
智能计算服务器占比:智能计算服务器占比计算方法为智能计算服务器的数量/所有服务器的数量。其中,智能计算服务器是指提供高强度AI计算能力的服务器,如机器学习、深度学习等AI模型的训练和推理等。计量单位:%。
25.开发者数量:是指报告期末企业外为使用模型而注册的开发者总量。计量单位:个。
日活跃数量:是指每日应用、开发模型的用户数量。计量单位:个。
企业AI技术研发者数量:是指报告期末企业内从事AI技术研发工作的人员总量。计量单位:个。
26.数据技术投入:是指报告期末企业在数据采集、存储、应用、流通等过程中的技术投入。如数据采集系统投入等。计量单位:万元。
AI技术投入:是指报告期末企业在人工智能(AI)领域进行研究与开发等过程中的资金投入。计量单位:万元。
三、数据流通
27.与外部交互的数据总量:是指报告期末与企业外部在日常运营等活动中进行数据交换的总量。包括客户、供应商、合作伙伴、政府机构以及其他组织等。数据交互可以通过网络通信、文件共享、在线交易等多种形式进行。其中,数据交互是指主体之间以数据的形式进行交流和协作的过程。计量单位:TB。
政府及公共服务机构数据交互量:是指报告期末企业与政府及公共服务机构间传输和交换的数据总量。计量单位:TB。
产业链上下游数据交互量:是指报告期末企业与产业链上下游企业间传输和交换的数据总量。计量单位:TB。
其他行业企业或第三方服务平台数据交互量:是指报告期末企业与其他行业企业或第三方服务平台间传输和交换的数据总量。计量单位:TB。
数据交易机构数据交互量:是指报告期末企业与其他数据交易机构间传输和交换的数据总量。其中,数据交易是指数据供方和需方之间进行的,以特定形态数据为标的,以货币或者其他等价物作为对价的交易行为。计量单位:TB。
28.接入外部数据总量:是指报告期末非企业内部的组织或成员通过授权等方式接入平台、系统,并向平台、系统传输的数据总量。计量单位:TB。
购买数据总量:是指报告期末购买本企业外其他主体数据的总量,如数据集等。计量单位:TB。
购买数据费用:是指报告期末购买本企业外其他主体数据的总支出。计量单位:万元。
四、数据应用
29.数据产品/服务数量:是指企业通过购买、自研开发等方式应用的数据产品或服务的数量。其中,数据产品或服务,是指基于数据加工形成的,可满足特定需求的数据加工品或数据服务。计量单位:个。
30.企业数字化投入:是指报告期末企业为了将传统业务流程、产品和服务转化为数字形式,在信息技术方面所做的资金方面的投入。计量单位:万元。
智能硬件投入:是指报告期末企业购买新的智能硬件设备,以及对原有硬件设备进行智能化升级、改造等产生的资金投入。计量单位:万元。
软件系统投入:是指报告期末企业开发新的软件系统或者对现有软件系统进行升级、维护和扩展等一系列的资金投入。计量单位:万元。
31.数据产品/服务收入:是指企业所开发的数据产品或服务带来的经济利益流入。产品或服务如有偿开放的数据集、信息验证服务等。其中,数据产品或服务,是指基于数据加工形成的,可满足特定需求的数据加工品或数据服务。计量单位:万元。
32.数据资源入表金额:是指报告期末将数据资源价值量化后计入财务报表的金额。其中,数据资源是指具有使用价值的数据,是可供人类利用的新型资源。计量单位:万元。
外购数据资源入表金额:是指报告期末企业通过外购方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
自行开发数据资源入表金额:是指报告期末企业通过自行开发方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
其他数据资源入表金额:是指报告期末企业通过其他方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
运营商企业
1.承建基站传输数据总量:是指由本企业所承建的所有基站在服务范围内传输的数据总和。计量单位:TB。
2.移动互联网接入流量:是指企业通过移动网络设备(智能手机、平板电脑等)接入互联网所传输的数据总量。计量单位:TB。
3.移动物联网接入流量:是指企业通过移动物联设备(智能家居设备、智能穿戴设备等)接入互联网所传输的数据总量。计量单位:TB。
4.主要APP接入流量:是指企业通过主要业务类APP接入互联网所传输的数据总量。计量单位:TB。
视频类APP接入流量:是指报告期末本企业通过视频类APP接入互联网所传输的数据总量。包括在线视频、短视频、直播等应用程序。计量单位:TB。
资讯阅读类APP接入流量:是指报告期末本企业通过资讯阅读类APP接入互联网所传输的数据总量。包括电子书、漫画、新闻资讯、听书等应用程序。计量单位:TB。
摄影美图类APP接入流量:是指报告期末本企业通过摄影美图类APP接入互联网所传输的数据总量。包括相机、图片美化、视频编辑、相册图库等应用程序。计量单位:TB。
社交类APP接入流量:是指报告期末本企业通过社交类APP接入互联网所传输的数据总量。包括交友、婚恋、社区等应用程序。计量单位:TB。
通信类APP接入流量:是指报告期末本企业通过通信类APP接入互联网所传输的数据总量。包括电话、短信、彩信等应用程序。计量单位:TB。
音乐类APP接入流量:是指报告期末本企业通过音乐类APP接入互联网所传输的数据总量。包括音乐播放、K歌、电台、铃声、乐器等应用程序。计量单位:TB。
教育学习类APP接入流量:是指报告期末本企业通过教育学习类APP接入互联网所传输的数据总量。包括儿童教育、学生教育、成人教育、语言学习、词典翻译等应用程序。计量单位:TB。
购物类APP接入流量:是指报告期末本企业通过购物类APP接入互联网所传输的数据总量。包括购物商城、折扣团购、快递等应用程序。计量单位:TB。
金融类APP接入流量:是指报告期末本企业通过金融类APP接入互联网所传输的数据总量。包括银行、贷款、支付、投资理财、记账等应用程序。计量单位:TB。
工具类APP接入流量:是指报告期末本企业通过工具类APP接入互联网所传输的数据总量。包括输入法、浏览器、壁纸锁屏、天气日历等应用程序。计量单位:TB。
生活类APP接入流量:是指报告期末本企业通过生活类APP接入互联网所传输的数据总量。包括求职招聘、综合服务、美食外卖、房产家居、电影票务、本地生活等应用程序。计量单位:TB。
旅游出行类APP接入流量:是指报告期末本企业通过旅游出行类APP接入互联网所传输的数据总量。包括酒店、票务、攻略等应用程序。计量单位:TB。
医疗健康类APP接入流量:是指报告期末本企业通过医疗健康类APP接入互联网所传输的数据总量。包括运动、母婴、美容、医疗、养生等应用程序。计量单位:TB。
辅助办公类APP接入流量:是指报告期末本企业通过辅助办公类APP接入互联网所传输的数据总量。包括办公工具、办公平台、笔记、网盘、邮箱、商家办公等应用程序。计量单位:TB。
系统优化类APP接入流量:是指报告期末本企业通过系统优化类APP接入互联网所传输的数据总量。包括安全杀毒、垃圾清理等应用程序。计量单位:TB。
汽车类APP接入流量:是指报告期末本企业通过汽车类APP接入互联网所传输的数据总量。包括养车修车、汽车买卖、违章咨询、汽车资讯、驾考等应用程序。计量单位:TB。
交通导航类APP接入流量:是指报告期末本企业通过交通导航类APP接入互联网所传输的数据总量。包括公交地铁、地图导航、打车租车、共享用车等应用程序。计量单位:TB。
游戏类APP接入流量:是指报告期末本企业通过游戏类APP接入互联网所传输的数据总量。包括游戏、云游戏等应用程序。计量单位:TB。
5.手机终端连接数:是指报告期末连接到通信网络上的手机终端数量。计量单位:个。
6.国际互联网带宽速率:是指企业连接到国际互联网的网络通道的数据上传和下载的速度。计量单位:Mbps。
7.数据跨境流出总量:是指从中国大陆向国外其他国家和地区传输数据的日均流速,换算成日均流量,将365日流量进行求和统计得出。计量单位:TB。
8.数据跨境流入总量:是指从国外其他国家和地区向中国大陆传输数据的日均流速,换算成日均流量,将365日流量进行求和统计得出。计量单位:TB。
(九)数据交易机构数据资源调查表(企业3表)
1.交易总额:是指报告期末在数据交易机构内产生的数据交易的总金额。其中,数据交易是指数据供方和需方之间进行的,以数据或者数据各类形态为标的的交易行为。计量单位:万元。
2.交易次数:是指报告期末在数据交易机构内产生的数据交易的总笔数。其中,数据交易是指数据供方和需方之间进行的,以数据或者数据各类形态为标的的交易行为。计量单位:次。
一、数据集
3.可交易数量:是指报告期末交易机构上架的可进行交易的数据集总量。计量单位:个。
4.交易数量:是指报告期末已经达成交易的数据集的数量,一个数据集多次重复交易计为1个。计量单位:个。
5.交易金额:是指报告期末已经达成交易的数据集总金额。计量单位:万元。
6.交易次数:是指报告期末已经达成数据集交易的总次数。计量单位:次。
7.省内购买方数量:是指报告期末在数据交易机构购买数据集的个人或企业用户中,居住地或注册地在本省的买方数量。计量单位:个。
8.省外购买方数量:是指报告期末在数据交易机构购买数据集的个人或企业用户中,居住地或注册地在本省外的买方数量。计量单位:个。
9.省内供给方数量:是指报告期末在数据交易机构上架或出售数据集的个人或企业用户中,居住地或注册地在本省内的卖方数量。计量单位:个。
10.省外供给方数量:是指报告期末在数据交易机构上架或出售数据集的个人或企业用户中,居住地或注册地在本省外的卖方数量。计量单位:个。
二、数据产品和服务
11.可交易数量:是指报告期末交易机构上架的可进行交易的数据产品和服务的总量,其中,数据产品和服务,是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。计量单位:个。
12.交易数量:是指报告期末已经达成交易的数据产品和服务的数量,一个产品或服务多次重复交易计为1个。计量单位:个。
13.交易金额:是指报告期末已经达成交易的数据产品和服务总金额。计量单位:万元。
14.交易次数:是指报告期末已经达成数据产品和服务交易的总次数。计量单位:次。
15.省内购买方数量:是指报告期末在数据交易机构进行购买数据产品或服务等行为的个人或企业用户中,居住地或注册地在本省的买方数量。计量单位:个。
16.省外购买方数量:是指报告期末在数据交易机构进行购买数据产品或服务等行为的个人或企业用户中,居住地或注册地在本省外的买方数量。计量单位:个。
17.省内供给方数量:是指报告期末在数据交易机构上架或出售数据产品或服务等的个人或企业用户中,居住地或注册地在本省内的卖方数量。计量单位:个。
18.省外供给方数量:是指报告期末在数据交易机构上架或出售数据产品或服务等的个人或企业用户中,居住地或注册地在本省外的卖方数量。计量单位:个。
(十)数据服务方数据资源调查表(企业4表)
一、数据汇聚
1.设备设施采集数据总量:是指报告期末通过各类设备设施(如路由器、交换机、监控设备等)收集、采集到的数据信息的总量。计量单位:TB。
2.系统/软件生成数据总量:是指报告期末系统或软件通过创建、生成、备份等行为产生的数据总量。计量单位:TB。
3.用户上传数据总量:是指报告期末平台或企业用户通过网络或其他方式上传到服务器、云存储、平台或其他数据处理系统中的数据的总和。如文本文件、图片、音频、视频等。计量单位:TB。
4.数据存储总空间:是指报告期末所有可用的数据存储空间,包括本地存储和云存储的总和,不包含作为云服务商为其他企业或个人提供的存储空间。计量单位:TB。
5.数据存储总量:是指报告期末企业使用数据库、服务器、云存储等方式存储的数据总量。包括原始数据所有备份数据在内的,在本地、云端等实际存储的数据总量,不包含作为云服务商存储的其他企业或个人的数据。计量单位:TB。
原始数据存储总量:是指报告期末所有原始数据的存储总量。其中,原始数据是指初次产生或源头收集的、未经加工处理的数据。计量单位:TB。
衍生数据存储总量:是指报告期末从原始数据中通过一系列处理、分析或计算过程得到的新数据的总量。计量单位:TB。
备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
结构化数据存储总量:是指报告期末存储的结构化数据总量,其中,结构化数据是指一种数据的表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
图片类数据存储总量:是指所有存储数据中,图片类型数据的存储总量。计量单位:TB。
视频类数据存储总量:是指所有存储数据中,视频类数据的存储总量。计量单位:TB。
6.云存储总量:是指报告期末本企业存储在云端的数据总量,不包含作为云服务商存储的其他企业或个人的数据。计量单位:TB。
公有云存储总量:是指记录和保存在公有云的数据总量。计量单位:TB。
7.冷数据占比:是指一年未访问的数据,如企业备份数据、业务与操作日志数据、订单管理等统计数据,不包含作为云服务商存储的其他企业或个人的数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
二、数据开发
8.数据集数量:是指报告期内机器学习、深度学习等人工智能模型在开发、测试、优化等过程中所使用数据集的数量。计量单位:个。
9.数据集数据总量:是指报告期内机器学习、深度学习等人工智能模型在开发、测试、优化等过程中所使用数据集的数据总量。计量单位:TB。
接入国外数据集数据总量:是指报告期末企业接入的来自国外的数据集的数据总量。计量单位:TB。
10.用于AI技术开发的数据总量:是指报告期末内在企业用于研究和开发人工智能(AI)过程中模型训练和测试等环节的数据总量。计量单位:TB。
11.数据开发工具数量:是指报告期内进行数据获取、处理和管理过程中所用到开发工具的数量,如数据模型化工具、数据可视化工具等。计量单位:个。
开源数据开发工具使用数量:是指报告期内使用的开源数据开发工具的数量。计量单位:个。
对外提供的数据开发工具数量:是指报告期内向本企业外的其他主体提供的数据开发工具的数量。计量单位:个。
12.通用大模型数量:是指报告期末不受特定领域限制的机器学习、深度学习等参数规模达亿级以上的大模型数量。计量单位:个。
使用频率:是指报告期末上述模型周均使用频率。计量单位:次/周。
二次开发次数:是指报告期末在数据处理、分析等过程中所设计的上述行业模型二次开发的次数。计量单位:次。
13.行业大模型数量:是指报告期末专注于特定行业或应用领域的机器学习、深度学习等参数规模达亿级以上的大模型数量。计量单位:个。
使用频率:是指报告期末上述行业模型周均使用频率。计量单位:次/周。
14.企业算力规模:是指报告期末单位为执行计算密集型任务(如数据分析、人工智能计算等)而构建的计算能力的规模,包括GPU、CPU等算力。计量单位:TFLOPS。
智能计算服务器占比:智能计算服务器是指提供高强度AI计算能力的服务器,如机器学习、深度学习等AI模型的训练和推理等。占比计算方法为智能计算服务器的数据存储空间总量/所有服务器的数据存储空间总量。计量单位:%。
15.开发者数量:是指报告期末企业外为使用模型而注册的开发者总量。计量单位:个。
日活跃数量:是指每日应用、开发模型的用户数量。计量单位:个。
企业AI技术研发者数量:是指报告期末企业内从事AI技术研发工作的人员总量。计量单位:个。
16.数据技术投入:是指报告期末企业在数据采集、存储、应用、流通等过程中的技术投入。如数据采集系统投入等。计量单位:万元。
软件系统投入:是指报告期末企业开发新的软件系统或者对现有软件系统进行升级、维护和扩展等一系列的资金投入。计量单位:万元。
AI技术投入:是指报告期末企业在人工智能(AI)领域进行研究与开发等过程中的资金投入。计量单位:万元。
三、数据流通
17.与外部交互的数据总量:是指报告期末与本企业外部在日常运营等活动中进行数据交换的总量。企业或组织包括客户、供应商、合作伙伴、政府机构以及其他组织等。其中,数据交互是指主体之间以数据的形式进行交流和协作的过程。数据交互可以通过网络通信、文件共享、在线交易等多种形式进行。计量单位:TB。
政府及公共服务机构数据交互量:是指报告期末企业与政府及公共服务机构间传输和交换的数据总量。计量单位:TB。
数据交易机构数据交互量:是指报告期末企业与其他数据交易机构间传输和交换的数据总量。其中,数据交易是指数据供方和需方之间进行的,以特定形态数据为标的,以货币或者其他等价物作为对价的交易行为。计量单位:TB。
其他行业企业或第三方服务平台数据交互量:是指报告期末企业与其他行业企业或第三方服务平台间传输和交换的数据总量。计量单位:TB。
18.接入外部数据总量:是指报告期末非企业内部的组织或成员通过授权等方式接入平台、系统,并向平台、系统传输的数据总量。计量单位:TB。
购买数据总量:是指报告期末购买本企业外其他主体数据的总量,如数据集等。计量单位:TB。
购买数据费用:是指报告期末购买本企业外其他主体数据的总支出。计量单位:万元。
19.数据流出总量:是指报告期末企业对外提供其拥有或管理的数据总量。计量单位:TB。
数据有偿提供总量:是指报告期末企业对外提供其拥有或管理的数据时,要求获取者支付费用的数据总量。计量单位:TB。
数据有偿提供收入:是指报告期末企业对外提供其拥有或管理的数据时,要求获取者支付费用而带来的经济利益流入。计量单位:万元。
20.数据流通审批总数:是指报告期末企业数据流通过程中企业内部审批的总数。其中,数据流通是指数据在不同主体之间流动的过程,包括数据开放、共享、交易、交换等。如跨境流通审批等。计量单位:件。
21.单次数据流通审批时长:是指报告期末企业内部数据流通过程中单次数据流通审批时长。其中,数据流通是指数据在不同主体之间流动的过程,包括数据开放、共享、交易、交换等。计量单位:天。
四、数据服务
22.数据产品及服务收入:是指企业所开发的数据产品及服务带来的经济利益流入。其中,数据产品及服务是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。产品或服务如有偿开放的数据集、信息验证服务等。计量单位:万元。
23.数据产品及服务数量:是指报告期末企业提供的数据相关产品和服务的总数。其中,数据产品及服务是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。计量单位:个。
用户数量:是指报告期末数据产品/服务的用户数量。计量单位:个。
SaaS数据产品及服务数量:是指报告期末企业形成的SaaS数据产品或服务数量。计量单位:个。
24.AI产品数量:是指报告期末企业对外提供的人工智能(AI)相关产品的数目或种类,相同产品不同版本算一次。计量单位:个。
APP累计下载量:是指报告期末,上述AI应用程序(App)所有用户下载该应用的总次数。计量单位:次。
网页端月访问量:是指报告期末,上述通过网页端进行访问的AI产品的月平均访问次数。计量单位:次。
APP日活跃用户数:是指报告期末,平均一天之内使用上述AI应用程序(APP)的独立用户数量。计量单位:个。
网页端月独立访客数:是指报告期末,在一个月的时间内,平均有多少不同的独立用户通过网页端访问了上述网页形式的AI产品。计量单位:个。
25.数据资源入表金额:是指报告期末将数据资源价值量化后计入财务报表的金额。其中,数据资源是指具有使用价值的数据,是可供人类利用的新型资源。计量单位:万元。
外购数据资源入表金额:是指报告期末企业通过外购方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
自行开发数据资源入表金额:是指报告期末企业通过自行开发方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
其他数据资源入表金额:是指报告期末企业通过其他方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
(十一)数据应用方数据资源调查表(企业5表)
产品数据情况
一、产品销售及保有情况
1.产品全国销售量:是指报告期末企业生产的设备在全国的销售量。计量单位:台。
2.31省销售量:是指报告期末企业生产的设备分别在31个省的销售量。计量单位:台。
3.产品全国保有量:是指截至本年年底,企业生产的设备仍在正常使用的数量。计量单位:台。
二、产品数据生产情况
4.产品满负荷运行日均产生数据总量:是指报告期末企业生产的设备在满负荷运行下一天24小时产生的数据总量。计量单位:TB。
5.产品出厂后年均运行时长:是指报告期末企业销售的设备在应用企业年均运行时长。计量单位:天。
三、产品数据存储空间情况
6.产品平均存储空间:是指报告期末企业生产的设备的平均存储总空间。计量单位:TB。
7.产品平均存储空间利用率:是指报告期末企业生产的所有设备的平均存储空间利用率。计量单位:%。
四、产品性能与服务
8.主要产品平均使用年限:是指报告期末企业生产的主要设备产品的平均使用年限。计量单位:年。
9.具备联网功能的产品比例:是指报告期末企业生产的所有设备中具备联网功能的产品比例。计量单位:%。
10.能够提供远程运维服务的产品比例:是指报告期末企业生产的设备中具备远程运维功能或能够提供远程运维服务的产品所占的比例。计量单位:%。
企业数据情况
一、数据汇聚
11.设备设施采集数据总量:是指报告期末通过各类设备设施(如路由器、交换机、监控设备等)收集、采集到的数据信息的总量。计量单位:TB。
12.物联传感生产数据总量:是指报告期末通过物联传感设备(如激光扫描器、红外感应器、温度传感器、振动传感器等)采集、捕获的数据总量。计量单位:TB。
13.系统/软件生成数据总量:是指报告期末系统或软件通过创建、生成、备份等行为产生的数据总量。计量单位:TB。
14.数据存储总空间:是指报告期末所有可用的数据存储空间,包括本地存储和云存储的总和,不包含作为云服务商提供给其他企业或个人的数据存储空间。计量单位:TB。
15.数据存储总量:是指报告期末企业使用数据库、服务器、云存储等方式存储的数据总量。包括原始数据所有备份数据在内的,在本地、云端等实际存储的数据总量,不包含作为云服务商存储的其他企业或个人的数据。计量单位:TB。
研发设计数据总量:是指报告期末研发设计过程中产生的数据存储总量。计量单位:TB。
测试实验数据总量:是指报告期末测试实验过程中产生的数据存储总量。计量单位:TB。
生产制造数据总量:是指报告期末企业生产制造过程中产生的数据存储总量。计量单位:TB。
经营管理数据总量:是指报告期末企业经营管理过程中产生的数据存储总量。计量单位:TB。
运行维护数据总量:是指报告期末企业运行维护过程中产生的数据存储总量。计量单位:TB。
供应链服务数据总量:是指报告期末企业供应链服务过程中产生的数据存储总量。计量单位:TB。
安全能耗数据总量:是指报告期末企业按照要求或规定向政府提供的涉及安全生产、节能减排的数据总量。计量单位:TB。
16.原始数据存储总量:是指报告期末所有原始数据的存储总量。其中,原始数据是指初次产生或源头收集的、未经加工处理的数据。计量单位:TB。
17.备份数据存储总量:是指报告期末为保障数据安全与恢复等目的而专门存储的备份数据总量,包括所有副本数据。计量单位:TB。
18.结构化数据存储总量:是指报告期末存储的结构化数据总量,其中,结构化数据是指一种数据的表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。这些数据具有清晰的字段和属性,每个字段都有特定的数据类型和取值范围。计量单位:TB。
19.云存储总量:是指报告期末本企业存储在云端的数据总量,不包含作为云服务商存储的其他企业或个人的数据。计量单位:TB。
公有云数据总量:是指报告期末存储在公有云的数据总量。计量单位:TB。
20.冷数据占比:是指一年未访问的数据,如企业备份数据、业务与操作日志数据、订单管理等统计数据,不包含作为云服务商存储的其他企业或个人的数据,占比计算方法为冷数据总量/数据存储总量。计量单位:%。
二、数据流通
21.与外部交互的数据总量:是指报告期末与企业外部在日常运营等活动中进行数据交换的总量。包括客户、供应商、合作伙伴、政府机构以及其他组织等。其中,数据交互是指主体之间以数据的形式进行交流和协作的过程。数据交互可以通过网络通信、文件共享、在线交易等多种形式进行。计量单位:TB。
政府及公共服务机构数据交互量:是指报告期末企业与政府及公共服务机构间传输和交换的数据总量。计量单位:TB。
同行业企业或链主平台数据交互量:是指报告期末企业与同行业企业或链主平台间传输和交换的数据总量。计量单位:TB。
其他行业企业或第三方服务平台数据交互量:是指报告期末企业与其他行业企业或第三方服务平台间传输和交换的数据总量。计量单位:TB。
数据交易机构数据交互量:是指报告期末企业与其他数据交易机构间传输和交换的数据总量。其中,数据交易是指数据供方和需方之间进行的,以特定形态数据为标的,以货币或者其他等价物作为对价的交易行为。计量单位:TB。
互联网服务平台数据交互量:是指报告期末企业与其他互联网服务平台间传输和交换的数据总量。计量单位:TB。
22.接入外部数据总量:是指报告期末非企业内部的组织或成员通过授权等方式接入平台、系统,并向平台、系统传输的数据总量。计量单位:TB。
购买数据总量:是指报告期末购买本企业外其他主体数据的总量,如数据集等。计量单位:TB。
购买数据费用:是指报告期末购买本企业外其他主体数据的总支出。计量单位:万元。
23.数据流出总量:是指报告期末企业对外提供其拥有或管理的数据总量。计量单位:TB。
数据有偿提供总量:是指报告期末企业对外提供其拥有或管理的数据时,要求获取者支付费用的数据总量。计量单位:TB。
数据有偿提供收入:是指报告期末企业对外提供其拥有或管理的数据时,要求获取者支付费用而带来的收入总和。计量单位:万元。
三、数据应用
24.企业数字化投入:是指报告期末企业为了将传统业务流程、产品和服务转化为数字形式,在信息技术方面所做的资金方面的投入。计量单位:万元。
智能硬件投入:是指报告期末企业购买新的智能硬件设备,以及对原有硬件设备进行智能化升级、改造等产生的资金投入。计量单位:万元。
软件系统投入:是指报告期末企业开发新的软件系统或者对现有软件系统进行升级、维护和扩展等一系列的资金投入。计量单位:万元。
在AI方面的投入:是指报告期末企业在人工智能(AI)领域进行研究与开发等过程中的资金投入。计量单位:万元。
25.用于AI训练的数据总量:是指报告期末在人工智能(AI)模型训练过程中所使用的数据总量。计量单位:TB。
26.数据增值服务收入:是指报告期末利用企业或组织在日常运营中收集和产生的业务数据,通过分析和处理这些数据,来提供新的服务或产品,从而为公司带来额外的经济利益流入。计量单位:万元。
27.数据资源入表金额:是指报告期末将数据资源价值量化后计入财务报表的金额。其中,数据资源是指具有使用价值的数据,是可供人类利用的新型资源。计量单位:万元。
外购数据资源入表金额:是指报告期末企业通过外购方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
自行开发数据资源入表金额:是指报告期末企业通过自行开发方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
其他数据资源入表金额:是指报告期末企业通过其他方式取得数据资源价值量化后计入财务报表的金额。计量单位:万元。
(十二)重点行业产品数据资源调查表(企业6表)
一、产品销售及保有情况
1.产品全国销售量:是指报告期末企业生产的设备在全国的销售量。计量单位:台。
2.31省销售量:是指报告期末企业生产的设备分别在31个省的销售量。计量单位:台。
3.产品全国保有量:是指截至本年年底,企业生产的设备仍正常使用的数量。计量单位:台。
二、产品数据生产情况
4.产品满负荷运行日均产生数据总量:是指报告期末企业生产的设备在满负荷运行下一天24小时产生的数据总量。计量单位:TB。
5.产品出厂后年均运行时长:是指报告期末企业销售的设备在应用企业年均运行时长。计量单位:天。
三、产品数据存储空间情况
6.产品平均存储空间:是指报告期末企业生产的设备的平均存储总空间。计量单位:TB。
7.产品平均存储空间利用率:是指报告期末企业生产的所有设备的平均存储空间利用率。计量单位:%。
四、产品性能与服务
8.主要产品平均使用年限:是指报告期末企业生产的主要设备产品的平均使用年限。计量单位:年。
9.具备联网功能的产品比例:是指报告期末企业生产的所有设备中具备联网功能的产品比例。计量单位:%。
10.能够提供远程运维服务的产品比例:是指报告期末企业生产的设备中具备远程运维功能或能够提供远程运维服务的产品所占的比例。计量单位:%。