D O I :10.15896/j .x j
t u s k x b .202304008ʌ收稿日期ɔ2022G10G12.㊀㊀ʌ修回日期ɔ2023G04G22.
ʌ基金项目ɔ广东省自然科学基金卓越青年团队项目(2023B 1515040001);广东省哲学社会科学规划项目(G D 22C Y J 17);广东省自然科学基金项目(2022A 1515011472).ʌ作者简介ɔ刘语(1990 ),男,中山大学岭南学院博士后研究人员;曾燕(1984 )
,男,通信作者,中山大学岭南学院教授,博士生导师.
感谢董浩㊁胡建薇㊁肖遥㊁任诗婷㊁查佳婧㊁杨存奕㊁钟容与㊁谭桀㊁吴品墨和王柯蕴等在论文完成过程中提供的帮助和建议.
①㊀包含直辖市㊁
副省级与地级行政区.②㊀参见«中国政府开放数据利用研究报告(2022)»,h t t p
://i m d .c c n u .e d u .c n /i n f o /1046/12620.h t m .论有偿使用制度推动公共数据开放发展
刘㊀语,曾㊀燕
中山大学岭南学院,广东广州51027
开放科学(资源服务)
标识码(O S I D )
ʌ摘要ɔ数据是数字经济时代重要的资源,公共数据是中国规模最大㊁覆盖范围最广的数据类型.有效利用公共数据能产生巨大的商业价值和社会价值,推动数字经济发展.目前,中国公共数据开放发展迅速,但仍存在诸多问题.在文献基础上,基于辩证法发展观视角,结合中国公共数据开放实践现状,指出地方政府积极性不足是阻碍中国公共数据开放的主要因素.在此基础上,提出建立公共数据有偿使用制度能够有效调动地方政府积极性,并对建立公共数据有偿使用制度的争论进行了回应.据此建议:建立公共数据分级制度,为公共数据有偿使用制度奠定基础;建立公共数据有偿使用制度,合理分配公共数据收益;建立数据要素市场供给体系,推动数据要素市场供给多元化;完善数据要素市场监管机制,建立数据要素市场价格调节机制.ʌ关键词ɔ公共数据开放;数据要素;数据分级;有偿使用;数字经济
ʌ中图分类号ɔD 63㊀ʌ文献标识码ɔA㊀ʌ文章编号ɔ1008G245X (2023)04G0090G10
㊀㊀随着数字经济发展,
数据日益成为国家战略性资源.政府在提供公共服务和政府治理的过程中会产生大量关键性和基础性的公共数据,这些公共数据蕴含巨大的社会价值和商业价值.在保障国家安全㊁商业机密和个人隐私的前提下,充分有效地利用公共数据,有利于激发
创新活力,推动数字经济发展.例如,黄益平等[1
]指出,公
共数据开放可以降低数据要素获取成本,提高数据要素使用率.同时,公共数据开放还能够提升数字政府治理
能力,促进数字经济发展[
2]61G63
.中国当前公共数据开放发展迅速,部分地区成果显
著.截至2021年底,中国已有80.65%的省份和51.30%的城市①上线了政府数据开放平台,覆盖范围和深度都有所发展②.截至2020年底,全国各地方政府数据开放平台开放的有效数据集有98558个,2017 2020年增长
超10倍.部分地区公共数据开放取得了显著成果,
例如,北京市政务数据资源网提供了超过100个部门的10000个数据集,包含44万个数据项和57.10亿条数据.
虽然中国公共数据开放取得了长足发展,但是仍旧
存在诸多问题,更重要的是阻碍中国公共数据开放发展的主要因素并未得到详尽分析和准确认知.现有文献大多仅分析了中国公共数据开放面临的问题,仅有少量
文献分析了阻碍其发展的因素[3G4]
.然而,这些因素并不
能全面地解释中国公共数据开放的现状和面临的问题.无法准确判断阻碍发展的主要因素,就难以解决真正的核心问题,依据其提出的政策甚至可能会对后续发展形成阻碍.因此,只有准确认识阻碍中国公共数据开放发展的主要因素,才能提出具有针对性的政策建议,从而有效地推动中国公共数据开放发展.
本文基于发展视角,将公共数据开放视作一个发展变化的过程,更详尽地分析影响其发展的各因素之间相
互影响和相互制约的关系,具有理论和实践两方面意义.在理论方面,为研究公共数据开放提供了一种新视角.现有文献更多关注中国公共数据开放发展现状和外部影响因素,本文对公共数据开放发展整体进行了更为全面和准确的分析,运用辩证法对影响公共数据开放发展的因素进行了梳理,出阻碍中国公共数据开放的主要因素.在实践方面,本文不仅考虑到当前公共数据发展现状,还考虑了政策在后续阶段对公共数据开放发展的影响.
一㊁公共数据开放的定义㊁现状和问题
(一)公共数据开放的定义和特点
公共数据和政府数据㊁政务数据等相关概念区分模糊,时常被混用[5],且缺乏明确的㊁公认的定义.现有文献对公共数据概念存在三种不同的定义[6]:第一,政府机构在公共治理过程中收集的数据;第二,政府和具有公共管理服务职能的事业单位在公共治理和提供公共服务过程中收集的数据;第三,对社会大众或集体产生影响的数据,包含政府机构㊁事业单位㊁企业和个人收集的数据.前两种理解是从数据采集和归属的角度对公共数据进行定义,而后一种则是从数据用途和数据影响的角度对公共数据进行定义.本文主要内容为公共数据开放,被开放数据的所有权均归属政府和事业单位所有.因此,参考«上海市公共数据和一网通办管理办法»,本文采用第二种定义,即 公共数据为政府机关和事业单位在政府治理和提供公共服务过程中,采集和产生的各类数据资源 .
公共数据开放主要有两方面特点.一方面,公共数据的所有者是政府机关或事业单位.相比于企业和个人,政府机关和事业单位需要承担更多的社会责任,在决策上应更多考虑社会福利,而非自身经济利益.但是,地方政府和事业单位的利益仍旧会影响其行为,从而影响公共数据开放相关政策的落实情况.另一方面,公共数据具有公共属性,这决定了公共数据开放是非排他性的.公共数据具有准公共产品的特点,因此政府可以设定公共数据开放标准,但是不能单独限定某一企业或个体使用或不能使用公共数据.
(二)国际公共数据开放现状
公共数据开放已成为全球重要国家提升国家竞争力的引擎,全球重要国家均在推动自身公共数据开放.本文选择最具代表性的美国公共数据开放作为国际公共数据开放典型案例进行介绍.美国公共数据开放现状可以总结为以下三个方面:
第一,美国公共数据开放起步早,政策和法律体系完善.美国于2009年开始逐步推动公共数据开放,成为公共数据开放的领先者.2009年1月,美国政府发布«透明开放政府备忘录»,提出建立透明㊁开放㊁合作政府.同年5月,美国政府数据开放网站上线,要求各部门在60天内公布开放政府计划,并把首批开放数据上传到网站上.2013年,美国通过«政府信息公开和机器可读行政命令»确立了公共数据开放的基础框架.该命令确认了在无其他规定情况下,默认政府信息和数据资源应当处于开
放和可机读的状态.2019年,美国通过«开放政府数据法»,建立了公共数据的质量反馈和评估体系,进一步强调对公共数据的质量管理.美国政府制定了元数据质量评估体系,开发了 仪表板 系统(P O D D),评估和监测各联邦机构数据开放工作执行情况.同时,美国政府定期发起调查,举办数据圆桌会议,邀请数据应用企业和机构,调查本国数据使用需求,并评估开放成效.政府部门也定期收集使用反馈,完善数据开放平台的功能和数据资源[7].这些政策和法律构成了美国相对完善的公共数据开放体系.
第二,美国公共数据开放数据量大㊁数据可利用性强,取得了显著成果.美国政府数据开放网站具有数据量大㊁主题丰富㊁检索方便等一系列特点,是美国最大的公共数据开放平台.截至2022年9月,该平台上一共有335221个数据集,并提供了不同类型的数据和不同接口以便于使用.除此之外,美国商务部㊁统计局等部门的公共数据平台也相对成熟.这些平台的数据丰富㊁数据可利用性高,对美国社会治理和经济创新提供了巨大动力.
第三,虽然美国公共数据开放起步早,成果丰硕,但是其发展仍旧面临一些问题.其中的主要问题是美国地方政府公共数据开放平台发展缓慢,导致地方数据缺失.截至2022年11月,美国50个州中仅有18个州建设了统一的公共数据开放平台.在美国政府数据开放网站上,虽然有40个州公布了数据集,但是大部分仅提供了政策文件或地理数据,并未提供州一级的详细数据.
(三)中国公共数据开放现状
相比于美国公共数据开放,中国公共数据开放起步较晚,其主要发展现状可以总结为以下两点:
第一,陆续出台公共数据开放相关政策,政策法规逐步完善.2015年7月1日,国务院办公厅印发«关于运用大数据加强对市场主体服务和监管的若干意见»,提出进一步加大政府信息公开和数据开放力度.2015年8月19日,国务院常务会议审议通过«关于促进大数据发展的行动纲要»,这是中国促进大数据发展的第一份具有顶层设计意义的纲领性文件.该文件要求 加快政府数据开放共享,推动资源整合,提升治理能力 .此后,«政务信息资源共享管理暂行办法»和«中华人民共
和国数据安全法»等陆续出台,加强了公共数据开放领域的法律体系建设.2018年1月,中央网络安全和信息化委员会办公室㊁国家发展和改革委员会㊁工业和信息化部联合印发«公共信息资源开放试点工作方案»,确定北京市㊁上海市㊁浙江省㊁福建省㊁贵州省为公共信息资源开放试点地区.2021年6月,国务院办公厅发布«要素市场化配置综合改革试点总体方案»,提出 探索建立数据要素流通规则 要从四个方面展开,即完善公共数据开放共享机制㊁建立健全数据流通交易规则㊁拓展规范化数据开发利用场景和加强数据安全保护.
第二,中国公共数据开放发展速度快,部分地区取得了一定成果.随着中国各级政府逐步推动公共数据开放,已开放的公共数据成为中国当前最大规模㊁覆盖范围最广的数据分类.截至2020年,中国各地方政府开放的有效数据集总数为98558个,2017 2020年间增长10倍①.截至2022年10月,中国已有208个地级及以上政府上线了数据开放平台或数据开放版块②.在能够计算数据容量的平台中,超过29个平台提供的数据容量超过1亿个③,其平均数据容量接近20亿个④.以深圳市为例,2021年政府数据开放平台浏览量超过9亿次,下载量接近1500万次.
(四)中国公共数据开放面临的问题
虽然中国公共数据开放取得了一定成效,但是与美国公共数据开放现状相比,中国公共数据开放仍旧面临诸多问题.王晓冬[7]将中国公共数据开放工作面临的问题总结为数据质量不高㊁平台功能不完善和数据安全保障较弱.李涛[3]指出数据质量不高和平台功能不完善的主要原因是公共数据开放的局部性㊁随意性㊁差别性和杂乱性四个因素.国家信息中心发布的«政务数据开放利用指南(2021版)»中明确指出,中国政务数据存在数据质量问题㊁供需衔接问题和标准规范问题.综合相关文献,结合美国公共数据开放情况,本文将中国公共数据开放存在的问题总结为平台覆盖面不足㊁数据可利用性差和地区差异巨大三个方面.
第一,中国政府数据开放平台尚未完全覆盖,部分地区仍未建立数据开放平台.虽然中国近年来地级及
以上的政府数据开放平台数量迅速增加,从2017年的20个增加到2022年的208个,但是平台整体覆盖率仍旧不高.«中国地方政府数据开放报告:省域指数(2022)»数据表明,经济相对发达省份的数据开放平台建设情况明显优于其他省份.西藏㊁云南㊁吉林和辽宁等省份数据开放平台建设情况明显低于其他省份,其中部分地区仍未建立数据开放平台.在同一省份内,地市级行政区的数据开放平台覆盖率远落后于省级和副省级行政区.截至2022年10月,中国74.07%的省级行政区㊁86.65%的副省级行政区都建设了数据开放平台,而地市级和县区级建设政府数据开放平台的比例仅有57%和15.5%.大部分的地市级平台仅存在于地方政府网站的政府栏目中,并未整合进入上级行政层级的专有式平台,导致公众难以获得行政层面更微观的数据.
第二,中国大部分政府数据开放平台的数据可用性较低,难以产生社会价值和商业价值.首先,部分政府数据开放平台提供的数据集较少.部分政府数据开放平台存在 有目录无数据 的情况,甚至部分数据开放平台仅提供新闻发布内容和政策解读,没有提供完整数据集.其次,政府数据开放平台提供的数据质量较差,缺乏利用价值.据«中国政府开放数据利用研究报告(2022)»显示,约有34.00%的地方政府数据开放平台数据更新频率为一年,只有4.65%的地方平台数据更新方式为一周.同时,部分数据集存在元数据缺失㊁数据可读性差等问题.例如,67.40%的政府数据开放平台未提供数据名称,90%以上未提供数据处理方式和数据集时间范围⑤.这导致数据时效性差㊁使用障碍多,严重限制了数据价值的释放.再者,公共数据下载渠道缺失或单一,获取成本高.截至2021年,尚有诸多政
府开放数据接口(A P I接口)数量为0,甚至有47个地区存在数据应用数为0的情况.仅有2.40%的地方平台提供了数据请求功能且公开了用户的数据请求,仍有37.80%的地方平台尚未允许用户提出数据请求.此外,政府数据开放平台提供的数据格式单一,不利于数据的开放和再利用,部分平台甚至无法保证数据集的开放格式,仅保证机器可读.很多平台需要注册登录后才能下载,部分数据需要经历复杂漫长的申请后才能获得下载权限.最后,政府数据平台孤岛现象严重,难以产生聚集效应.地方政府的部分数据统计口径和标准不一,严重影响了不同政府数据平台数据的流通和使用[3].随着中国公共数据开放发展,地区性的数据标准逐渐统一,但是不同省份的数据标准仍旧存在差异.在主体分类㊁数据格式㊁元数据标准等方面各地均有不同标准和文件,这极大阻碍了数据之间的流通和整合.同时,不同平台之间缺乏联系和整合,用户收集和整理不同平台数据的成本较高.各地区政府数据开放平台独立运营,未能形成数据网络,严重影响了数据价值释放.
第三,中国不同地区数据开放平台发展水平差异极大.从政府数据开放平台的数量和覆盖情况看,中国各大众中国
参见«2021年政务数据开放利用研究报告».
参见«中国地方政府数据开放报告:省域指数(2022年度)».
数据容量是指一个数据平台真正的数据总量,计算方法为平台的数据量(行数)乘以数据项(字段数),单位为 个 .
参见«中国政府开放数据利用研究报告(2022)».
参见«中国政府开放数据利用研究报告(2022)».
地区数据开放平台数量差距明显.截至2021年,中国华东地区①有245个政府数据开放平台,而东北和华中地区仅有30和47个,存在明显的地区差异.从数据集数量㊁质量㊁下载量等方面看,各地发展水平差距更为明显.例如,山东公共数据开放网的平台数据集为146231个,其中山东省省级数据集为949个,其他为所属地级的数据集.而河北省的政府数据开放平台数据集不足20个.在有明确提供数据浏览量和数据下载量的86个平台中,下载量最高为1500万次,而漯河市㊁福建省和芜湖市的下载量为0.这些都充分说明各地区数据开放平台发展极不平衡.
二、辩证法视角下阻碍中国公共数据开放的
主要因素
㊀㊀中国公共数据开放面临诸多问题,只有分析造成这些问题的根本原因,到阻碍公共数据开放的主要因素,才能准确解决核心问题,切实推动中国公共数据开放发展.
(一)现有文献对阻碍中国公共数据开放因素的分析和研究
现有文献大多列举了中国公共数据开放的问题,但是较少尝试分析阻碍中国公共数据开放的因素.李涛[3]分析并指出公共数据质量不高和平台功能不完善的主要原因是公共数据开放的局部性㊁随意性㊁差别性和杂乱性.门理想等[4]基于公共价值②的视角,认为政府对公共价值的忽视是诸多问题产生的重要原因.他们将公共数据开放中公共价值分为两个维度:从公共数据开放中获取怎样的价值以及怎样获取价值.然而从实践来看,这两个维度都没有得到满足.一方面,公共数据的数据质量㊁开放维度都低于预期[7,9].另一方面,公共数据的开放过程中未能重视其他市场参与者并形成市场规范[10].
然而,上述因素并不能全面㊁有效地解释中国公共数据开放所面临的问题,因此可能并不是阻碍中国公共数据开放的主要因素.政府对公共价值的忽略确实会阻碍公共数据开放发展,导致公共数据可用性较低,但是难以解释政府数据平台覆盖不足和地方发展差异大的现象.公共数据开放局部性等因素更是如此.因此,这些因素客观上确实阻碍了中国公共数据发展,但是并非主要因素.
(二)基于辩证法分析主要因素
只有正确分析和认知阻碍中国公共数据开放的主要因素,才能对症下药提出有效的政策建议,从而真正推动公共数据开放,促进中国数字经济发展.结合中国和国际公共数据开放实践现状,地方政府对公共数据开放积极性不足是阻碍中国公共数据开放发展的主要因素.在发展视角下,本文将从三个方面进行论证:首先,地方政府积极性对公共数据开放起决定性作用;其次,地方政府积极性是影响公共数据开放发展的内因;最后,地方政府积极性不足能够全面㊁完整地解释中国公共数据开放发展的问题.
(1)地方政府是公共数据开放的主要参与者和推动者,地方政府积极性对公共数据开放发展有决定性影响.一方面,地方政府是中央的文件和政策的具体执行者.在数据权属缺乏明确规定的情况下,各地方政府需要厘清公共数据的权属㊁管理㊁责任等方面,出台相应的政策和规划,以落实中央的文件和政策,并制定对应的考核机制和评价体系.另一方面,地方政府承担公共数据收集㊁整理㊁管理和开放工作,是公共数据的提供者,也是部分环节最主要甚至是唯一的参与者.在数据收集阶段,地方政府部门需要根据需求制定数据收集方案和标准,包括元数据信息㊁数据字段㊁数据格式,甚至需要提供数据样例.在数据整理阶段,各部门会将已经收集的数据进行整理,包括数据清洗㊁数据脱敏㊁数据分级等.在数据管理阶段,地方政府需要将各部门整理后的数据汇集到政府数据开放平台进行存储,同时还需要确保数据安全以及及时更新数据.在数据开放阶段,地方政府需要提供下载渠道,确保数据集能够被安全㊁快速下载,提供搜索或检索方式等.因此,地方政府深度参与公共数据开放的各个环节,在政府
数据开放平台建设㊁公共数据的质量和可利用性等方面起到决定性作用. (2)地方政府积极性是影响中国公共数据开放发展的内因,技术和制度等因素是外因.一方面,地方政府积极性不足是阻碍公共数据开放发展的根本原因,而技术和制度等客观因素仅会延缓公共数据开放发展.当前,中国已经有部分地区在公共数据开放方面取得很好成果.截至2021年底,中国数据集数前十名的公共数据平台如图1所示.从排名上看,除去贵州省省级平台,其他9个平台均属于山东省.数据接口数前十名的公共数据平台如图2所示.可以看出,前十名中有9个平台属于山东省,这表明在经济发展水平㊁互联网技术水平㊁政策扶持力度都不具有明显的相对优势情况下,山东省公共数据开放发展整体水平显著高于其他省份.这意味着,若地方政府具有积极性,当前技术水平和制度不完善等客观因素形成的困难是可以被克服的.与之相反,①
地区分类依据为中国地理七大分区,具体为华北地区(北京㊁天津㊁河北㊁山西㊁内蒙古)㊁华东地区(上海㊁江苏㊁浙江㊁山东㊁安徽㊁江西㊁福建㊁台湾)㊁东北地区(辽宁㊁吉林㊁黑龙江)㊁华中地区(湖南㊁湖北㊁河南)㊁华南地区(广东㊁广西㊁海南㊁香港㊁澳门)㊁西南地区(四川㊁重庆㊁贵州㊁云南㊁西藏)和西北地区(陕西㊁甘肃㊁新疆㊁青海㊁宁夏).
公共价值是公众对政府期望的合集[8]50.
在技术条件和制度因素具有相对优势的地区,若地方政
府积极性不足,则公共数据开放也会受到阻碍或陷入停
滞.部分城市政务数据开放平台的数据集数㊁数据接口
数和数据应用数以及全国政务数据开放平台的平均值
见表1.可以看出,泰州市公共数据开放发展良好,而其他三座城市公共数据开放发展明显落后.淮安㊁盐城和
泰州均是江苏地级市,相距不到200千米,其技术和经济因素不具有明显差异,在全国均属于经济发达地区.杭州市生产总值和互联网企业技术水平均显著高于泰州市,技术条件和制度条件更为成熟.然而,除了泰州市,其余三座城市的公共数据开放发展水平明显落后于全国平均水平.这表明若地方政府积极性不足,即使外部因素条件具有优势,公共数据开放发展也会面临阻碍.因此,这些客观因素对中
国公共数据开放发展的影响虽然不可忽略,但是其并不是影响公共数据开放发展的根本原因.另一方面,地方政府积极性直接影响公共数据开放发展,而技术和制度等客观因素则是间接影响因素.当地方政府积极性不足时,在公共数据开放方面会投入更少的精力和资源,从而直接影响公共数据开放发展.当技术水平有限或制度不完善时,推动公共数据开放需要更多成本和精力,或公共数据开放后产生更低收益,导致地方政府积极性下降,从而阻碍公共数据开放发展.这意味着,地方政府积极性直接影响公共数据开放发展,而技术和制度等客观因素先影响地方政府积极性,再间接影响公共数据开放发展.由于技术和制度等客观因素并不是阻碍公共数据开放发展的决定性因素,因此技术和制度等客观因素是外因
.
图1㊀数据集数前十名地区情况
注:数据来源于«中国政府开放数据利用研究报告(2022)»
.
图2㊀数据接口数前十名地区情况
注:数据来源于«中国政府开放数据利用研究报告(2022)».
表1㊀不同城市公共数据开放发展情况
指标淮安市数据开放平台盐城公共数据开放平台泰州市政务数据开放平台杭州市数据开放平台平均值数据集数294104820907162458.58数据接口数1353028317042617.33数据应用数02241815注:数据来源于«中国政府开放数据利用研究报告(2022)».
㊀㊀(3)地方政府积极性不足可以有效解释当前中国公共数据开放面临的主要问题.首先,地方政府积极性不足会导致政府数据开放平台建设投入不足.地方政府需要投入资金和精力执行中央和省级政府的政策和管理办法.虽然其资金要求㊁管理能力和技术水平并未超出地方政府承受能力,但是当地方政府积极性不足时,其投入就会降低,政府数据开放平台建设进度将会放缓或暂停.其次,地方政府积极性不足会使得公共数据可用性下降.由于公共数据的收集㊁整理和管理都需要地方政府深度参与,当地方政府积极性不足时,公共数据的数据量㊁数据质量都会下降,进而导致公共数据可用性下降.在数据收
集阶段,积极性不足的地方政府仅收集必需的数据,并不考虑后续数据整理㊁数据可用性等方面的需求.这不仅对后续工作造成困难和阻碍,还会降低数据完整性和数据可信性.因此,在没有其他利益驱使或者压力的情况下,地方政府会更倾向减少公共数据开放的数据量㊁数据类型,甚至仅开放不重要或不完整的数据集,从而导致数据可用性降低.最后,地方政府积极性不同是造成中国各地公共数据开放发展差异的主要因素.地方政府积极性对公共数据开放发展起到决定性作用,因此,地方政府的积极性差异必然会导致公共数据开放发展差异.现有研究表明政府在面临压力或具有公共数据开放动力时,其政府开放数据平台实施水平会更高[11].截至2021年,中国仍有部分省份
尚未制定或颁布政务数据开放的相关办法,这必然导致这些地区公共数据开放发展缓慢.由于省级政府在公