政府数据向社会开放不能成为一种“放之四海皆准”的工具

2019-12-05    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

本文转载自上观新闻,原作者罗培新/常江。原标题《打破数据孤岛,政府数据应该如何向社会开放?》经编辑,供行业人士参考。

大数据,素有“二十一世纪的石油”之美称,其中大量数据是公共数据,指政府掌握的各类数据资源。

政府内部如何共享数据,形成整体政府,如何向社会开放数据,促进经济社会发展,实在是一个宏大的命题。

上海,是国内最早开始公共数据开放探索实践的城市之一.

2018年9月,上海市以市政府令的形式出台了《上海市公共数据和一网通办管理办法》(市府9号令)。

这是上海出台的第一部有关公共数据的立法,明确了公共数据集中统一管理的体制和机制,由市大数据中心对各单位的公共数据,按照应用需求进行集中统一管理,并编制全市公共数据资源目录。

公共数据管理立法的颁布施行,使得公共数据的采集、治理、共享等数据管理行为有了基本的法律依据,为公共数据开放奠定了更为坚实的基础。

公共数据开放不等同于政府信息公开

公共数据开放和政府信息公开,到底是什么关系?

从建立数据开放制度的立法目的来理解,所谓公共数据开放中的“数据”是指第一手的原始记录,未经加工与解读,而“信息”更多的是指经过连接、加工或解读之后被赋予了意义的产品。

鉴此,政府信息公开与公共数据开放,存在着以下差异:

一是价值不同。政府信息公开,其主要目的是保障公众的知情权和监督权,提高政府透明度,促进依法行政,侧重于其政治和行政价值;而公共数据开放则强调公众对政府数据的利用,重在发挥政府数据的经济与社会价值,促进数字经济发展,打造智慧城市。

二是客体不同。政府信息公开停留于“信息”层面,而数据开放则深入到了“数据”层面,强调开放数据具有原始性,而非简单的统计结论。数据开放强调的是数据集的开放,是由数据所组成的集合,通常以特定的文件格式出现,以适于机器读取。

三是对象不同。信息公开的对象是社会公众,对其身份、能力没有要求;数据开放更偏向有数据处理能力的用户,或者从事各种服务开发、学术研究的机构和个人。换言之,数据开放的对象,并不是普罗大众,这也是出于安全等方面的考虑。

四是责任不同。政府信息公开的工作重点在于政府一方,公开相关信息后即已实现工作目标,而数据开放则需要政府和利用者双方同时着力,开放数据本身并未彻底完成这项工作,使数据被社会充分开发利用才是根本目的。

因而,公共数据开放不宜适用政府信息公开的相关规定,而应当在现行的政府信息公开规则之外,建立一套专门的、体现数据开放特点的制度。

基于以上考虑,上海的立法将公共数据开放定义为:公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。

实际上,从政府信息公开条例的起草过程来看,其并没有考虑到公共数据开放这种形式。因为数据开放是大数据时代产生的新的需求。只有在互联网宽带普及和电子化数据大规模积累形成后,向社会公众开放政府数据才具备可行性。

在互联网出现之前或者带宽很窄的阶段,政府部门电子化数据积累少,所谓政府信息公开就是指发布文本、统计数据等相对单一的行为。

当然,将来随着公共数据开放工作的推进,不排除政府信息公开条例在修订时,进一步扩大适用范围,将公共数据囊括到政府信息的范围内,从而实行一体化的立法路径。

谁来开放,开放什么?

公共数据开放的主体和范围

2013年G8峰会上,美国、英国、法国、德国、意大利、加拿大、日本、俄罗斯八国签署了开放数据宪章。

开放数据宪章作为政府间的协议,提出了五项开放原则:

默认数据开放原则、数据质量和数量原则、人人可用原则、为改善治理发布数据原则、为激励创新发布数据原则。

其中,默认数据开放原则是指政府应该开放除涉及国家安全、商业机密以及个人隐私之外的所有数据,对于不开放的数据必须说明不能开放的理由。

对于数据开放主体,本着分级开放、各负其责的理念,明确市人民政府各部门、区人民政府以及其他公共管理和服务机构(统称为数据开放主体)分别负责本系统、本行政区域和本单位公共数据的开放。

这一规定明确了确定数据开放主体的基本原则,同时,为了避免责任不清、甚至相互推诿的问题,办法还明确在公共数据资源目录中列明数据开放主体。

在开放范围方面,考虑到数据开放工作毕竟仍处于起步阶段,无论从必要性还是准备度来看,都无法立即将公共数据全部对外开放。为此,办法确立了数据价值优先的原则,由主管部门根据本市经济社会发展需要,确定年度公共数据开放重点。

与民生紧密相关、社会迫切需要、行业增值潜力显著和产业战略意义重大的公共数据,优先纳入公共数据开放重点。

例如,当下上海正在大力发展人工智能产业,并将广泛运用于城市运行和安全管理,这对交通、建设等部门的数据开放,有着切近的需求,这些部门就应当将相关公共数据的开放,列入工作的重点。

此外,借鉴国外立法所确立的政府数据开放的公众参与理念,办法既要求主管部门在确定公共数据开放重点时,应当听取社会公众的意见,也明确社会公众可以主动对数据需求提出意见建议,从而提高确立数据开放范围的科学性和民主性。

基于开放范围和社会需求,主管部门制定公共数据开放清单,列明可以向社会开放的公共数据,并对外公布。开放清单应当标注数据领域、数据摘要、数据项和数据格式等信息,明确数据的开放类型、开放条件等。

需要强调的是,数据开放范围并不是一成不变的,而是动态更新的。数据开放主体应当建立开放清单动态调整机制,对尚未开放的公共数据进行定期评估,及时更新开放清单,不断扩大公共数据的开放范围。

在哪里开放?统一开放平台门户

从各国数据开放的实践来看,有一个共同的做法,就是建立统一的数据开放平台。

通过平台汇聚所有列入开放范围的公共数据,并提供CSV、HTML、XML、RDF等格式的文件下载,或者提供API接口。有的平台还支持RSS技术以及数据信息的订阅,并提供相应的网站代码以供不同种类RSS阅读器的使用。

如纽约市的数据开放平台,由纽约市长数据分析办公室和信息技术和电信部联合建立,纽约市100余个政府部门和公共机构均在该平台提供数据开放服务。

上海的办法也同样明确,建设全市统一的数据开放平台,所有的数据开放主体均应当通过开放平台开放公共数据,原则上不再新建独立的开放渠道。已经建成的开放渠道,应当进行整合、归并,纳入统一的开放平台中。

上海立法所确立的目标是,通过这个统一平台,汇聚所有政府部门及公共管理和服务机构的开放数据信息,并为数据利用主体提供数据查询、预览和获取等功能。

如何开放?数据分类分级

公共数据体量巨大、浩如烟海。不同的公共数据,其安全管理、信息保护、开发应用的要求,均存在较大的差异。

例如,上海市所有星级饭店的基本概要数据,任何人都可以下载利用,属于安全管理要求较低的信息,也不存在特殊的数据监管要求。

再如,上海公交车行驶路线和到站情况的实时数据,属于动态、持续性的数据,对使用人的安全管理和技术能力有较高的要求,对使用场景和后续使用监管也有严格的限制。

为此,办法确立了公共数据分类分级管理制度,要求主管部门结合公共数据安全、个人信息保护和应用要求等因素,制定本市公共数据分级分类规则。数据开放主体应当按照分级分类规则,结合行业、区域特点,制定相应的实施细则,并对公共数据进行分级分类,确定开放类型、开放条件和监管措施。

办法规定,对涉及商业秘密、个人隐私,或者法律法规规定不得开放的公共数据,列入非开放类;对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据,列入有条件开放类;其他公共数据列入无条件开放类。当然,非开放类数据依法进行脱密、脱敏处理,或者相关权利人同意开放的,仍然可以列入无条件开放类或者有条件开放类。

数据的分类,与数据的获取方式以及后续的监管措施息息相关。

对列入无条件开放类的公共数据,任何自然人、法人和非法人组织可以通过开放平台以数据下载或者接口调用的方式直接获取,同时鼓励其进行数据的传播、使用。对于列入有条件开放类的公共数据,数据开放主体应当通过开放平台公布利用数据的技术能力和安全保障措施等条件,向符合条件数据利用主体开放。

同时,要求数据开放主体与数据利用主体签订数据利用协议,明确数据利用的条件和具体要求,并按照协议约定通过数据下载、接口访问、数据沙箱等方式开放公共数据。

底线在哪里?安全保障和权益救济

确保数据的安全使用、保护数据主体的合法权益,是办法从起草之初就特别关注的问题。

近期网上热议的ZAO软件收集人脸信息的问题,以及学校安装人脸识别仪器的事例,进一步凸显了社会公众对数据安全的关注。

为此,办法规定,在数据使用监管方面,数据利用主体应当按照开放平台管理制度的要求和数据利用协议的约定,在利用公共数据的过程中,采取必要的安全保障措施,并接受有关部门的监督检查。

数据开放主体应当建立有效的监管制度,对有条件开放类公共数据的利用情况进行跟踪,判断数据利用行为是否合法正当。

对于数据利用主体的违法行为,如采用非法手段获取开放平台公共数据、超出数据利用协议限制的应用场景使用公共数据等,主管部门有权采取限制或者关闭其数据获取权限等措施,并可以在开放平台对违法违规行为和处理措施予以公示。

此外,对于数据错误、遗漏的,社会公众可以通过开放平台向数据开放主体提出异议。数据开放主体经大致确认后,应当立即进行异议标注,并由主管部门在各自职责范围内,及时处理并反馈。

对于社会公众认为开放数据侵犯其商业秘密、个人隐私等合法权益的,可以通过开放平台告知数据开放主体采取中止开放的措施,并提交相关证据材料。

在处理方面,借鉴互联网法律领域的“红旗原则”。

数据开放主体收到相关材料后,认为必要的,应当立即中止开放。

同时,对相关证据进行核实,再根据核实结果,分别采取撤回数据、恢复开放或者处理后再开放等措施,并及时反馈。

一个备受争议的问题:能否收费

公共数据开放是否可以收费?在立法过程中,这一问题争议极大。

有观点认为,根据《政府信息公开条例》第42条的规定,行政机关依申请提供政府信息,不收取费用。但是,申请人申请公开政府信息的数量、频次明显超过合理范围的,行政机关可以收取信息处理费。后面一款的规定,主要是为了防止滥用信息公开的权利。类推可知,公共数据开放,也不得收取费用。

另有观点则认为,如前所述,数据开放与信息公开存在很大的差异。数据开放强调数据的原始性,而原始数据开放的成本要高得多,需要对数据进行治理、更新,对系统进行维护、对使用进行监管,有的数据开放还要提供实时的、不间断的传输服务。显然,这些额外的成本比政府信息公开要高得多。

笔者认为,正因为数据开放与信息公开存在较大差异,在某些情况收取适当的费用可能是合理的。数据开放更多的带有一种服务性质,特别是数据的采集、加工、治理均有成本。

在数据开放中,有些数据利用主体会提出个性化的需求,或者数据使用量特别巨大、使用时间持续较长,而且往往这些数据利用行为是出于商业目的的考虑。

对此,显然不应当通过财政支出来满足商业企业数据利用的个性化需求。财政支出,就是纳税人买单。全体纳税人不应当为个别主体的个性化需求来买单。

另外,在我们调研过程中,企业谈到收费问题是,大多数都表示愿意通过适度付费的方式来获取公共数据。

目前难度在于,根据现行的财政管理制度,行政机关即使收取费用,也是实行收支两条线管理,并无法将该费用直接用于数据开放。

为此,办法中对该问题没有做出规定,采取了立法留白处理,为将来政策进一步确定留出空间。我们认为,将来比较理想的方式是成立法定机构,专门负责个性化的数据利用需求,并可以按照透明、微利的原则收取适度的费用,所收费用只能用于改善数据开放的质量。

最后,我们必须说,公共数据开放非常重要,代表了未来的一种发展趋势,但我们不希望它成为一种放之四海而皆准的万能工具——因为越是万能的,就越是空洞的。

标签: 政府数据 公共数据 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:区块链数据分析很大的挑战

下一篇:在时间关系数据上AutoML:一个新的前沿