基于OFD格式的数字化政府采购文件规范

  2023-04-04      1050

作者:向冰(布络软件)   发布于:20230404

来源:中国政府采购采购报


   近年来,借着互联网的“东风”,各地纷纷建立了政府采购交易系统,但是各系统间相互孤立,数据无法连通,信息孤岛状况突出。供应商、采购代理机构需要注册多个账号,办理不同的CA证书才能参与政府采购,无形中增加了政府采购成本。

            20224月,《关于加强数字政府建设的指导意见》发布,提出把数字技术广泛应用于政府管理服务,推动政府数字化、智能化运行,而加强地区协作联动,让公共数据跨部门、跨区域、跨行业的安全高效共享也是数字政府的应有之意。加快政府采购平台从电子化的2.0版本向数字化的3.0版本转型升级是适应新一轮科技革命和产业变革的趋势。

   本文提及的OFD文件格式是实现这种转型升级的可行性手段,不仅能够帮助政府采购文件完成由纸质档向电子档的转换,还能够计算、分析、对比其中的数据,将数据结构化处理、量化呈现。同时,得益于严密的设计,OFD格式文件具有难以被篡改的特质,可以最大限度地保证政府采购文件的安全性。此外,OFD格式文件是遵循国家统一标准制定的文档版式,具有广泛的应用基础,可以避免因建设全域统一新平台对原有资源造成浪费。

政府采购文件从1.03.0的进化之路

   上世纪90年代,我国开启了对政府采购信息化的探索之路,经过几十年的建设和发展,政府采购活动线上开展已经基本实现,政府采购文件的形态也在不断改变。

   伴随着互联网的出现,政府采购进入了1.0时代,即信息化时代。各省(自治区、直辖市)将当地政府采购网作为政府采购官方信息发布平台,供应商通过政府采购网获取采购公告,线下参与投标。

   在电子化政府采购系统建设完成后,政府采购进入了2.0时代,即电子化时代。该系统将原来通过线下递交的纸质文件电子化,实现了线上开标、电子化辅助评审。但是该时期的政府采购交易文件仍以WORDPDF格式为主,这一类的文件我们称之为非结构化文件。非结构化文件系统识别效率低,不能形成有效的政府采购数据资源体系。

   政府采购3.0时代,即数字化时代。在3.0时代,数字化政府采购系统将大量交易过程中的非结构化文件抽象建模,形成标准化数字文件,打通数据壁垒,使采购交易数据在采购各方当事人及系统中无障碍流动,利用RPA(机器人流程自动化)技术自动识别、分析、处理采购交易数据,实现政府采购平台智能化。

选择OFD格式文件作为政府采购文件数字化文件载体

   政府采购交易过程文件包括资格预审文件、资格预审申请文件、框架协议征集文件、框架协议征集响应文件、采购文件、供应商投标响应文件以及开标记录、澄清函、澄清回复函、评标报告、质疑函、投诉函、中标(成交)通知书等。前文已经提到,在1.0时代,这些文件是线下提交的纸质文件;在2.0时代,这些文件是以WORD文件或PDF文件存在的非结构化文件;在3.0时代,需要将上述交易文件抽象建模,形成标准化数字文件。

   那么,在政府采购3.0时代,是重新定义一种文件类型来作为政府采购数字化文件的载体,还是采用通用的文件格式作为载体呢?如果重新定义一种新的文件格式,就需要有通用的文件生成系统和文件阅读工具,类似于PDF格式文件的生成系统和阅读工具一样,而这样成熟的新文件格式短时间内难以形成。因此,政府采购数字化文件格式最好满足以下三点要求:一是选择采用已经被广泛使用的成熟的文件格式,便于推广执行;二是既要便于阅读,也要方便计算机在文件中读取结构化的数据;三是要满足政府采购文件不可抵赖、不可篡改的要求。通过对目前常用文件格式的筛选,可以发现OFD格式文件完全符合这样的要求。

           OFD文件的全称是“Open Fixed-layout Document”,是由工业和信息化部软件司牵头,中国电子技术标准化研究院成立的版式编写组制定的版式文档国家标准(GB/T 331902016),属于中国自主格式的电子文件,是国家战略资源的重要组成部分。OFD标准基于XML对版式格式进行描述,便于应用扩展,并支持国产密码算法等技术。自发布以来,OFD文件格式在数字票据、数字公文、数据交换、数字档案管理等方面的应用日益广泛。因此,选用OFD文件格式作为政府采购数字文件的载体既有国家战略层面的支撑,又有广泛的应用基础,便于在采购人、代理机构、供应商之间流转推广应用。

基于OFD格式政府采购文件实现结构化数据的存取

            OFD是将文字、图形、图像等多种数字内容对象按照一定规则进行处理而呈现的电子文档格式,是国家电子文件管理的基础文件格式之一,在版式、版面、字体、字号等方面与纸质文件保持完全一致。版式文档格式的特点使其成为严肃类电子文档发布、数字化信息传播和存档的理想文档格式。

           OFD文件格式采用“文档+容器”的文件存储结构,容器包内可包括OFD基本信息及组织结构描述文件、OFD页面、OFD密码应用相关文件和扩展附件等。“文档”部分属于使用者可见部分,即使用者上传的文件,容器部分为机器读取部分,在文档上传后机器将读取后的数据进行结构化处理,以数据文件包的方式存放在OFD文件的附件节点(attachs)中。不同于PDF等文件格式只具备某种单一的功能,OFD文件格式可以按照使用者需求进行功能扩展,使用者包括但不限于采购人,监管者、代理机构等政府采购活动参加者都可使用。

  在文件上传到系统后,OFD格式文件就会变成一个数据抓取器,使用者在系统内设计好统一的需求标准,系统接收到提取文件信息指令后就会抓取可用信息,经过检索后就会在一个页面集中展示。对供应商而言,在投标文件以WORD形式编制完成上传到系统后,机器就会开始读取数据,自动分析其中的项目名称、项目编号、报价等信息,并按照统一标准将结构化后的数据存储在OFD文件的附件节点(attachs)中。在机器完成计算、分析、对比后,全部参加该项目的供应商的投标信息就会量化地呈现在采购人的后台页面中,便于采购人查阅和筛选。在此过程中,供应商编制并上传的投标文件、采购人后台页面的内容属于肉眼可见部分,而机器计算、分析、对比的过程属于机器读取部分。对于监管者而言,OFD文件格式不仅可以应用于对围标、串标行为的监控中,也可以应用在对营商环境的考评:参评者将文件上传至系统后,机器就会自动计算、对比、分析参评项目,按照权重生成结构化数据,最终将所有参评者数据呈现在监管者的后台界面。

政府采购数字化交易文件的完整性保证

   政府采购数字化交易文件的完整性,即政府采购数字化文件的原始性和真实性,能够保护政府采购文件不被篡改是OFD文件格式的一大优势。OFD文件是一个ZIP文件,从技术机制上可以包含各种文件,为了支持防篡改机制,OFD文件中需引入完整性保护描述文件,该文件会对上传的文件进行复杂的描述,生成特征码。

按照《GM/T 0099-2020开放式版式文档密码应用技术规范》标准的规定,如果一个OFD文件包内的文件在按照“OFD.xml”“Encryptions.xml”及其衍生文件与系统内的所有特征码进行比对后仍未被任何其他文件识别,就属于“夹带文件(篡改过后文件)”。“夹带文件”的存在对于OFD文件的安全性和完整性来说是一个威胁。

  为了保证文件的完整性,在生成OFD文件时应遵循以下原则:一是把所有OFD内容的关联文件,放入一个“清单”,也就是完整性保护文件;二是对完整性保护文件实行带有时间戳的数字签名;三是把上述两者放入OFD文件包内打包。

  在验证完整性时,按照以下步骤:一是验证签名是否正确;二是将该文件与特征码进行比对,如果有文件不在完整性保护文件列表中,就认为是“夹带文件”。

   在政府采购3.0时代,数字化文件标准是数字化政府采购平台的基础标准。只有做到书同文、车同轨,让政府采购数据在各个系统之间无障碍流通,才能联合各方力量,取长补短,以最先进的思路、最前沿的技术建立统一、开放、互信、多元的数字化政府采购生态系统。

 

(作者单位:成都布络软件技术有限公司)



QQ咨询

在线咨询

电话咨询