天然气勘探与开发 2015年1月出版 数字油田建设中的数据质量控制方法研究 张华义刘新罗涛 (中国石油西南油气田公司勘探与生产数据中心) 摘要在当前数字油田建设中,数据质量的好坏,直接影响数字油田建设的成果和决策水平。通过全面分析 数据质量的现状与原因,明确提出了数据质量目标、数据质量定义和数据质量控制步骤,重点阐述了完整性、规范 性、一致性、及时性等数据质量指标的控制方法以及实施策略,规范了油田.g, k,-司全面数据质量管理体系的建立步骤 和实施进程。图11表1参3 关键词 数据质量 数据质量目标数据质量控制方法全面数据质量管理体系 O 引言 作为信息系统的重要构成要素,数据质量问题 是影响信息系统运行的关键因素,直接关系到信息 系统建设的成败。目前,油气田数据建设的质量控制 基本上没有形成有效的体系,在控制方法方面,没有 充分利用现代信息技术和数据库技术来解决数据质 量问题,大多采用比较落后的人工校核方法,这样难 免出现漏项和片面性,数据质量得不到真正的、全面 的保证。为了保证油气田数据质量,有必要开展基于 信息技术的质量控制方法研究,需要建立一个有效 的数据质量管理体系。 图1 数据质量基本要素构成图 1 基本概念 1.1数据质量概念 1.2数据质量现状 从信息系统的角度来说,数据质量问题可以划 分为单数据源问题和多数据源问题。 在不同时期,数据质量有不同的概念和标准。2O 世纪80年代以前,国际上关于数据质量的标准基本 上是以数据准确性为出发点。但是随着数据质量含 义的不断延伸,对数据质量概念的认识也从狭义向 一单数据源数据质量问题出现在单个数据集(如 个文件或一个数据库)中,主要包括:①数据缺失, 数据记录为空或数据项缺失,这可能是人工录入数 据时存在误操作或采用了缺省等原因引起的,在数 据输入时应加入一定的校验手段,并给出提示,在源 广义转变,准确性不再是衡量数据质量的唯一标准。 总的来说,现代数据质量概念主要包括以下3个方 面:①注重从用户角度来衡量数据质量,强调用户对 数据的满意度;②数据质量是一个综合性概念,应从 多角度来评价数据的好坏;③通常以完整性、规范 性、准确性、一致性、及时性等要素来描述数据质量 (图1) 头杜绝此类问题的发生;②数据重复,数据集中有多 条相同的数据记录,这需要在数据进入信息系统时, 及时对某些关键属性的唯一性进行检验;③数据关 联错误,数据关联包括实体在内属性之间关联和实 体间的关联,这两种关联均有可能引起相应属性值 之间的不一致 作者简介事 张华义,男,1963- ̄生,高级工程师;1987年毕业于成都理工大学应用数学系,。长期从事油气勘探和资源评价研究,现主要从 。田数据库和信息化建设工作地址:(610041)四川省成都市天府大道北段12号石油科技大厦电话:(028)860151o2。E-mail: sc zlay petrochina.com.cn ・88・ 第38卷第1期 天然气勘探与开发 图11 全面数据质量管理进程图 6 结论 数据质量作为影响决策正确性的基础元素。可 靠的数据是油田公司最具价值的资产,在数据质量 管理上所投入的人力和资金,将会在现在和未来得 到高额的回报。因此,在整个油田公司以及其服务 商、供应商内部。应建立科学有效的数据质量管理体 系,完善数据质量控制方法。建立科学、实用的数据 质量控制工具并运行,对油田公司的数据质量实施 全程、全域控制,将数据质量管理以制度化、规范化 的方式落实到数据生成、传递和使用的各个过程之 中。 参考文献: 1 商广娟.有效的数据质量管理体系一21世纪管理的基石 【J1.航空标准化与质量,2005,(2). 2谷斌.信息系统建设中的数据质量管理体系研究『J].情报 杂志,2007,(5). 3 王英洁.企业全面数据质量管理体系研究[AJ.见:中国电机 工程学会.2010电力行业信息化年会论文集,201 1. (修改回稿日期2014—02—23编辑陈玲) ・93・