上篇 | 油气生产实时数据质量检测解决方案:业务现状和需求分析

 

随着西北某油田物联网建设范围的全面覆盖,目前已基本完成油气生产物联网、工程技术物联网、电力新能源物联网建设。截止目前,实时数据采集点数量已超过70万点,平均每天产生数据量为6亿条以上。在油气生产过程中,实时数据是生产监控、优化调度、安全预警及决策分析的核心依据,其质量直接影响生产效率与运营安全。然而,受现场设备故障、传输干扰、人为操作偏差等因素影响,实时数据常出现缺失、异常、不一致等问题。为满足海量数据的准确性需求,保障数据质量,应建立一套标准的数据管理机制,实现有效数据的质量,提升管理效率。

油气生产数据业务现状

 

实时数据除了规模大还具有复杂性

向下滑动阅览

◆ 影响因素的多样性。在实际生产中,影响数据质量的原因较多,采集的质量问题、传输的质量问题、存储的质量问题等,不同生产场景的数据质量不尽相同,各个方面的影响因素同时存在。

◆ 行为发生的延迟性。数据质量欠佳的情况有时候不会突然表现出来,由历史因素的积累、平台同步或者工具技术的缺陷等因素导致。

◆ 多种数据的相关性。自动采集获取的数据具有很强的相关性,借由集输系统的流程节点,可获悉多种类采集数据的逻辑关系,并根据生产经验判断其合理性。

◆ 采样时间的差异性。由于实际采集数据类别多元,采集设备不尽相同,采集频率各有差异,因此呈现出多种时间尺度,如毫秒级、秒级等。

实时数据质量参差不齐,问题多样

(1)实时数据量大,无法做到实时质量控制。包括超过量程、数据为空、数据连续不变等无法判断数据齐全准,同时也无法判断数据是否为机器产生的假数据。

(2)实时数据与油气生产日报数据会存在不一致。

(3)实时数据是否反映现场真实情况无法判断。比如通过功图数据,识别了异常工况,但通过开井时率又是24小时,因此需要联合判断数据是否正常。

数据质量评价难度大、缺乏智能化手段

◆ 现有的数据评价方法大多依赖于数据提供者或使用者的人工观测判断。

◆ 人工形式观测数据时,有明显逻辑错误的数据易被观测,异常值变动不明显的难以被发现,该方式存在一定的滞后性。

◆ 同时,由于数据采集的密度大,在追溯低质量数据产生的时间点时,产生的工作量也较大,且没有统一的度量标准,也会影响异常情况的判别。

需求分析

通过大数据、人工智能等技术手段,一是及时识别出数据质量异常情况;二是通过建立数据质量评价指标,反映数据质量管理情况,及时进行溯源分析并进行整改。

通过数据质量检测与管控,提升数据质量

◆ 实时数据量大,难以做到实时质量控制,数据质量参差不齐。

◆ 数据齐全准:超量程、空值、死值等

◆ 数据有效性:假数据

◆ 数据合理性:不符合真实生产状态

◆ 数据一致性:不符合参数间关联关系、与人工标注/上报数据不一致

构建异常数据处理机制,提供高价值数据源

一方面,针对数据异常识别出的问题,进行数据处理,如空缺值补值、异常值处理等;另一方面,结合数据应用需求,提供数据降频等数据服务

构建数据质量评价指标,实现闭环管理

通过平台建立实时数据质量的闭环管理,根据异常数据情况,定义数据质量统计指标,按单位、实体对象统计形成各单位质量情况报告。各单位完成整改工作后,能对异常数据进行复检复查。构建“异常识别-数据处理-指标评价-溯源分析-核实整改”的闭环流程。

综上所述,面对油气生产实时数据规模庞大、类型复杂、质量参差不齐的现状,建立科学、系统的实时数据质量管控体系已成为提升生产效率与运营安全的关键。

下篇内容将围绕该体系的设计目标、核心研究内容与关键技术路径展开介绍,探讨如何通过“实时监测—智能诊断—自动修复—闭环管理”的全链路机制,打造可落地、可推广的油气生产实时数据质量检测解决方案。