城市供水管网在城市水资源的分配上起着至关重要的作用,各种管网突发事故的发生,如爆管、 水质污染等,都会造成不可估量的后果.目前,大部分供水管网都设置了在线监测设备,通过监测数 据监控供水管网运行状态.实际运行中,在线监测 设备的异常或管网事故的发生都会引起监测数据的 变化而产生异常值.然而,连续不断产生的海量数 据完全超过了人工处理的限度,提取异常数据已经 是一项极其困难的任务,想要从中区分出由设备异 常产生的无效数据和表征事故的突变数据更无从谈 起.因此,在人工判断的情况下,在线监测数据的 准确性无法保障,这对判断供水管网是否发生事故 也造成了极大阻碍.近年来,大量研究集中于供水 管网中监测设备的优化.Chang等[1]开发了基于强 度、可达性和复杂性的决策支持系统,以这种低计 算负荷的方法生成近优的传感器布局策略,来加强 小型供水管网污染事故的检测能力.Perelman等[2] 提出了管网中移动传感器运动的建模理论,比较了 在管网中单独使用固定传感器与固定和移动传感器 相结合使用的优缺点.但即使监测设备有了科学合理的设置和布局,异常的监测数据仍有可能出现. 针对这种情况,对海量数据进行自动处理并识别其 中的潜在异常值,压缩人工识别处理量,剔除和替 换无效数据,从而达到数据质量控制的目的极为 必要.
自回归滑动平均(autoregressivemovingaverG age,ARMA)模型是使用最为广泛的基于数据的统计学模型,与人工神经网络模型等其他基于数据的 模型都在过去的几十年中被运用到了供水领域中. Behboudian等[3]利用人工神经网络模型预测城市长期用水量;Nazif等[4]利用人工神经网络模型模拟管网中各节点的压力和漏损量,从而通过压力管 理来减少漏损;王丽娟等[5]对实际供水管网的漏损 数据进行统计分析,建立了预测管网漏损的差分自 回归 滑 动 平 均 (autoregressiveintegrated moving average,ARIMA)模型;孙平等[6]利用 ARMA 模 型进行了水厂日需水量的预测;Huang等[7]利用核偏最小二乘(kernelpartialleastsquare,KPLS)模 型和 ARMA 模 型 预 测 了 城 市 年 用 水 量;Mounce 等[8]在建立模式库后,利用自关联人工神经网络进行模式匹配,在管网监测数据中检测异常的数据序 列.然而鲜有研究针对供水管网在线监测数据的质量控制.
针对上述情况,本文利用供水管网中独立监测 节点的历史数据构建 ARMA 模型获取预测置信区间,同时结合数据反馈矫正提高模型的准确性,实 现高效准确地提取监测数据中的异常值.该自识别 过程将极大压缩需要人工判断的在线监测数据量, 仅需在少量异常值中由人工甄选出无效数据,从而 实现数据的质量控制,由此建立了一套基于自识别 的数据质量控制方法.