为了验证文中基于ISVM的城市污水处理过程异常数据清洗方法的有效性,采用2019年北京市某污水处理厂真实数据进行实验,并对实验结果进行分析. 同时,为了证明该方法的精确性,将该方法与基于BP神经网络方法、线性插值方法、最近邻插值方法和卡尔曼滤波方法的数据清洗效果进行了实验对比.
本次实验共有570组污水样本数据,首先对污水处理过程中关键9种数据进行异常和缺失值分析. 通过分析对异常和缺失值变化较大的DO质量浓度数据进行预测补偿. 将370组正常数据样本分为两部分,随机选取220组数据作为模型训练样本,150组数据作为测试样本. 模型输入为PCA法筛选得到的关键特征变量:缺氧前端ORP、进水SS、进水COD、进水TP. 模型输出为DO质量浓度. 其中ISVM模型参数C、g通过PSO算法进行参数调优. 将基于BP神经网络的数据清洗模型的网络结构设定为9-10-1,采用非线性的Sigmoid函数作为传输函数,学习算法为最小二乘法,设定学习率为0.1,训练步数是1 000步.
根据仿真结果分析模型精度,比较二者的数据清洗结果. 然后,随机选择50组污水样本,分别采用基于BP神经网络的数据清洗方法、最近邻插值方法、线性插值方法和卡尔曼滤波方法对污水数据清洗效果进行实验,并与基于ISVM的数据清洗方法进行比较,通过RMSE对清洗效果进行对比,计算公式为
式中:yi为第i组样本中DO质量浓度的实际输出值;y⌢iy⌢i 为第i组样本中DO质量浓度的期望输出. 此外,为了验证PSO算法优化支持向量机参数后的模型清洗效果,文中运用调优后参数C、g进行模型测试,并与原模型通过RMSE进行实验对比,验证数据清洗效果.