为了实现对城市污水缺失数据的补偿,设计一种基于ISVM的缺失数据补偿模型. 模型架构图如图 1所示. 设定训练集为Ω={(Xi,yi)∣i=1,2={(Xi,yi)∣i=1,2, 3,⋯,n},Xi∈Rn,yi∈R3,⋯,n},Xi∈Rn,yi∈R ,其中,xi为n维的样本输入数据,yi为相应的补偿输出数据. 然后,将输入的城市污水向量X经过非线性变换φ:X→φ(X),Rn→ORn→O ,映射到高维空间O,再在高维特征空间通过线性函数 yi=w′⋅Xi+byi=w′⋅Xi+b 进行回归,获得缺失数据的补偿值. 其中b为阈值,w′为权值向量.
为了避免ISVM数据补偿模型出现过拟合,提高模型泛化能力,降低经验误差,设计模型优化目标为
式中:ξi、ξi*为误差向量;C为误差惩罚系数,作用是降低模型复杂度同时减小经验误差;ε为损失函数的参数;b为阈值.
式(7)的目标优化过程为凸二次规划问题,因此,采用Lagrange函数求解,即
式中αi*、γi*为拉格朗日乘子. 对w′、b、ξi、ξi*分别求偏导,得到权值向量
为了避免维数过高带来的计算复杂度,文中采用径向基核函数
得到ISVM的回归函数为