为了去除与待补偿数据无关的变量,降低ISVM数据补偿模型的计算复杂度,设计一种基于主成分分析(principal component analysis, PCA)的筛选方法,筛选得到影响待补偿数据精度的关键变量,具体步骤为:
1) 根据式(3)获得归一化处理后的标准污水数据,求得标准化矩阵Z,Z=(zij)p×q,以及与Z对应的协方差矩阵V,V=(vjd)q×q,d=1, 2, …, q,vjd为待补偿污水数据和相关变量之间的相关系数,vjd表示为
2) 特征方程为|λI-V|=0,通过求解特征方程得到各特征值为λδ(δ=1, 2, …, q),并按由大到小的顺序对各特征值进行排序. 其中,I为与协方差矩阵V相对应的单位矩阵.
3) 求出与各特征值λδ相对应的特征向量eδ(δ=1, 2, …, q).
4) 计算各个相关变量与待补偿污水数据的相关性大小μj和累计贡献率G(l),分别为
然后,选取累计贡献率G(l)较大的前l个变量作为待补偿数据的关键特征变量.
使用式(3)~(6)分别对城市污水处理过程中的14种变量进行相关性分析,获得与待补偿数据具有强相关性的关键特征变量.