摘要: 对研究水质的一种多元统计方法——主成分分析法做了详细介绍, 并对主成分分析法在河流、地下水、矿区、湖泊水质评价中的应用进行了综述, 简要分析了主成分分析法在水环境质量评价中尚有不足之处。
关键词: 主成分分析法; 水环境; 水质评价
中图分类号: X82文献标识码: A文章编号: 1673- 9655 (2011) 01- 0075- 04
水环境包括地球表面上的各种水体, 如河流、湖泊、水库等地表水以及埋在土壤、岩石空隙中的地下水。因此, 水环境评价包括地表水、地下水、水生生物、底质等评价。水环境质量评价是环境质量评价的主要内容, 它为水资源合理开发利用和水体污染综合防治提供科学依据, 是国民经济和人类社会健康、持续发展的重要工作之一[1] 。在评价中常用的数学方法有简单指数法、分级加权评分法、普通概率统计法和模糊数学法等。由于水质系统是由各种污染指标变量组成的复杂系统, 各个因子之间具有不同程度的相关性, 每一个因子都只从某一方面反映水质质量, 因此依据它们作综合评价有一定的难度[2]。
主成分分析方法将多因子纳入同一系统进行定量化研究, 是比较完善的多元统计分析方法[3] 。近年来, 主成分分析法在水质评价中被广泛研究与应用, 并取得了不少成果, 从而成为研究受多因素影响系统的有力工具[4, 5] 。
1主成分分析法
1.1主成分分析法介绍
主成分分析法(Princ ipal Components Ana lysis)也称定量分析[6] , 由Ho telling 于1933 年首先提出, 主要是利用降维思想, 把多指标转化为少数几个综合指标的多元统计分析方法。这些指标是原指标的线性组合, 且彼此不相关, 它可以在力保原始数据丢失最少情况下, 对高维变量空间进行降维。
1.2主成分分析法的基本原理[7]
设P个进行综合评价的原始指标: x1, x2,…,xp, 并假定这些指标在n 个单位之间的初始目标是将这些原始指标组合成新的相互独立的综合指标y1, y2,…, yp, 式中, 指标yi互不相关。因为每个新指标yi 都是原始指标的线性组合。实际上, 主成分分析是将p 个原始指标的总方差分解为p 个不相关的的综合指标yi 的方差之和λ1+ λ2 + λ+λp, 而且使第一个综合指标yi 的方差达到最大(贡献率最大); 第二个综合指标y1, y2,…, yr (r < p), 即包括总方差中的绝大部分信息。我们称它们为原始指标的第一, 第二,…, 第r个主成分。即: 主成分分析法可以使原始指标的大部分方差“集中”于少数几个主成分上, 通过对这几个主成分的分析, 实现对总体的综合评价。
1.3主成分分析法分析的主要步骤
(1) 列出指标数据矩阵X;
(2) 计算X 的协方差矩阵S;
(3) 计算协方差矩阵S (或相关矩阵R) 的特征值λ和特征向量L (即指标X的系数) ;
(4) 计算贡献率和累计贡献率, 并据以确定主成分(即综合指标y1) 的个数, 建立主成分方程;
(5) 解释各主成分的意义, 并将各单位的原始数据代入方程中, 计算综合评价进行分析比较。
2主成分分析在水环境质量评价中的应用
2.1对河流水质的质量评价
Dat la等[8] 用主成分分析法分析根德拉河监测水质参数的数据矩阵, 其结果表明5个主成分硝酸盐、悬浮固体、氨、水温、混浊物形成的数据集占据总方差76% , 这对评价根德拉河的河水水质起到重要作用。伊元荣[9] 等利用主成分分析法将不同区域进行比较分析, 研究伊犁河水质特征, 结果表明, 在监测的8 个断面中, 有4 个处于轻度污染, 1个处于中度污染, 河流水质较好的断面达到63%, 主要分布在河流上下游; 其中有3个断面污染严重, 原因是伊宁市所排放的工业废水与生活污水对河流水质造成了一定程度的污染, 并提出了严格控制水污染源的数量, 加大水质保护和治理力度的措施。Chatterjee等[10] 用主成分分析法对达莫尔河水质进行评价, 通过分析显示3个因素导致环境变量的差异, 河水取样点的理化参数的平均值一直高于世界卫生组织, 因此必须采取补救措施以控制达莫尔河及其下游家庭用水的污染。王晓鹏[11]提出水质综合评价的主成分分析方法, 并以该方法对湟水流域内典型断面的水质污染程度进行了定量化评价, 实证分析的结果表明: 主成分分析方法是一种切实可行的水质综合评价方法, 对其它环境质量评价问题也有一定的参考价值。张学兵和陈业勤[12] 利用主成分分析的方法, 找出了影响淮河淮安段2007年水质的主成分为溶解氧、化学需氧量和生化需氧量, 通过计算各样本的主成分得分, 并用聚类分析的方法将样本水质分类, 结合分类结果及水质综合评分对各样本水质进行了评价。Varol等[13] 用多元统计方法中的主成分分析法对Behrimaz河流流域水质在1a内4个不同地区监测的20个数据分两个阶段进行分析, 水质参数的变化主要和可溶性矿物的排放和有机污染、农业活动有关, 这项研究分析和解释了数据集多元统计技术工具对水质的评价, 查明了污染因数和空间时间的变化, 有效地管理了水质。胡香芳等[14] 利用1984到1998年的监测资料用主成分分析法对三江交汇处的3个断面水质做分析, 结果表明: 3个断面的水质受硝酸盐氮的影响比较大, 丰水期和平水期受悬浮物和化学需氧量的影响比较大。交汇前, 小南门断面的水质综合污染最严重, 凉姜沟断面的水质综合污染最轻; 江口断面的水质在两者的缓冲下, 水质综合污染居中, 说明主成分分析法为河流的综合治理提供了科学依据。李经伟等[15] 在对白洋淀水质分析中发现, 主成分分析法能从整体上准确反映河流各段的水质情况, 可使水环境管理者发现污染问题, 对受污染的水资源采取相应的净化措施。
2.2主成分分析在地下水中的应用
埋藏在土壤、岩石的空隙、裂隙和溶隙中各种不同形式的水统称为地下水[16] 。地下水水质评价是地下水资源评价的一项十分重要的内容, 它的主要任务是根据地下水的主要物质成份和给定的水质标准, 分析地下水水质的时空分布状况, 为地下水资源的开发利用和管理提供科学依据[17] 。地下水是城市市区主要的饮用水源, 由于城市的发展, 水质受到严重威胁, 水质监测先决条件是确保其适合饮用, 用统计分析中的主成分分析可以简化大量信息且没有损失, 可以合理管理集中的数据, 用此方法对水质指标处理并得出结果可以反映饮用水质的具体指标的重要性[18]。
Halin等[19] 用统计学方法评价了孟加拉国东部地区浅层含水层有机质的成分, 用主成分分析法对4组井进行分析, 并且每组井代表不同的理化特性, 其中第三组井显示, 砷、铁、锰、溶解性有机碳、磷酸根和碳酸氢根高于第一组和第二组, 通过对研究区这些参数的分析表明, 不同组的井, 铁还原溶解的锰占主导地位, 这有利于地下水中微生物的降解。王嵩峰和周培疆[20] 运用主成分分析法对1991~ 1999年邯郸市地下水主要污染指标年均值进行了探索性评价研究, 分析结果表明, 邯郸市地下水的主要污染因子有: 总硬度、亚硝酸盐氮、大肠菌群、硫酸盐和氨氮, 在计算主成分综合得分的基础上对邯郸市地下水进行了分类, 通过对不同年份水质类别的对比发现其有恶化的趋势, 提出了尽快实施南水北调工程, 是改善邯郸市地下水质量势在必行的措施。
2.3在矿区水质评价中的应用
煤炭资源的开发和利用, 对环境造成了较大影响, 矿区的地下水资源遭到了人为的破坏, 势必引起区域性地下水水位下降、地下水水质污染等地下水环境地质问题, 使矿区的饮用水出现问题。对地下水水质做出客观的评价, 进而采取有效的污染防治措施, 是保护地下水资源的重要举措[21] 。高卫东[22] 采用多元统计主成分分析法对焦作矿区的9个地下水样的6 个水质指标(总硬度、溶解性总固体、SO42- 、Cr6 +、F-、总大肠菌) 进行分析计算。结果发现, 从原始数据
提取占总方差84.809%的3 个因子(总硬度、溶解性总固体、SO42 -) 可以反映该矿区地下水的污染程度, 大部分水水质总体较好, 轻度处理后可以作为生活饮用水或工业用水利用。另外, 将主成分分析法引入到焦作矿区孔隙水污染综合评价中, 为矿区地下水利用、污染防治提供了可靠依据。蒋群等[23] 运用主成分分析法分析淮南矿区23个地下水样的溶解氧、化学需氧量、生化需氧量、总含磷量、高锰酸盐指数、总含氮量和氨氮等7个水样指标, 提取出4个主成分(溶解氧、化学需氧量、生化需氧量和氨氮) 贡献了特征值的92.462%, 应用聚类分析对该4个主成分的得分进行聚类, 聚类后的水质评价将前几个主成分的得分和其对应的特征相乘, 然后取水质综合评价分数的平均值, 简化了评价过程,克服了传统生物指标和理化指标难以综合评价的缺陷, 为今后水质评价工作提供了一项重要手段。
2.4在水环境其它方面的应用
有很多学者, 把主成分分析法用在湖泊水质的评价上, 并且取得很多成果。陈书琴等[24]提出了主成分分析赋权法, 并使用主成分赋权灰色模型对东五里湖5个监测点的总含磷量、总含氮量、溶解氧、化学需氧量、高锰酸盐指数和氨氮监测数据进行了综合评价, 发现溶解氧和化学需氧量为第一、第二主成分, 它们的特征根大于,l 且所解释的方差的累积贡献率为82.154%。采用主成分赋权与传统赋权灰色模型评价结果吻合度较好, 各监测点水质评价等级最终隶属度下降明显, 评价更为精确、合理。张成甫等[25] 根据成都市地表水环境质量现状, 利用主成分分析法对其境内下辖的3条河流——府河、沙河、南河的溶解氧、化学需氧量、生化需氧量、氨氮、表面活性剂、硫化物、挥发酚、石油类、粪大肠菌群等9项指标进行评价。研究发现, 生化需氧量、氨氮、粪大肠菌群等生活废水指标对污染综合指标的贡献最大, 反映了沿河两岸的生活污水排放对水体的污染比较严重。另外表面活性剂这一指标为第二大类主成分, 反映了洗涤行业工业废水的污染状况。从而得出未来提高三条河流水质质量的关键是要提高生活污水收集处理率, 并加大对洗涤行业的整治力度。
3结语
主成分分析法是多元统计方法中比较重要的一种方法, 它能充分利用全部数据所包含的信息, 以主成分贡献率作为指标权重值, 不需要专家咨询,具有很强的客观性和全面性, 是解决定性问题定量化的一种行之有效的好方法。在评价水质中, 采用主成分分析法, 借助SPSS软件处理数据, 能够全面反映水资源各项指标的综合污染程度, 为进一步研究水环境质量提供有力的保障。但是, 在某些情况下不能完全代替定量分析; 另外, 这种方法的应用在很大程度上还受到统计数据等因素的制约。
参考文献:
[1]刘春龙. 改进的主成分分析法及其在水质评价中的应用[J] .安徽农业科技, 2009, 37 (22) .
[2] YaoHM, H uang RT, Gan FX, L iuY. Principal component analysis of the water quality evaluat ion in east lake [J] . Geomatics and in form at ion science of wuhan university, 2005, 30 (8) .
[3] 邱东. 多指标评价方法的系统分析[M]. 北京: 中国统计出版社, 1991.
[4] Ch en DJ, M a AQ, Xu ZM, Ch eng GD. The application of factor analysis in water quality evaluation [J]. H ydrology, 2002, 22(3).
[5] 潘安娥, 杨青. 基于主成分分析的武汉市经济社会发展综合评价研究[J] . 中国软科学, 2005, (7) .
[6] 何晓群. 现代统计分析方法与应用[M]. 北京: 中国人民大学出版社, 2003 .
[7] 刘永才. 统计分析中主成分分析法与应用[J ]. 电工理工,2005, (2) .
[8] Dalal SG, Sh irodkar PV, Jagtap TG, et al Evaluation of significant sources influencing the variation of water quality of Kandla creek, Gulf of Katchchh, using PCA [J] . Environmental Monitoring and Assessment, 2010, 163 (1- 4) .
[9] 伊元荣, 海米提·依米提, 等. 主成分分析法在城市河流水质评价中的应用[J]. 干早区研究, 2008, (4) .
[10] Ch at terjee SK, Bhattach arjee I, Chand ra G. . Water quality assessment near an indu strial site of Damodar River, India [J ].
Environment Monitoring and Assessm en t, 2010, 161 (1- 4) .
[11] 王晓鹏. 河流水质综合评价之主成分分析方法[J] . 数理统计与管理, 2001, (4) .
[12] 张学兵, 陈业勤, 冯梅. 淮河淮安段水质的多元统计分析[J] . 环境保护与循环经济, 2008, (8) .
[13] VarolM, S en B. Assessment of su rface water quality using multivariate statis ticaltechn iques: a case study of Behrimaz Stream,Turk ey [J] . Environmental monitoring and assessment, 2009,159 (1- 4) .
[14] 胡香芳, 刘丹. 主成分分析法在三江交汇处水质分析中的应用[J] . 四川环境, 2007, (8) .
[15] 李经伟, 杨路华. 改进的主成分分析法在白洋淀水质评价中的应用[J] . 海河水利, 2007, (3) .
[16] 宫辉力, 赵文吉. 地下水地理信息系统设计、开发与应用[M]. 北京: 科学出版社, 2006 .
[17] 倪深海, 白玉慧. BP神经网络模型在地下水水水质评价中的应用[J] . 系统工程理论与实践, 2006, 26 (1) .
[18] DasM, Kumar A, Mohapatra M, et a.l Evaluation of drinking quality of groundwater th rough mult ivariate techniques in urban area [J] . Environmental Monitoring and Assessment, 2010, 166 (1 - 4) .
[19] Halim MA, Majumder RK, Nessa SA, et a.l Arsenic in shallow aquifer in the eastern region of Bangladesh: insights from principal component analysis of groundwater composition s [J]. Environmental Monitoring and Assessment, 2009, 161 (1- 4) .
[20] 王嵩峰, 周培疆. 用主成分分析法研究评价地下水质量——以邯郸市为例[J]. 环境科学与技术, 2003, (12) .
[21] 杨娜. 模糊数学在焦作市地下水水质评价中的应用[D ].焦作: 河南理工大学, 2005.
[22] 高卫东. 基于主成分分析的矿区地下水水质评价[J] . 节水灌溉, 2009, (4) .
[23]蒋群, 许光泉, 梁修雨. 主成分和聚类分析应用淮南矿区地下水水质评价[J] . 能源环境保护, 2007, (4) .
[24]陈书琴, 许秋瑾, 颜昌宙, 等. 主成分分析赋权及其在水质评价灰色模型中的应用[J] . 昆明理工大学学报(理工版),2008, (4) .
[25] 张成甫, 朱杰. 运用主成分分析评价成都市地表水环境质量[J] . 西华大学学报, 2007, (11) .