摘要:本文简要阐述了RCM理念、分析方法在大亚湾核电站的应用,描述了RCM分析成果指导现有状态监测和维修运行活动的程序。自1998年引进RCM理论后经过3年多的应用及推广,规范了日常状态监测及分析诊断工作,在实际应用中取得了很好的收益。现在已基本上建立一套适合大亚湾核电站自身特点的RCM分析体系。阐述了RCM分析成果在提高系统可靠性方面和降低系统及设备的运行/检修成本方面带来的变化,介绍了利用ENTEK状态监测软件分析设备故障及设备故障处理跟踪流程,以GST为例介绍了gSE强大的故障诊断功能。通过本文可以使读者初步了解核电站采用RCM理论的必要性和它对核电站安全、稳定、经济运行所做出的贡献。
关键词:RCM,可靠性维修、状态监测,应用
1. RCM理念及其在大亚湾核电站的应用
1.1 RCM分析理念
以可靠性为中心的维修-RCM(Reliability-Centered Maintenance)是全面客观地评价和决策设备维修方式方法,提高预测维修重要性和权威性。它起源于70年代末的美国航空工业,目前已在国际上很多行业得到运用,在美国、法国、南非等国家的核电站早已普遍应用了RCM分析技术。
人们的维修观念随着科学技术迅速发展也在不断的变革,对设备故障的观点也发生了变化。20世纪50年代以前的设备故障观点比较简单,认为设备越陈旧越可能发生故障。在60年代随着设备复杂程度的提高,产生了“浴盆”曲线的观点。到70年代末随着高科技的发展,人们对设备故障的新研究认为:设备的实际故障曲线不是一种单一的“浴盆”曲线,而是六种曲线,其中三种与时间有关的故障模式曲线仅占所有故障模式的11%,而89%的故障模式与运行的时间无关。
RCM分析体系正是在这些研究的基础上发展起来的新的理念:并不是修得越频繁,设备就越可靠;同时RCM把我们从管理故障模式的观念转到了管理故障影响和故障后果的观念上来。RCM是用来确定任一设备在运行环境下保持实现其用户需求功能所必须的活动的一种科学方法。亦即,通过RCM分析方法,确定对哪些设备采取纠正性维修(CM)策略,对哪些设备采取定期维修(PM)策略,对哪些设备采取状态维修(PDM)策略。而通过这些必须的维修活动,确保系统设备保持实现其用户需求功能。
1.2 RCM在大亚湾核电站的应用
RCM的长处在于为确定哪些预防性维修是技术可行的、多长时间做一次预防性工作和为什么要做预防性工作提供了一个简单、准确和容易理解的判据。设备的定期大修只有在故障后果严重并无法准确预测且故障与时间有关的情况下才有必要,有条件则尽可能采取预测性维修。
RCM方法强调设备维修的及时性和准确性,所谓及时性就是避免系统功能丧失,所谓准确性就是尽量达到设备安全寿命极限,两者是辨正统一的。所以通过RCM分析不仅降低了运行、维修成本,实质上也保证了系统的可靠性。
大亚湾核电站从1998年开始探索应用RCM的可行性,并于1999年在美国籍RCM专家指导下,进行了冷凝水抽取系统(CEX)的RCM分析试点工作,并取得了很大成功。随后开始在大亚湾核电站的推广RCM理念,完成所分析系统的《维修导则》(Maintenance Base)和《维修大纲》的优化和升版。《维修导则》则是RCM分析小组的分析成果。完成RCM分析以下几个过程:
确定所分析的系统设施的功能和性能标准(编写系统功能);
确定功能失效模式,明确部件故障到什么程度才不能实现其功能,以及引起每种可能的功能丧失的原因(编写信息工作单);
分析故障影响和故障后果(编写信息工作单);
利用决策树,确定对不同设备所采用的维修类型和频度(编写决断工作单和FFI计算);
对RCM分析结果进行审查,将分析结果与现有的维修大纲作分析比较。
根据最终审定的成果形成《维修导则》,并修改维修大纲。
根据修改后的维修大纲,明确各个部门和专业的职责和任务,然后按照一套完整的维修管理体系保证设备的可靠运行。
3.RCM分析成果给电站设备管理带来的变化
3.1提高了系统设备的可靠性
RCM分析总是将有安全性和影响环境的故障后果评估进行预先判断,在分析过程中对此类故障给予高度重视,即使不能完全排出故障,也应把此类故障所带来的风险真正降到非常低的水平。下面以冷凝水抽取系统(CEX)的部分分析结果为例,阐述在提高系统可靠性方面带来的变化;
●凝结水抽取系统(CEX)是汽轮机的重要辅助系统,它设计有3台容量为50%的凝结水泵,其中两台凝结水泵运行1台泵备用。如果两台运行的凝结水泵有1台故障停运,而备用泵不能自动启动,造成的后果轻则发电机甩负荷到50%Pn,严重时会引起汽轮机跳闸,反应堆停堆。大亚湾核电站曾经发生过3次两台运行泵中的一台泵故障跳闸,其中有2次备用泵不能自动启动,备用泵自动启动成功的失效概率高达到66.7%。针对这一故障模式,RCM小组在分析过程中发现管理备用泵隐蔽性故障模式的定期试验程序存在明显的缺陷:尽管机组每次换料大修后也进行备用泵的自动启动试验,但试验时所采用的运行方式同实际运行方式完全不一样。试验时模拟一台CEX泵运行,两台CEX泵备用,当运行泵跳闸时优先备用泵自动启动,如果优先备用泵自动启动不成功,延时1s后次级备用泵自动启动。而实际运行时两台CEX泵运行,一台CEX泵备用,这种运行方式下备用泵的自动启动逻辑回路同有两台泵备用时的自动启动逻辑回路完全不一样,但我们的定期试验并没有针对这一隐蔽性故障模式进行管理。在RCM分析的决断工作单中,修改了定期试验程序,调整了试验方法和频度。在分析结果应用到实践中的两年多的时间内,大亚湾核电站又发生过3次两台运行泵中的一台泵故障跳闸,但是3次备用泵都能顺利地自动投运。使备用泵自动启动成功率提高到100%。理论上避免2次机组甩负荷故障,为核电站挽回重大的经济损失。
●RCM分析前CEX泵进出口隔离阀没有密封性试验,其直接后果是一旦泵在机组正常运行中故障需要进行在线检修时,该泵将因阀门无法有效隔离而不能检修,机组将长时间失去备用,大大降低机组运行的可靠性。RCM分析后增加了密封性试验。在密封性试验中,果然发现泵进出口隔离阀存在设计缺陷,使得无法对CEX泵进出口隔离阀有效隔离,从而提出对隔离阀进行改造,改造后密封效果良好。
●RCM分析前CEX系统三台泵实行的是定期检修,检修周期较短,检修质量不能保证,检修再鉴定经常出现泵振动比检修前大的情况,这样,浪费了大量时间、精力和金钱,却起到了反面的效果。现在该泵采用状态检修,通过周期性振动测量来确定设备是否需要检修,节约了大量的维修成本。
3.2降低系统和设备的运行及检修成本
RCM分析方法的应用对企业最大的好处是在提高系统设备可靠性的同时降低了运行维修成本。RCM理念认为几乎所有的解体大修本身就是一种故障的形式。从运行系统中拆除一个设备进行解体大修,就意味着这个设备不能为系统运行提供它应该提供的服务。因此,解体检修的目的就是为了使设备提前进入一个后果相对小的故障状态,以避免在运行中发生更为严重的后果。在分析和决断过程中,分析和判断设备故障的影响及后果,判断运行设备是否有备用,备用设备是否可以在线维修,设备故障是否与时间有关,是否可以采用状态监测技术捕捉潜在故障点等等,从而决定对该设备所采取的维护方式:对故障与时间无关且故障后果不严重可以在线维修的设备取消预防性维修而采取纠正性维修方式,对于故障后果严重的设备如果能够采用状态监测技术捕捉到设备潜在故障点,先采取延长维修周期的方式,到检修周期末期,根据状态监测判断设备的性能指标是否下降,如果性能指标下降可提前检修,如果性能指标未下降可继续延长检修周期。下面以汽轮机润滑油顶轴盘车系统(GGR)、凝结水抽取系统(CEX)的部分分析结果为例,阐述在降低系统和设备的运行及检修成本方面带来的变化:
1、在汽轮机润滑油顶轴盘车系统中,交流辅助润滑油泵在系统中起着重要作用,但它不是一个连续运行的设备,运行时间较短,采取的其它维修策略可以保证它的功能不被丧失,并可发现它的潜在故障点。因此在决断中取消交流辅助润滑油泵电机3年一次的定期检修。
2、在汽轮机润滑油顶轴盘车系统中,直流应急油泵,在系统中起着非常重要的保护作用,但它仅是一个应急备用的设备,采取的其它维修策略可以在应急状态下保证它的可用。因此在决断中将直流应急油泵的泵体的解体检修周期从6年延长至9年,同时取消直流应急润滑油泵电机每运行3000小时的解体检修。
3、由于有两台冷油器互为备用,并可在线隔离维修。因此在决断中取消冷油器每5年全面检查和冷油器季度检查。
4、在凝结水抽取系统(CEX)中,电动机和泵的定期解体检修均已取消,同时加强了对电动机和泵的状态监测。一旦电动机和泵真有问题了,基于状态监测的结果进行的维修将更具针对性。到目前为止,我们已对6台CEX电动机中的5台进行了解体大修。据检修人员介绍,尚未发现已解体电动机有任何缺陷,即便因轴承漏油换下来进行解体大修的2CEX001MO也没有发现换下来的轴承的缺陷所在(轴承漏油的根本原因到底是什么呢?---需作根本原因分析),倒是205大修对其进行品质再鉴定时一启动就出现异常噪音而被迫停运、换下再次解体大修。这说明一个问题:不恰当的维修会降低设备的可靠性,同时维修成本成倍的增加。
5、取消CEX系统中电动机10年解体解体检修项目后系统和设备的可靠性没有降低,维修费用却得到了很大的节省:
修1台CEX电动机人工费:5*10*600=30000元
更换电动机轴承:2*920*8.3=15272元
初步估计解体1台电动机就算其它部件没有问题,最少也得花费4.5--5万元。6台电动机花费27--30万元。
这仅仅从一个系统的一个设备来考虑,如果从整个系统乃至整个电站来考虑,这笔费用的节省将是十分可观的,并随着RCM分析工作的不断深入而产生越来越可观的效益。
4. 状态监测在大亚湾核电站RCM中的作用
RCM是工作重点是确定生产设备中哪些设备应该采用预测维修,哪些采用预防维修,哪些可用故障维修。这样就能保障设备在合理有效管理机制上发挥更大的作用。而了解设备运行状态第一手资料的途径就是用状态监测手段对设备进行全面普查,为RCM系统决策提供科学的依据。借助RCM来合理确定状态监测范围和采集数据周期,使恩泰克状态监测技术在大亚湾核电站发挥积极能动的作用。前者侧重战略上,后者着重在战术上。
实现了状态监测技术与RCM的无缝结合,恩泰克状态监测系统不仅为状态监测者提供分析数据,而且为RCM及MAXIMO系统提供了链接通道。通过向MAXIMO提供设备状态评定报告,根据这些信息决定生产系统是否可继续健康运行;它也可直接向维修部门提供信息,使该部门专注于设备中有问题的部件,而非简单地按计划表运作,从而优化其维修资源。
大亚湾核电站恩泰克状态监测系统是由多用户Enshare恩泰克资产管理及故障监测及诊断软件和7台DataPAC1500数据采集器组成。以满足对RCM确定的关键和重点设备进行定期监测分析和诊断工作。
大亚湾核电站目前振动监测主要有汽轮发电机,柴油发电机 各类水泵,各类风机,空气压缩机和一些静止机械共计400余台,通过对每个系统进行RCM分析,确定各类旋转机械的监测周期,振动测量人员利用DataPAC1500数据采集器将振动信息采集并上传至专用服务器,故障诊断人员利用其Enshare软件强大的分析诊断功能,对测量的振动信息做进一步评价和分析处理,对于设备的初期故障,采用的处理方式:缩短测量周期加强监测,并通过邮件的方式告知相关部门(包括运行和维修)共同关注设备的异常变化;对于故障信号比较明显,振动噪音都发生突变的设备,会立即通知运行人员停运该设备,并通过comis系统发出一个工作申请(comis系统是大亚湾核电站根据MAXIMO软件改编的一套工作过程管理系统),由维修人员根据工作申请的处理意见对设备进行定点维修,振动诊断人员跟踪维修人员的处理过程,并在故障处理完成后做再鉴定试验,以确定故障是否已经排除,设备是否可用。
当发现设备异常趋势时,及时分析和诊断。并将分析结果通报给comis系统。该系统的基本功能是从业务方面使得维修系统和组件处于良好的有序状态,它不仅能控制维修业务的进程,而且能为有效的管理工作提供技术信息。计算机维修管理系统为维修工作提供了有力的工具,它可用来对诸多维修管理因素,如系统组成、人力资源、工作流程、备件清单、储备过程和向现场发货等进行计划和日程安排,并且可对维修结果进行文档记录。一个有效的维修管理系统的实施可通过制定合理的人员、工具和材料库存等措施使企业处于良好的运营状态。
5.利用ENTEK系统准确诊断设备故障
大亚湾核电站从调试到正式运行,在振动方面已经掌握了多种设备故障诊断手段,可以进行振动幅值,频谱,相位,噪音等多种分析。随着电站预测性维修活动的开展,对设备监测水平提出了更高的要求。在这种情况下,我公司于98年引进了美国ENTEK IRD公司先进的设备预测性维修软、硬件系统,通过定期采集、输入各种数据形成一套相对完整的设备健康档案。同时利用该系统先进的特征频率法及独有的滚动轴承尖峰能量法对滚动轴承,齿轮箱等进行专门的监测,利用这一手段,我们先后诊断出SRI(常规岛冷却水系统)水泵和GST(发电机定子冷却水系统)电机等36台旋转设备滚动轴承故障,故障诊断准确率超过90%,。下面以2号机GST101PO为例,较详细地描述了电机轴承故障的诊断和处理过程。
GST系统的主要作用是排出发电机定子绕组和端子运行时产生的热量,每台机组包括两台水泵,正常运行时一台工作,一台备用。任一台损坏将导致系统可靠性降低,直接影响汽轮发电机组的安全运行,关系重大。
99年5月份,2GST101PO运行时电机驱动端发出异常噪音,现场测量时通频振动值并不大(2.8mm/s RMS以下),频谱内也无异常分量,与4月份该电机维修更换后所测值相差不大。但噪音从何而来呢?通过滚珠轴承尖峰能量和特征频率分析,判断电机驱动端轴承异常。
附图三:2GST101PO故障轴承尖峰能量频谱图 附图四:2GST101PO故障轴承6KHz速度频谱图
首先该点尖峰能量值从一个月前的1左右增大到9,变化大,其它正常运行的同类电机同测点处值仅为1左右;另外,从该点的尖峰能量谱上应用特征频率分析可见较明显的外环故障频率(BPOR)及其倍频(附图三),表明轴承外环存在故障可能。如果轴承存在故障将产生冲击,会激起轴承的固有频率,在速度频谱上应该可以看到高频分量,所以采用6KHz频率范围再次测量该点的速度谱,果然在1370Hz左右有一峰值(1.68mm/s RMS,附图四)。因为尖峰能量分析无固定标准可循,判断主要以同类轴承相比较为依据,而我们对此类轴承尚无经验,且速度谱中高频分量不算太大,所以决定密切监测,观察其发展趋势。
半个月后再次测量,尖峰能量方面变化不大,但速度谱中1370Hz高频分量已增大至7.5mm/s RMS,已不可接受。立即停机检查,发现该轴承外环损伤严重,其圆周1/3段存在较深划痕。
更换新轴承后,振动状态良好,由其尖峰能量频谱图可见,外环故障频率分量已消失(附图五)。其振动频率图上的1370Hz分量已大大减小(附图六)。
此例充分说明了运用新技术能及时发现设备故障,同时相对完善的设备历史数据库在进行诊断时,通过同类设备的横向、纵向比较,将更有效地发挥作用。
6、结束语
RCM方法在大亚湾核电站应用五年来,已完成RRI、CEX、CFI、GGR等15个系统的RCM分析,在保持系统设备安全、可靠、经济运行方面取得了显著的效果。RCM较好地解决了“为什么修、何时修、修什么”的问题。目前,以可靠性为中心的维修在大亚湾核电站的推广和应用已正式列入公司的五年发展计划。到2004年底,我们计划将完成19个核岛系统、30个常规岛系统、30个电气系统的RCM分析,基本上覆盖了电站的重大设备及相关系统。在实际运用过程中,新的设备故障模式还会不断出现,我们应以动态的眼光来看待RCM的分析成果。及时反馈、不断更新,使RCM分析成果——《维修导则》以及派生出来的《维修大纲》成为真正意义上的“LIVING PROGRAM”,使更好地起到指导运行、维修的目的。确保核电站安全、可靠、高效运行。
参考文献:
[1] Reliability-centered Maintenance(RCM ),John Moubray,Second edition 1997,Reprinted 1997,1998
[2] 以可靠性为中心的维修,(英)J·莫著,石磊、谷宁昌译,机械工业出版社,1995
[3] 工业企业设备管理,张翠凤,华南理工大学出版社,1997.5
[4] 以可靠性为中心的维修及其实施意义,李晓明、刘敏、景建国,大亚湾核电,2001.1
作者简介:
陈志林,男,1971年出生,工程师,毕业于东北电力学院自动控制专业,现在大亚湾核电站从事故障诊断工作