电建论坛

 找回密码
 注册
查看: 75|回复: 3

DCS系统故障发生部位和产生原因分析

[复制链接]
发表于 2021-9-27 16:26:22 | 显示全部楼层 |阅读模式
DCS系统在工业生产过程中的广泛应用,使可靠性、稳定性问题更加突出,也使人们对整个系统要求越来越高,人们希望DCS系统尽量少出故障,又希望DCS系统一量出现故障,能尽快诊断出故障部位,并尽快修复处理,使系统重新工作。为了便于分析、诊断DCS系统故障发生部位和产生原因,现把故障分为以下几类来进行论述。
1.现场仪表设备故障:
    现场仪表设备包括与生产过程直接联系的各种变送器、各种开关、执行机构、负载及各种温度的一此元件等。现场仪表若发生故障,直接影响DCS系统的控制功能及操作人员对工艺参数的监视,从而给工艺操作带来一定困难。在目前的DCS控制系统设计中,这类故障占绝大部份,这类故障一般是由于仪表设备本身的质量和寿命所致。对这类故障比较直观,在判断和处理上也相对容易,在处理按常规仪表的处理方法一般不会有什么问题。对这类故障的处理要求维护人员对常规仪表的故障处理比较熟练,以保证故障处理的及时性及准确性。由于这类故障属于单点故障,对工艺影响不大,维护人员对DCS系统知识的要求不高,只须按常规仪表处理即可。
2.系统故障:
    这是影响系统运行的全局性故障,系统故障可分为固定性故障和偶然性故障。如果系统发生故障后可重新启动使系统恢复正常则可认为是偶然性故障。相反若重新启动后不能恢复正常而需要更换硬件或软件系统才能恢复则认为是固定性故障。这种故障一般是由于系统设计不当或系统运行年限较长所致。
3.硬件故障:
    这类故障主要指DCS系统中(I/O模块)损坏造成的故障。这类故障一般比较明显且影响也是局部的,它们主是由于使用不当或使用时间较长,模块内元件老化所致。
4.软件故障:
    这类故障是软件本身所包含的错误所引起的。软件故障又分为系统软件故障和应用软件故障。系统软件是DCS系统所带来的,若设计考虑不周,在执行中一但条件满足就会引发故障,造成停机或死机等现象。此类故障并不常见,应用软件是用户自己编定的,在实际工程应用中,由于应用软件工作复杂,工作量大,因此应用软件错误几乎难以避免,这就要求在DCS系统调试及试运行中十分认真、仔细,及时发现并解决。
5.操作使用不当造成故障:
    在实际运行操作中,有时会出现DCS系统某功能不能使用或某控制部份不能正常工作,但实际上DCS系统并没有故障,而是操作人员操作不熟练或操作错误所引起的。这对于初次使用DCS系统的操作工较为常见。
DCS系统一旦出现故障,正确分析和诊断故障发生的部位和原因是当务这急,故障的诊断是根据经验、根据发生故障的环境和现象来确定故障的部份和原因。根据平时在工作中对系统故障处理的经验和方法,对DCS系统故障诊断可按下述步骤来进行:
(1) 是否为使用不当引起的故障。这类故障常见的有供电电源故障、端子接线故障、模块安装错误、现场操作错误等。
(2) 是否为DCS系统操作错误引起的故障。这类故障常见的有某整定参数整定错误、某设定状态错误造成的。
(3) 确认是现场仪表设备故障还是DCS系统故障。若是现场一次仪表故障,修复相应现场仪表或更换一次仪表。
(4) 若是系统故障,应确认是硬件故障还是软件故障。
(5) 若是硬件故障,则找出相应硬件部位,修复或更换硬件模块。 (6) 若是软件故障,还应确定是系统软件故障还是应用软件故障。
(7) 若是系统软件有故障,可重启动看是否能恢复正常或重新装载系统软件,重新启动后若不能恢复则与系统管理人员或系统厂家联系解决。
(8) 若应用软件故障,可检查用户编写的程序和组态的所有数据,找出故障原因。
(9) 利用DCS系统的自诊断测试功能。DCS系统的各部份的设计有相应的自诊断功能,在系统发生故障时,一定要充分利用这一功能来分析和判断故障的部位和原因。
    在实际应用中,对DCS系统故障要根据实际情况去分析和判断。在实际使用过程中,现场常见的系统硬件故障一般包括如下几方面:
(1) 系统模块和元件故障,可能产生的原因是元器件质量不良、使用条件不当、调整不当、错误的接线引入不正常电压而形成的短路等。有时由于现场环境的因素,如温度、湿度、灰尘、振动、冲击、鼠害等原因也会造成系统硬件故障。
(2) 线路故障:可能产生的原因是,电缆导线端子、插头损坏或松动造成接触不良,或因接线错误、调试中临时接线、折线或跨接线不当,或因外界腐蚀损坏等。
(3) 电源故障:可以产生的原因是供电线路事故,线路负载不匹配可引起系统或局部的电源消失,或电压波动幅度超限,或某元件损坏,或误操作等产生电源故障。
软件故障包括:
(1)程序错误,设计、编程和操作都可能出现程序错误,特别是联锁、顺控软件,不少问题是由于工艺过程对控制的要求未被满足而引起的。
(2)组态错误:设计和输入组态数据时发生错误,这可以调出组态数据显示进行检查和修改。
    由于DCS系统的都带有自诊断程序,系统能及时对挂在总线上或网络上的各回路及功能模块进行周期诊断。通过诊断,如发现异常现象,其内容就被编成代码或相应的故障提示,经由总线的操作站传递信息,从而在CRT上显示和报告故障发生的位置。通过CRT了解故障情况后,应进一步通过机柜里插卡或者模块上的一系列发光二极管的显示状态,查询不正常状态的故障内容。插卡或模块外部的故障则要逐步检查分析。
常用的故障判断方法有:
(1) 直接判断法:根据故障现象,范围、特点以及故障发生的记录直接分析判断产生的原因和故障部位,查出故障。
(2) 外部检查法:对一些明显的有外部特征的故障,通过外部检查,判断故障部位,如插头松动、断线、碰线、短路、元件发热烧坏、虚焊、脱焊等。有的故障,特别是暂时性故障,可以通过人为摇动,敲击来发现故障。
(3) 替换对比法:对有怀疑的故障部件,用备件或同样的插卡或模块进行替换,或相互比较,但要注意,替换前,要先分析排除一些危害性故障,如电源异常、负载短路等引起元件损坏的故障,若不先排除,则替换上的插件或模块会继续损坏。
(4) 分段查找法:当故障范围及原因不明时,可对故障相关的部件、线路进行分段,逐段分析检查、测试和替换。
(5) 隔离法:可以分段查找法相配合,将某些部位或线路暂时断开,观察故障现象变化情况,逐步缩小怀疑对象,最终查出故障部位,进行处理或更换。 对于组态错误,只要确认认为存在组态错误,只要核对组态表格及组态数据,对相应的组态数据进行修改即可,一般不存在困难。另外,充分利用系统厂家提供的故障检查流程图和故障诊断表也是快速诊断和判断处理故障的方法。 通常在实际工作中,经常遇到的DCS系统故障,还有死机、黑屏及通信故障,这些故障通常导致工艺参数不能显示,严重时导致工艺系统停车,如死机故障产生的原因是多方面的,有的是因为操作不当所致,更多的原因是由于模块或插件故障所引起的,如显示器故障。主机故障,通信故障产生的原因多由通信线路、网卡及网络接线器故障所引起。
    上述是针对DCS系统采用的故障判断和处理的一些方法,但是,现场故障是千变万化的,在实际处理过程中,要结合实际情况加以分析和处理,同时借助专家故障诊断系统及DCS供应商的技术支持,利用现代网络技术进行远程诊断和处理,已是一种快捷有效的故障判断和处理方法。虽然专家诊断系统还不完善,还在不断的发展中,但对我们进行DCS系统的故障判断和处理是有帮助的。在日常工作中,除了掌握相应的故障判断和处理方法外,更应该加强系统的日常维护,防范系统故障的发生,同时采取相应的管理措施来保证系统的安全可靠,如:加强DCS系统的环境和操作管理,加强防静电措施和良好的屏蔽,控制室要加强防雷措施并应该有安全可靠的接地系统等。


一、通信网络故障
通信网络类故障一般易发生在接点总线、就地总线处或因地址标识错误所造成。
节点总线故障
节点总线的传送介质一般为同轴电缆,有的采用令牌信号传送方式,有的采用带冲突检测的确良多路送取争用总线信号传送方式。不论采用哪种方式,当总线的干线任一处中断时,都会导致该总线上所有站及其子设备通讯故障。
目前,一般防止此类故障的方法是采用双路冗余配置的方式,避免因一路总线发生故障而影响全局,但这并不能从根本上避免故障的发生,并且一旦一根总线发生故障,处理时极易造成另一个总线故障,其后果是非常严重的。有效的方法应是从防止总线接触不良或开路入手。
比较成功的是系统的节点总线布置方式。其同轴电缆的连接不是在通信模件的前面,而是在模件的后面,这样当系统运行中处理通信模件故障时,可避免误碰同轴电缆,造成网线断路。同时,其同轴电缆除专门进行检查,任何时候都不会去触动,可防止因多次插拔同轴电缆的插头造成松动,增加其故障的可能。另外,应制定同轴电缆检查与更换管理制度,在其接触电阻增大至影响通信之前,进行更换或处理。
就地总线故障
就地总线或现场总线-般由双绞线组成的数据通信网络,由于其连接的设备是与生产过程直接发生联系的一次元件或控制设备,所以工作环境恶劣,故障率高,容易受到检修人员的误动而影响生产过程。另外,总线本身也会因种种原因造成通信故障。
防止此类故障的有效措施是:首先要将就地总线与就地设备的联接点进行妥善处理。拆装设备时,不得影响总线的正常运行,总线分支应安装在不易碰触的地方,同时,就在总线最好是采用双路冗余酝置,以提高通信的可靠性。
地址标志的错误
不论是就地组件还是总线接口,一旦其地址标识错误,必然造成通信网络紊乱,所以,要防止各组件的地址标识错误,防止人为的误动、误改。系统扩展时,一般应在系统停止运行时进行。尤其是采用令牌式通信方式的系统,任何增加或减少组建的工作都必须在系统停运时,将组态情况向网络发布,以避免引起不可预料的后果。


二、硬件故障
DCS系统根据各硬件的功能不同,其故障可分为人机接口故障和过程通道故障,人机接口主要指用于实现人机联系功能的工程师站、操作员站、打印机、键盘、鼠标等;过程通道主要指就地总线、通道、过程处理机、一次元件或控制设备等。人机接口由多个功能相同的工作站组成,当其中一台发生故障时,只要处理及时,一般不会影响系统的监控操作。过程通道故障发生再就地总线或一次设备时,会直接影响控制或检测功能,因而后果比较严重。
人机接口故障
人机接口故障常见的有鼠标操作失效、控制操作失效、操作员站死机、薄膜键盘功能不正常、打印机不工作等。鼠标操作不正常一般是由于内部机械装置长期工作老化或污染,使触点不能可靠通断,或因电缆插接不牢固造成与主机不通信,这时只需将其更换检查即可。
控制操作失效是由于鼠标的操作信号不能改变过程通道的状态,一方面可能是过程通道硬件本身故障,另一方面可能是操作员站本身软件缺陷,在设备负荷过重或打开的过程窗口过多时,导致不响应。在检查过程通道功能正常后,应对操作员站进行检查,必要时进行重启,初始化操作员站。
操作员站死机原因比较多,可能由于硬盘或卡件故障、软件本身有缺陷。
冷却风扇故障导致主机过热,或负荷过重造成。可首先检查主机本身的温升情况,其次用替代法检查硬盘、主机卡件等,以确定故障部分。
薄膜键盘在大多数操作员站上得到应用。其主要功能是快速调取过程图形,便于操作员迅速监控过程参数。当因薄膜键盘组态错误、键盘接触不良、信号电缆松动或主机启动时误动键盘造成启动不完整,均可导致其功能不正常,应针对不同的情况进行处理。
打印机不工作一般是由于配置的原因,同时,以打印机进行屏蔽后,也会使打印功能不能进行。另外,打印机本身的硬件故障会造成其部分功能或全部功能不正常,应重新检查打印机的设置及硬件是否正常并进行处理。
过程通道故障
过程通道出现最多是卡件故障或就地总线故障。一种原因是卡件本身厂时间工作,元器件老化或损坏;另外,因外部信号接地或强点信号串入卡件也会导致通道故障。现在一般卡件本身都采取了良好的隔离措施,一般情况下不会导致故障的扩大,但此类故障一旦出现,则直接造成过程控制或监控功能的不正常。所以要及时查明故障原因,及时进行更换卡件。
一次原件或控制设备出现故障有时不能直接被操作员发现,只有当参数异常或报警时,方引起注意。控制处理机(过程处理机)故障一般会立即产生报警,引起操作员注意。现在控制处理机基本上全是采用1:1冗余配置,其中一台发生故障不会引起严重后果,但应立即处理故障的机器。在处理过程中,绝对不可误动正常的处理机,否则会发生严重的后果。


三、人为故障
对系统进行维护或故障处理,有时会发生认为误操作现象,这对于经常进行系统维护或新参加系统检修维护的人员来说都是会发生的。一般在修改控制逻辑、下装软件、重启设备或强制设备,保护信号是最易发生误操作事件。轻则导致部分测点、设备异常,重则造成机组或主要辅机设备停运,后果是非常严重的。在使用的化工厂,人为误操作发生的故障在不安全事件中占有很大比例。


四、电源故障
电源方面的问题也较多,如备用电源不能自投,保险配置不合理及电源内部故障等造成电源中断,温压电源波动引起保护误动及接插头接触不良导致温压电源无输出;有的系统整个机柜通过一路保险供所有输入信号或一路电源外接负载很大,还的控制电源既未接又未有冗余备用。


五、SOE工作不正常
SOE记录即事件顺序记录,当电力设备发生遥信变位如开关变位时,电力保护设备或智能电力仪表会自动记录下变位时间、变位原因、开关跳闸时相应的遥测量值(如相应的三相电流、有功功率等),形成SOE记录,以便于事后分析。许多继电保护设备以及智能电力仪表,如GE电力、施奈德电气、ABB、西门子等厂家的电力保护仪表、专用电力RTU设备等等均有SOE记录功能。
SOE的结论对事故的分析判断起了很重要的作用,但在现实中,许多电厂发生保护动作等情况时SOE未记录下拉或记录时间与实际情况不符。如电厂#1机组出现过SOE事件顺序追忆时间与实际跳闸时间不相对应,SOE时间打印浏览后不能返回,首次跳闸原因在时间顺序未能第一个反应,SOE时间顺序数据不能设置等问题。而有的电厂在几次事故分析时发现SOE结论中的时序与历史曲线中的时序有偏差,有时甚至时序颠倒,具体表现于同一个点在历史曲线和SOE中民生时间不一致,且有时偏差很大,这会延误事故分析的进程,有时甚至误导事故分析方向。SOE问题既与系统设计不合理,SOE点没完全集中在一个上有关,也与系统硬件及软件考虑不周有关。


六、干扰造成的故障
干扰造成的故障的实例也不少。系统的干扰信号可能来自于系统本身,也可能来自于外部环境。由于不同的系统对接地都有严格要求的规定,一旦接地电阻或接地方式达不到要求,就会使网路通信的效率降低或增加误码的可能,轻则造成部分功能不正常,重则导致网络瘫痪。
电源质量同样影响系统的稳定运行。用于系统的电源既要保证电压的稳定,也要保证在一路电源故障时,无扰切换至另一路电源,否则会对系统工作产生干扰。过程控制处理机主/备处理机之间的切换有时也会导致干扰。另外,大功率的无线电通信设备如手机、对讲机等在工作时,极易造成干扰,危及系统运行。

声明

文章来源于网络仅供参考,本平台对转载、分享、陈述、观点保持中立,目的仅在于传递更多信息,并不代表本平台赞同其观点和对其真实性负责。如发现政治性、事实性、技术性差错及版权问题等错误信息及涉及作品版权问题请及时联系我们删除,感谢支持!



发表于 2021-9-29 10:53:45 | 显示全部楼层
感谢楼主的分享!
 楼主| 发表于 2021-9-29 11:23:40 | 显示全部楼层
每日学一遍
发表于 2021-9-29 17:01:54 | 显示全部楼层

感谢楼主的分享!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|电力建设网站 ( 苏ICP备16030970号-1 )|网站地图

GMT+8, 2021-10-16 04:22 , Processed in 0.196217 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表