今天看了一个公司的事故通报,在暴露问题一栏里说了这么一段话,该集团在过去一年因热工、电气原因导致的机组非停较多,但热工人员未引起足够的重视,未排查出逻辑上的隐患。
在我们的日常工作中,往往是唯结果论的,出了问题,往往就是先一棍子打死,不管你之前的付出有多努力,过程有多精彩。但有时候,往往又不是唯结果论,往往在事故处理过程中满头大汗的被一阵表扬,而在后台精确制导的被忽略。
所以,电厂中被提拔起来的往往是机务专业,电热专业能到总助级别的都很少。
笔者是热控专业出身,无论是以前干项目,还是现在做生产运行方面的工作,基本都跳出了专业本身,因此笔者是有资格说这就话的。
笔者还说过一句话,如果一个专业总是出问题,这个专业的人总是存在感很强,那么这个专业的人应该换换了。而那些不起眼的专业,不起眼的人,却一直未发生大的问题,那么这个专业的人应该引起足够的重视。
笔者工作的第一年是做汽机运行,小机组机炉电三个运行专业,电气最闲,汽机其次,最忙的是锅炉。锅炉事故也多,而每次开会,领导都会对锅炉专业的某某夸奖一番。我记得当时的班长说,我们得找找存在感。
也有人说,有些专业不就应该不出问题吗?笔者觉得,所有的专业都不应该出问题,还是那句话,如果这个专业总出问题,而且没有好转的迹象,这个专业的人应该换换了。
在过去两年的工作过程中,笔者更加坚定这一点。只是很多人未参与其中,站在云端评头论足,评价往往是不客观的。就像开头说的案例,有了问题,没有人会分析当初热控这个工作为何没做到位,只是在批评热控专业没做到位。
既然说到了热控专业的问题,不妨跟大家分析一下,热工保护联锁逻辑中应该避免的那些问题吧!在分析过程中,我们由点到面,从最基本的点开始,逐步展开。这里需要提前声明一下,笔者所说的热工保护联锁逻辑,不仅仅指的设备的一些保护或者联锁,涵盖所有的DCS系统逻辑。
问题一:点的基本信息设置错误
我们增加一个物理点,首先要设置清楚点的基本信息,这里除了点的地址选择正确以外,基本信息还包括单位、量程、报警值等。尤其是量程,在单点造成的热工故障中,量程设置错误是造成故障最多的。
举个例子:2019年5月6日,某电厂600MW机组负荷由100MW加至130MW过程中,6A汽泵跳闸,首出为“A给水泵汽轮机全部转速故障”。经过热工人员检查发现,6A给水泵汽轮机转速量程上限设置为3600rpm,实际上限应为6500rpm,当转速升至3600rpm时,DCS系统判断为转速超量程故障,发出汽泵跳闸信号。
在重要的保护联锁中,模拟量信号故障也经常被引入作为设备跳闸的触发信号,尤其是对于一些单点参与保护的设备,往往更重视这一点。毕竟,在关键时刻,为了避免设备出现无监控状态下的盲运,造成更大风险,模拟量故障信号参与保护还是很有必要的。
但是,对于一台大型机组来说,模拟量信号多达几千甚至上万,虽然不是每个信号都参与保护联锁,可毕竟数量庞大,怎么避免量程上的设置错误,这是需要认真考虑的。哪怕千分之一的设置错误,可能都是大的隐患。
以此可以类推点的其它信息错误,比如报警值、死区等。
问题二:点的品质判断信息设置错误
目前主流的DCS系统中,模拟量的信号都引入了品质判断的概念,有一些系统开关量的信号也有这个概念,我们还是拿模拟量信号来说。所谓品质判断,就是判断这个点的状态是否正常。其中的品质包括是否超量程、是否超死区、变化速率是否过快等。笔者还见过有一些设置,在该测点长时间无变化的情况下,也会发出品质判断坏的信号。
其实关于品质判断,主要有两个,一是量程,其次是变化速率。量程前面说了,变化速率主要指的是模拟量信号在单位时间内变化的幅度,如果超过这个幅度,就发出品质判断坏的信号。这里的单位时间一般是每个周期或者每秒,关于这个概念可以参考文章《如何设置火电厂DEH和DCS系统系统的扫描周期》。
品质判断的意义何在?笔者在学习DCS系统之初,一直对这个概念讳莫如深,说白了就是不理解。后来在实践过程中,笔者才逐步明白,这其实就是系统审判、纠错和排他的一种方式。
《三体》中有一个情节,云天明和程心在拉格朗日点那次视频会面,会面结束后,三体人对两个人会面的内容进行再次复盘,在确定没有涉密内容后,才亮起了绿灯。笔者理解的是,复盘的过程就是对内容一次审判,审判通过表示品质判断正常。这个例子有点牵强,也可以这么理解,在数学中,我们把是用1表示,把否用0表示,英语中是true和false。但是,这只是纯粹数学的表示,在复杂逻辑中,尤其是现实中,不完全是1和0,还有介于两者之间的存在。品质判断的过程,就是将这种存在进行判定,超过一定范围就是1或者0。
回到话题本身,变化速率其实就是判断的一个维度。比如某个模拟量测点在断线的情况下,或者在受到某种干扰的情况下,数值可能会发生突变,而对于测点所在设备本身,理论上不会出现这种问题。因此,我们就需要对这种异常进行判定和排他,不能因为异常造成设备的误动。
问题三:延时时间、脉冲时间、上升沿、下降沿等设置错误
这个错误在日常组态过程中是出现最多的,包括两种错误类型。一种是延时和脉冲弄错,上升沿和下降沿弄错,另一种是延时时间和脉冲时间设置有问题。第一种错误是纯粹的错误,第二种严格意义上不能判定为错误。
关于第一种错误,不同的DCS系统组态方式不一致,错误的方式也不一定。比如和利时的延时和脉冲是两个模块,而上海新华的是在时间功能块中进行设置。所以,这样的错误,前期组态靠细心,后期靠试验来验证。上升沿和下降沿也是一样,需要我们对逻辑的意义理解清楚,到底是用上升沿触发还是下降沿触发。
而关于第二种错误,需要我们在日常工作中不断进行优化,不管是脉冲时间还是延时时间,是需要结合具体的工艺和工况进行判定的。可以大体归为几个分类,一般情况下,对于一些温度测点信号超温后的延时,笔者建议设置在2s就足够了,尤其是大型转动机械的,比如汽轮机、发电机,超温不要超过2S,否则可能会造成致命的伤害。还有一个重要的原因是,温度测点如果超温,且在变化速率范围内,那大概率就是超温了,如果不在变化率范围内,那品质判断肯定不会满足,也就不用纠结时间问题。
对于汽轮机的振动、轴向位移、胀差测点,笔者到目前仍坚持自己的观点,就是不加延时时间,即便加也不能超过2s。这一点反对的声音很大,认为需要延时,避免误动。这三种测点突变的可能性极大,甚至在运行过程中,一旦出现问题,对设备本身的伤害是瞬间就可完成的。温度测点还会有一个过程,这几个测点不会。
作者:猫 不捉老鼠
相关阅读
火电厂热工控制系统相关问题的分析