想做热工工业自动化仪表专业方面创业,有人能指导帮助我吗

自动化仪表论文
,内容来自筑龙网相关的培训课程、论坛帖子、行业资讯等。筑龙网为国内最权威最专业的建筑工程学习。交流平台,超过1000万设计师、工程师和造价师在筑龙网交流、学习更多相关资料请访问日更新500篇的!(发布于:日)
此时有人在和您一起浏览筑龙优搜库
大家都在学
论坛热贴排行
课时数:1189
课程时长:21
课程时长:15
课程时长:23
筑龙网以“成就有梦想的建筑人”为企业使命,为建筑行业从业者提供基于、直播课程、专家答疑、论坛交流的专业学习服务;同时搭建基于建筑+互联网的创业项目孵化平台,为推动行业创新发展贡献力量。 >
自动化仪表论文相关专题推荐赞助商链接
当前位置: >>
热工自动化、仪表故障汇编
热工仪表常见故障 汇编阳城电厂热工专业组 2009 年 2 月 22 日 目案例一录第一章 DCS 故障概述............................................................................................................... 4 第二章 热工自动化事故案例 ............................................................................................... 8 控制器重启引发机组跳闸 .................................................................................. 8案例二 在线传代码致使机组解列 ................................................................................... 9 案例三 案例四 案例五 DCS 工作站时钟混乱引发 DCS 失灵 .................................................................. 9 CABLETRON 集线器总通讯板故障导致 MFT 误动........................................... 11 冗余控制器失灵造成机组跳闸 ........................................................................ 11案例六 DCS 公用系统故障导致两台机组同时停运事故分析 ...................................... 13 案例七 漳泽电力股份漳泽发电厂 DCS 系统#20DPU 柜 AI 卡件故障,#4 机(210MW) 停机 ..................................................................................................................... 16 案例八 沁北#1 炉 MFT 事故报告 ................................................................................... 18 案例九 浙江省电厂分散控制系统故障分析 ................................................................. 20 案例十 聊城热电有限公司#4 机组 DCS 系统复位导致停机 ........................................ 36 案例十一 某厂#3 机 ETS 电缆故障引起机组跳闸停机事故 ........................................ 37 案例十二 某电厂 12 月 6 日#2 机水位保护拒动事件 .................................................. 39 案例十三 某电厂一期集控 OS 故障分析 ....................................................................... 41 案例十四 某电厂 ETS 动作跳机事故 ............................................................................. 43 案例十五 DPU 异常事件分析及处理 ............................................................................. 44 案例十六 某厂 UPS 电源故障造成 DCS 失电的分析 .................................................... 46 案例十七 安徽某厂#1 炉一次风失去 MFT .................................................................... 47 案例十八 安徽某厂#2 炉虚假风量低跳炉 .................................................................... 48 案例十九 某厂隔离器电源接线松动引起执行机构误关,导致锅炉 MFT 动作 ........ 49 案例二十 某电厂#3 机组给煤机就地柜电源异常跳机事件 ...................................... 50 案例二十一 案例二十二 案例二十三 某电厂机组受系统冲击引起跳闸事件 ..................................................... 51 某厂电源故障谈 DCS 电源可靠性 ............................................................. 53 某厂机组“风量&25%”导致 MFT 事故 ........................................................ 56 案例二十四 案例二十五 案例二十六 案例二十七 案例二十八 案例二十九某厂机组给水控制柜电源故障导致 MFT ................................................. 59 安徽某厂 DCS 通讯中断故障 ..................................................................... 60 某厂强行解除保护造成炉膛爆炸 ............................................................. 61 某机组“DEH 跳闸电源故障”案例 ......................................................... 65 安徽某电厂虚假风量低导致机组跳闸 ..................................................... 66 某电厂 2 号机组 DCS 系统网络交换机失电导致机组 MFT 故障 ............ 67案例三十 安徽某电厂 4 机组 DCS 系统 DPU 与 I/O 卡件通讯故障导致机组跳闸 ..... 69 案例三十一 某电厂 5 机组 DCS 逻辑组态不当引起锅炉 MFT..................................... 70案例三十二 DCS 网络设备异常造成的停机事故 .......................................................... 71 案例三十三 案例三十四 案例三十五 案例三十六 案例三十七 网络柜内电源切换装置 APC 故障,导致机组跳闸 ................................. 72 ETS 继电器动作跳机事件 .......................................................................... 72 某热电厂一起 TSI 组态不当引发跳机事件 .............................................. 74 嘉兴发电有限责任公司#3 炉锅炉总风量突变的原因分析及防范措施 76 热工保护拒动的分析 ................................................................................. 77 第一章 DCS 故障概述DCS 系统在工业生产过程中的广泛应用,使可靠性、稳定性问题更加突出, 也使人们对整个系统要求越来越高,人们希望 DCS 系统尽量少出故障,又希望 DCS 系统一量出现故障,能尽快诊断出故障部位,并尽快修复处理,使系统重新 工作。为了便于分析、诊断 DCS 系统故障发生部位和产生原因,现把故障分为以 下几类来进行论述。 1.现场仪表设备故障: 现场仪表设备包括与生产过程直接联系的各种变送器、 各种开关、 执行机构、 负载及各种温度的一此元件等。现场仪表若发生故障,直接影响 DCS 系统的控制 功能及操作人员对工艺参数的监视,从而给工艺操作带来一定困难。在目前的 DCS 控制系统设计中,这类故障占绝大部份,这类故障一般是由于仪表设备本身 的质量和寿命所致。对这类故障比较直观,在判断和处理上也相对容易,在处理 按常规仪表的处理方法一般不会有什么问题。 对这类故障的处理要求维护人员对 常规仪表的故障处理比较熟练,以保证故障处理的及时性及准确性。由于这类故 障属于单点故障,对工艺影响不大,维护人员对 DCS 系统知识的要求不高,只须 按常规仪表处理即可。 2.系统故障: 这是影响系统运行的全局性故障,系统故障可分为固定性故障和偶然性故 障。如果系统发生故障后可重新启动使系统恢复正常则可认为是偶然性故障。相 反若重新启动后不能恢复正常而需要更换硬件或软件系统才能恢复则认为是固 定性故障。这种故障一般是由于系统设计不当或系统运行年限较长所致。 3.硬件故障: 这类故障主要指 DCS 系统中(I/O 模块)损坏造成的故障。这类故障一般比 较明显且影响也是局部的,它们主是由于使用不当或使用时间较长,模块内元件 老化所致。 4.软件故障: 这类故障是软件本身所包含的错误所引起的。 软件故障又分为系统软件故障 和应用软件故障。系统软件是 DCS 系统所带来的,若设计考虑不周,在执行中一 但条件满足就会引发故障,造成停机或死机等现象。此类故障并不常见,应用软 件是用户自己编定的,在实际工程应用中,由于应用软件工作复杂,工作量大, 因此应用软件错误几乎难以避免,这就要求在 DCS 系统调试及试运行中十分认 真、仔细,及时发现并解决。 5.操作使用不当造成故障: 在实际运行操作中, 有时会出现 DCS 系统某功能不能使用或某控制部份不能 正常工作,但实际上 DCS 系统并没有故障,而是操作人员操作不熟练或操作错误 所引起的。这对于初次使用 DCS 系统的操作工较为常见。 DCS 系统一旦出现故障,正确分析和诊断故障发生的部位和原因是当务这急,故 障的诊断是根据经验、根据发生故障的环境和现象来确定故障的部份和原因。根 据平时在工作中对系统故障处理的经验和方法, DCS 系统故障诊断可按下述步 对 骤来进行: (1) 是否为使用不当引起的故障。这类故障常见的有供电电源故障、端子接线 故障、模块安装错误、现场操作错误等。 (2) 是否为 DCS 系统操作错误引起的故障。这类故障常见的有某整定参数整定 错误、某设定状态错误造成的。 (3) 确认是现场仪表设备故障还是 DCS 系统故障。若是现场一次仪表故障,修 复相应现场仪表或更换一次仪表。 (4) 若是系统故障,应确认是硬件故障还是软件故障。 (5) 若是硬件故障,则找出相应硬件部位,修复或更换硬件模块。 (6) 若是软件故障,还应确定是系统软件故障还是应用软件故障。 (7) 若是系统软件有故障,可重启动看是否能恢复正常或重新装载系统软件, 重新启动后若不能恢复则与系统管理人员或系统厂家联系解决。 (8) 若应用软件故障,可检查用户编写的程序和组态的所有数据,找出故障原 因。 (9) 利用 DCS 系统的自诊断测试功能。DCS 系统的各部份的设计有相应的自诊 断功能,在系统发生故障时,一定要充分利用这一功能来分析和判断故障的部位 和原因。 在实际应用中,对 DCS 系统故障要根据实际情况去分析和判断。在实际使用 过程中,现场常见的系统硬件故障一般包括如下几方面: (1) 系统模块和元件故障, 可能产生的原因是元器件质量不良、 使用条件不当、 调整不当、错误的接线引入不正常电压而形成的短路等。有时由于现场环境的因 素,如温度、湿度、灰尘、振动、冲击、鼠害等原因也会造成系统硬件故障。 (2) 线路故障:可能产生的原因是,电缆导线端子、插头损坏或松动造成接触 不良,或因接线错误、调试中临时接线、折线或跨接线不当,或因外界腐蚀损坏 等。 (3) 电源故障:可以产生的原因是供电线路事故,线路负载不匹配可引起系统 或局部的电源消失,或电压波动幅度超限,或某元件损坏,或误操作等产生电源 故障。 软件故障包括: (1)程序错误,设计、编程和操作都可能出现程序错误,特别是联锁、顺控软 件,不少问题是由于工艺过程对控制的要求未被满足而引起的。 (2)组态错误:设计和输入组态数据时发生错误,这可以调出组态数据显示进 行检查和修改。 由于 DCS 系统的都带有自诊断程序, 系统能及时对挂在总线上或网络上的各 回路及功能模块进行周期诊断。通过诊断,如发现异常现象,其内容就被编成代 码或相应的故障提示,经由总线的操作站传递信息,从而在 CRT 上显示和报告故 障发生的位置。通过 CRT 了解故障情况后,应进一步通过机柜里插卡或者模块上 的一系列发光二极管的显示状态,查询不正常状态的故障内容。插卡或模块外部 的故障则要逐步检查分析。常用的故障判断方法有: (1) 直接判断法:根据故障现象,范围、特点以及故障发生的记录直接分析判 断产生的原因和故障部位,查出故障。 (2) 外部检查法:对一些明显的有外部特征的故障,通过外部检查,判断故障 部位,如插头松动、断线、碰线、短路、元件发热烧坏、虚焊、脱焊等。有的故 障,特别是暂时性故障,可以通过人为摇动,敲击来发现故障。 (3) 替换对比法: 对有怀疑的故障部件, 用备件或同样的插卡或模块进行替换, 或相互比较,但要注意,替换前,要先分析排除一些危害性故障,如电源异常、 负载短路等引起元件损坏的故障,若不先排除,则替换上的插件或模块会继续损 坏。 (4) 分段查找法:当故障范围及原因不明时,可对故障相关的部件、线路进行 分段,逐段分析检查、测试和替换。 (5) 隔离法:可以分段查找法相配合,将某些部位或线路暂时断开,观察故障 现象变化情况,逐步缩小怀疑对象,最终查出故障部位,进行处理或更换。 对于组态错误,只要确认认为存在组态错误,只要核对组态表格及组态数据,对 相应的组态数据进行修改即可,一般不存在困难。另外,充分利用系统厂家提供 的故障检查流程图和故障诊断表也是快速诊断和判断处理故障的方法。 通常在实际工作中,经常遇到的 DCS 系统故障,还有死机、黑屏及通信故障,这 些故障通常导致工艺参数不能显示,严重时导致工艺系统停车,如死机故障产生 的原因是多方面的,有的是因为操作不当所致,更多的原因是由于模块或插件故 障所引起的,如显示器故障。主机故障,通信故障产生的原因多由通信线路、网 卡及网络接线器故障所引起。 上述是针对 DCS 系统采用的故障判断和处理的一些方法,但是,现场故障是 千变万化的,在实际处理过程中,要结合实际情况加以分析和处理,同时借助专 家故障诊断系统及 DCS 供应商的技术支持, 利用现代网络技术进行远程诊断和处 理,已是一种快捷有效的故障判断和处理方法。虽然专家诊断系统还不完善,还 在不断的发展中,但对我们进行 DCS 系统的故障判断和处理是有帮助的。在日常 工作中,除了掌握相应的故障判断和处理方法外,更应该加强系统的日常维护, 防范系统故障的发生,同时采取相应的管理措施来保证系统的安全可靠,如:加 强 DCS 系统的环境和操作管理,加强防静电措施和良好的屏蔽,控制室要加强防 雷措施并应该有安全可靠的接地系统等。 第二章案例一热工自动化事故案例 热工自动化事故案例控制器重启引发机组跳闸1.1 事件经过 2001 年 11 月 1 日, 电厂 4 号机组停机前有功负荷 270MW, A 无功 96MVar, A、 B 励磁调节器自动并列运行,手动 50Hz 柜跟踪备用。 14 时 26 分,事故音响发出,发电机出口开关、励磁开关跳闸,&调节器 A 柜退出运行&、&调节器 B 柜退出运行&等报警信号发出,机组解列。对 ECS 控制 系统检查、试验,发现#14 控制器发生故障已离线,与之冗余的#34 控制器发生 重启,更换了#14 和#34 控制器主机板后,机组重新启动,不久,发变组与系统 并列。 1.2 原因分析 根据历时数据分析,13 时 31 分,#14 控制器硬件故障而离线运行,热备用 的#34 控制器自动由辅控切为主控。14 时 26 分,#34 控制器由于通讯阻塞引起 &WATCHDOG&误判断,致使控制器重启。由于控制器控制励磁调节器的方式为长信 号,没有断点保护功能,#34 控制器重启后,不能自动回到断点前的状态,导致 A、B 调节器自动退出运行,手动 50Hz 柜自动投入。由于发电机失磁,发电机端 电压下降,导致厂用电源电压降低,手动 50Hz 柜输出电压继续降低,手动 50Hz 柜投入后发电机没有脱离失磁状态,直至切除励磁装置,造成发电机失磁保护动 作,发电机出口开关跳闸。 #14 控制器和#34 控制器控制发变组设备,包括厂用电切换的备自投继电器 接点 BK,#34 控制器重启后,BK 自动复位,继电器接点断开,BK 投到退出位置, 造成 6KV 电源开关
开关自投不成功。 1.3 防范措施 1.3.1 将故障控制器更换。后来制造厂确认这一批主板晶振存在问题,同意免费 更换,利用停机机会更换 4 号机组所有控制器主板。 1.3.2 增加任一控制器、I/O 卡、通讯卡离线报警功能。 1.3.3 程序内部&WATCHDOG&的时间设置太短,易造成误判断,对所有控制器进行 软件升级。 1.3.4 调节器 AQK、BQK 方式开关和厂用电备自投 BK 开关组态图增加断点保护功 能,防止控制器自启动后,励磁调节器和厂用电自投开关退出运行。 1.3.5 检查 ECS 系统的所有组态,对存在以上问题的逻辑进行修改。 1.3.6 联系调节器厂家,使调节器内部可以作到运行状态自保持,将控制器控制 调节器的方式改为短脉冲信号控制。 1.3.7 在 ECS 内增加手动 50Hz 柜输出电压自动跟踪功能。案例二在线传代码致使机组解列1.1 事件经过 2002 年 7 月 12 日,B 电厂#5 机组监盘人员发现机组负荷从 552MW 迅速下 降,主汽压力突升,汽轮机调门开度,由原来的 20%关闭到 10%并继续关闭,高 调门继续迅速关闭至 0%,机组负荷降低至 5MW,运行人员被迫手动紧急停炉,汽 轮机跳闸,发电机解列。 1.2 原因分析 DCS 与汽轮机控制系统分别由两家国外公司制造,两系统差异较大,通讯问 题没有很好地解决,存在一些难以消除的缺陷。热控人员在 DCS 工程师站上向负 责 DCS 与汽轮机控制系统通讯的 PLC 传送通讯代码时,DCS 将汽轮机阀位限制由 正常运行中的 120%修改为 0.25%,造成汽机 1、2、3 号调门由 20%关闭至 0%,机 组负荷由 552MW 迅速降至 5MW。 1.3 防范措施 1.3.1 机组运行期间,禁止 DCS 传代码工作。 1.3.2 机组停运期间,DCS 传代码时,应经运行班长同意,并做好安全措施。 1.3.2 将 DCS 操作员站对汽轮机控制系统操作员站画面进行操作的功能闭锁,但 在 DCS 操作员站上仍能监视到汽轮机控制系统的信息。案例三DCS 工作站时钟混乱引发 DCS 失灵1.1 事件经过: 2001 年 8 月 3 日,C 电厂 2 号机组负荷 200MW,#1 至#9 控制器处于控制方 式,#51 至#59 控制器处于备用方式。8 时 23 分,各控制器依次发 NTP 报警,历 史站报警窗口显示如下: Aug 3 08:23:50 drop7 <7> NTP:too many recvbufs allocated(30) Aug 3 08:23:50 drop4 <7> NTP:too many recvbufs allocated(30) ……… 8 时 26 分,#2 控制器脱网,#52 控制器切为主控;11 时 05 分,#52 控制器 脱网;13 时 39 分,#7 控制器脱网,#57 控制器切为主控,在#7 控制器向#57 控 制器切换瞬间,由该控制器控制的 A、B 磨煤机跳闸;15 时 11 分,#9 控制器脱 网,#59 控制器切为主控,在#9 控制器向#59 控制器切换瞬间,由该控制器控制 的 E 磨煤机跳闸;15 时 51 分,#1 控制器脱网,#51 控制器切为主控,在#1 控制 器向#51 控制器切换瞬间,由该控制器控制的 A 引风机动叶被强制关闭。 15 时 22 分,重启操作员站 drop213(备用时钟站),NTP 报警未消失;15 时 35 分, 重启历史站, 报警未消失; 时 59 分, NTP 15 重启工程师站 (主时钟站) , NTP 报警基本消失;16 时 09 分,重启历史站,16 时 30 分,系统恢复正常。 1.2 原因分析 NTP 软件的作用就是维持网络时钟的统一,主时钟设置在工程师站上,备用 时钟设置在操作员站上。 控制器脱网原因为主时钟与备用时钟不同步造成系统时 钟紊乱,从而造成 NTP 报警导致控制器脱网。 NTP 故障的原因有两种可能,一种是主频为 400MHz 工作站,不同于 1 号机 组的 270MHz(SUN 公司在 400MHz 工作站上对操作系统有较大改进)工作站,2 号 机组所用的 1.1 版本软件在 400MHz 工作站上未测试过,不能确保 1.1 版本软件 在此配置上不出问题。另一种是主时钟与备用时钟不同步,在 8 月 3 日控制器脱 网后, 曾发现 Drop214 的时钟比其它站快了 2 秒, 当时 Drop214 的画面调用速度 较慢,经重启后正常,并且 NTP 时钟报警是在系统运行 73-75 天左右才出现的, 估计是系统时钟偏差积累到一定程度后导致主、备时钟不同步,而引起系统时钟 紊乱,最终导致控制器脱网。 NTP 时钟故障使控制器脱网,处理不及时会使报警的控制器依次脱网,从而 导致整个控制系统瘫痪。 1.3 防范措施 1.3.1 根据本次故障现象,制造商将软件由 1.1 版本升级为 1.2 版本。 1.3.2 为确保控制系统可靠运行,定期重启主时钟和备用时钟站。 1.4 D 电厂 5 号机组在 2002 年试运期间曾发生 DCS 时钟与 GPS 时钟不同步,引 发 DCS 操作员站失灵事件。由于网 上传送的数据均带时间标签,时钟紊乱后会 给运行机组带来严重后果,基本情况与 C 电厂 2 号机组类似。采取的措施是暂时 断开 GPS 时钟,待软件升级和问题得到根本解决后,再恢复 GPS 时钟。案例四CABLETRON 集线器总通讯板故障导致 MFT 误动1.1 事件经过 2002 年 1 月 1 日,E 电厂 1 号机组负荷 250MW,#51 至#59 控制器处于控制 方式,#1 至#9 控制器处于备用方式,A、B、C、E、F 磨煤机运行。18 时 57 分, 所有磨煤机跳闸(直吹炉),MFT 动作,机组跳闸。 1.2 原因分析 经分析,确认是 DCS 集线器的总通讯板故障,导致连在其上的所有控制器同 时发生切换,在控制器向备用控制器切换过程中,#57、#58、#59 控制器 PK 键 信号误发(这三个控制器属 FSSS 系统),即 CRT 上&磨煤机跳闸按钮&的跳闸和 确认指令同时发出,使所有磨煤机跳闸,导致 MFT 动作。 1.3 防范措施 CABLETRON 集线器属于早期产品,目前在市场上购买备件已比较困难,采用 CISCO 集线器来取代 CABLETRON 集线器。案例五冗余控制器失灵造成机组跳闸1.1 事件经过 2003 年 3 月 23 日, 电厂#3 机组停机前电负荷 115MW, F 炉侧主汽压 9.55MPa, 主汽温 537℃,主给水调节门开度 43%,旁路给水调节门开度 47%(每一条给水 管道均能满足 100%负荷的供水),汽包水位正常;其它各参数无异常变化。 监盘人员发现锅炉侧部分参数显示异常,各项操作均不能进行,同时炉侧 CRT 画面显示各项自动已处于解除状态。调自检画面发现#3 控制器离线,#23 控 制器处于主控状态。运行人员立即联系热工人员处理,同时借助汽机侧 CRT 画面 监视主汽压、 主汽温, 并对汽包电接点水位计和水位 TV 加强监视, 主汽压在 9.0~ 9.6MPa 波动、主汽温在 510~540℃波动、汽包水位在+75~-50mm 波动,维持运 行。 几分钟后, 热工人员赶到现场, 发现#3 控制器离线、 控制器为主控状态, #23 但#23 控制器主控下的 I/O 点(汽包水位、主汽温、主汽压、给水压力、等)均 为坏点,自动控制手操失灵。经过多次重启,#3 控制器恢复升为主控状态。在 释放强制的 I/O 点时,监盘人员发现汽包水位急剧下降,就地检查发现旁路给水 调节门在关闭状态,手动摇起三次均自动关闭,汽包水位 TV 和显示表监视不到 水位,手动停炉、停机。 1.2 原因分析 根据能追忆到的历史记录分析,可以推断#3 控制器(主控)故障前,#23 控制器(辅控)因硬件故障或通讯阻塞,已经同 I/O 总线失去了通讯。当#3 控 制器因主机卡故障离线后,#23 控制器升为主控,但无法读取 I/O 数据,造成参 与汽水系统控制的一对冗余控制器同时失灵,给水自动控制系统失控,汽包水位 保护失灵。在新更换的#3 控制器重启成功后释放强制点的过程中,DCS 将旁路 给水调节门指令置零(逻辑如此设计是为了在控制器故障时,运行机组向更安全 的方向发展),关闭旁路调节门。而旁路调节门为老型号的阀门,相当于解除了 自保持的电动门(接受脉冲量信号),切手动时不能做到电气脱扣,因此,紧急 情况下不能顺利打开,造成汽包缺水。 1.3 防范措施 1.3.1 更换#3、#23 控制器主机板,同时考虑增加主机板的备品储备。 1.3.2 增加通讯卡,使控制器与 I/O 卡之间的通讯为冗余的。 1.3.3 对所有控制器、I/O 卡、BC 卡的通讯进行监测,增加脱网逻辑判断功能, 生成报警点并进行历史记录。一旦控制器工作异常,可及时报警并处理。 1.3.4 增加控制器超温报警功能,在控制器出现故障之前可以采取措施,将事故 消灭在萌芽之中。 1.3.5 汽包水位等重要调节、保护系统的输入信号,一般应为三路相互独立的信 号,通过分流器将这三路信号变成六路信号,分别进六块端子板和 AI 卡件,送 入两对控制器,一对控制器用于调节、保护,另一对控制器只参与保护。这样可 以很好地解决一对冗余的控制器同时故障时,重要保护失灵的问题。 1.3.6 更换重要自动调节系统的执行机构,使之具有完善的操作功能。 1.3.7 DCS 失灵时,若主要后备硬手操或监视仪表不能维持正常运行,运行人员 应立即停机、停炉。 1.3.8 关闭 MIS 系统接口站中的所有硬盘共享功能,确保 DCS 系统同 MIS 系统只 具备单向通讯功能。案例六 DCS 公用系统故障导致两台机组同时停运事故分析纳雍发电总厂装机 8×300MW,其中 3~8 号机组 DCS 采用上海新华控制公司 的 XDPS-400 系统,每个循泵房设置远程控制站(两机公用) ,通过光纤连接到 DCS 公用网络,在单元机组操作员站进行监控。,因 DCS 公用控制系统 故障,3、4 号机组运行中 3 台循泵同时跳闸,导致两台机组同时低真空停运, 并造成两台机组凝汽器循环水出水管道垫子因发生水锤损坏多处的严重事故; 经 紧急抢修于次日启动后再次发生运行中 3 台循泵同时跳闸,由于机组负荷低,且 抢救及时,未造成停机事故。在本次事故处理过程中暴露出的问题、采取的改进 措施和汲取的经验教训都具有一定典型性, 尤其在新建机组工程设计和施工调试 阶段应引以重视。 1、事故前运行方式 3、4 号机组负荷均为 310MW,循环水系统扩大单元制运行,#5、#6、#7 循 泵运行,#8 循泵联锁备用,循泵出口联通管#1、#2 电动蝶阀开足。 2、事故经过 14:07,DCS 循环水系统发出卡件故障报警,接着 3、4 号机组循环水系统所 有泵、电动阀门同时发生误跳、误动:#5、#6、#7 循泵同时跳闸,#8 循泵自启; #1 冷却水泵跳闸, 冷却水泵自启; #2 循泵出口母管连通管电动蝶阀#1、 自关; #2 #3、#4 冷却塔循环水进水门自关;工业水回水电动蝶阀#1、#2 自关,工业水回 水电动蝶阀 3 自开。 14:09,4 号机组真空低保护动作跳闸。 14:10,3 号机组低真空保护动作跳闸。 14:18,发现 3、4 号机组 0 米凝汽器胶球网处法兰大量漏水,凝汽器出水管 垫子吹损,遂破坏真空,保压停炉进行抢修。 次日 10:42,4 号机通循环水,13:35 并网;12:10,3 号机通循环水,13:48 并网。15:06,#2 循泵房所有设备再次同时发生误跳、误动。因#6 循泵自启,3 号机循环水压力得以保住;运行人员抢合#8 循泵成功,4 号机循环水压力得以保 住。 鉴于 DCS 公用循环水系统频发故障,在未找到真正原因并加以解决之前,为 防止再次发生事故,制定了循环水系统运行的应急措施方案:将#2 循泵房远程 控制柜内 4 台循泵及出口液控蝶阀的跳闸继电器全部拔除, 避免 DCS 引起设备误 动;循环水系统采用单元制运行,运行派专人加强就地监视,循泵停运操作在电 气监控系统上进行。 3、事故原因分析 3.1 从 DCS 系统查看各动作设备的跳合闸或开关指令,均无输出,运行也无 相关操作记录,排除 CRT 盘上人为误操作可能。 3.2 查看各循泵、出口蝶阀、连通管联络门、冷却塔循环水进水电动门、冷 却水泵、工业水回水电动门等状态,发现所有设备均在同一时刻发生误动,排除 某些设备先动再联动其它设备可能。 3.3 由于循泵跳闸的同时伴随循泵出口母管连通管#1、#2 联络门自关,#3、 #4 塔循环水进水电动门自关、#1 冷却水泵跳闸、工业回水电动门#1、#2 自关, 这些设备均没有循泵跳闸联动的逻辑,控制电源也取自不同的 MCC 盘,除交流电 源外还有直流电源,段上供电设备除#2 循泵房外均运行正常,所以可以排除动 力电源的影响。 3.4 查看 DCS 报警历史,发现跳泵前 1 秒均发生有 DPU64/84 #1 站和#2 站卡 件故障报警。进一步查看#1、#2 站各卡件的报警累积记录,每块卡件均发生 2 次以上的报警,初步判断公用循环水控制系统发生故障是导致事故的原因。 结合事故现象和各设备状态历史趋势仔细分析后发现: 循泵房所有非 DCS #2 控制的设备未误动、进入 DCS 控制但配电箱拉开的设备未误动,而所有由 DCS 控制的设备均在同一时刻发生了误动。 判断事故发生时 DCS 远程控制柜所有出口 继电器同时带电动作,使得所有设备反态动作(运行设备自停、备用设备自启)。 这一结论经试验得到证实。 进一步检查继电器误动原因, 发现远程柜电源系统和接地系统在设计和施工 方面均存在大量安全隐患。经贵州电力试验研究院、DCS 厂家和电厂技术人员共 同对远程柜反复进行电源系统品质测试、接地系统噪声测试、电源切换试验、电 源降压试验,除未捕捉到继电器误动现象外,其它事故中发生的现象均已出现。 经分析试验采取的手段有限,不可能完全模拟出事故时突发恶劣工况,如瞬间大 幅压降和大能量电磁干扰等, 但足以证明远程柜电源系统和接地系统不符合规范 是造成本次事故的根本原因。 4、改进措施 4.1 远程柜电源系统改进措施 (1)将远程柜的两路电源进线(UPS 和保安段)均由 1 根 2.5mm 的线改为 2 根 2.5mm 的线并接,以降低线损电压,经测试提高电源电压 3~5V。 (2)将远程柜空调的电源改接到就地 MCC 盘上,减小空调启停对远程柜供电 电压的影响。 (3)将 B 路电源(保安段)增加一小型 UPS(1kvA,6min),防止电源瞬间突降。 4.2 远程柜接地系统改进措施 (1)在远程柜同底座槽钢间增加胶木板,将远程柜与低压电气柜用胶木板绝 缘隔离,使机柜完全浮空。 (2)重新在循泵房外电缆沟内选择接地点(接地电阻 0.22Ω,厂家要求&2.5 Ω) 。 (3)将远程柜光纤盒内两根钢丝加上绝缘。 (4)将 24V 电源接地线接地。 4.3 DCS 改进措施 (1)按危险分散的原则重新分配 DO 通道,使一块卡件只控制一台循泵。 (2)增加卡件故障次数自动累计功能,便于分析。 (3)将远程柜两路电源状态和 2 个备用继电器的输出接点引入 DCS,对设备 的运行状态进行全程监控、记录。 以上改进措施实施后,未立即恢复循泵跳闸继电器,3、4 号机循环水系统 继续在严密监视状况下运行了 3 个月,未再发生任何异常。,将所有 循泵和出口蝶阀跳闸继电器装复后,循环水系统一直稳定运行至今。至此,可认 为事故隐患已经消除。 5、取得的经验教训 5.1 循环水系统由于运行中设备操作少,电厂基本都是无人值守,因此对其 控制系统安全稳定性的要求更为突出。 一旦发生故障, 尤其在扩大单元制运行时, 会直接威胁到两台机组的安全运行,造成的后果极为严重,设计时应对厂家硬件 配置、图纸方案严格审查,做到一劳永逸。 5.2 循泵房环境远较电子设备间差,远程控制装置应充分考虑现场温湿度、 防尘、防电磁干扰等因素,并为所增设防护设施考虑完善配套解决方案。 5.3 施工单位为图方便, 循泵房 DCS 控制装置电源往往直接从就地低压电气 盘柜取,而循泵房低压电气设备一般属 3 类负荷,电源可靠性较低,甚至未达到 两路冗余,在安装验收时应加以注意检查。 5.4 设计时远程柜电源电缆由热工专业开列, 很难精确计算电缆长度和线损 可能造成的压降,在安装时应现场实际测量电缆走向确定长度后,再根据控制装 置负载大小核算电源电缆线径,确保电源品质。 5.5 电厂平面设计时循泵房通常距主厂房较远, 在丘陵山区其地基多采用回 填处理,周围设置接地桩不能满足要求,只有电气接地网覆盖该区域,实际工程 中又不可能为远程柜设置单独接地点,因此循泵房远程柜接地点的选择尤为重 要,应与附近电气设备接地点保持足够距离,防止干扰反窜。系统#20DPU 柜 AI 案例七 漳泽电力股份漳泽发电厂 DCS 系统 卡件故障, 卡件故障,#4 机(210MW)停机 )发生时间: 2005 年 1 月 2 日 1.事件描述 1.1 事件发生前状态 #4 机组有功 215MW, 无功 39Mvar,主汽压力 12.67MPa/12.68 530℃/535℃,再热汽压力 2.31 /535℃,其它参数正常。 1.2 事件过程 1 月 1 日 13 时 55 分,#4 机组有功负荷突变至 300MW,高、中压调速汽门关 MPa/2.3 MPa,主汽温度MPa,再热汽温 534℃/535℃/533℃ 闭,锅炉过热器、再热器压力升高,过热器安全门、再热汽安全门动作,负荷下 降至 38MW。压力下降后#4-2 再热汽安全门不回座,#4 炉投油,维持参数。 1 月 1 日 14 时 40 分, 热工人员更换#20DPU 柜 AI 卡后, 逐渐恢复负荷至 110MW, 检修继续处理#4-2 再热汽安全门不回座缺陷。 1 月 2 日 3 时 32 分,#4--2 再热器安全门不回座故障经处理无效,申请中调 批准,#4 炉停炉消缺。 1 月 2 日 3 时 35 分,#4 机打闸停机。 1 月 2 日 23 时 40 分,对故障的#4--2 再热器安全门更换阀杆、阀芯后,报中 调同意,#4 炉点火。 1 月 3 日 9 时 10 分,#4 发电机组与系统并列。 2.事件原因及纠正行动 2.1 原因分析 2.1.1 DCS 系统 AI 卡件故障是事件发生的主要原因事件发生后,热工人员检查发现 DCS 系统#20DPU 柜 AI 卡件(模拟量输入卡 件,测点有发电机有功功率信号 2、凝汽器真空信号 2、主汽压力信号 2)CPU、 COM 灯不亮,判断为 DCS 卡件故障。#4 机组正常运行方式为协调(CCS)控制下 的负荷方式,DCS 控制系统中发电机有功功率信号有两路 AI 输入,在 DCS 内部 经过逻辑判断,二选一高选作为 DCS 控制系统实发功率信号,DCS 卡件故障使系 统误以为发电机有功功率为 300MW(当时机组目标负荷设定值为 215MW) ,导致 DCS 系统误发指令,将汽机高、中压调速汽门关闭。汽机#4-2、#4-4 高调门,所 有中调门同时关闭, #4-1、#4-3 高调门在关闭过程中在 52%左右保持 1 分钟后 才继续关闭,使再热器压力升高,再热器安全门动作。 2.1.2 #4-2 再热汽安全门不回座是造成事件扩大的重要原因在再热器安全门动作过程中, 流过安全门阀芯的蒸汽使阀芯和阀杆在高速汽 流作用下剧烈震荡,振断阀芯导向翼,使阀芯阀杆失去径向约束,从而更加剧了 阀芯的摆动,导致阀杆与活塞挂接处猛烈撞击,阀杆和活塞连接最终脱开,导致 #4―2 再热器安全门主阀动作后无法回座。 2.2 纠正行动 2.2.1 漳泽发电厂 DCS 系统逻辑组态不完善,建议改为:1、增加信号品质判断 功能,当任一路发电机功率信号超出正常值范围时,逻辑判断应予以剔除,不影 响 DCS 控制,并发出报警信号。2、当两路发电机有功功率信号出现偏差并大于 20MW,发出报警信号。3、当以上两种情况任意一种出现时,DCS 应将 CCS(协调 控制)切除,将 DEH 运行方式切为阀位控制方式,以避免功率信号故障引起负荷 大幅波动。 2.2.2 对#4-1、#4-3 高压调门在 50%左右停留 1 分钟的原因进行分析,并要求设 备制造厂家提供相关的资料。 2.2.3 再热器安全门主阀为原苏联产品, 结构上存在安全门动作后阀芯脱落从而 无法回座的可能。一方面对故障的#4--2 再热器安全门更换阀杆、阀芯,另外对 同类型的安全门从结构上予以改造,必要时进行更换。案例八沁北#1 沁北 炉 MFT 事故报告事故前运行方式: 2005 年 3 月 26 日 #1 机组负荷 600MW, 协调方式; 1A、 1B、1C、1D、1E 磨煤机均带 47t/h 自动运行,1F 磨煤机检修;主汽温度 560℃, 主汽压力 24.2Mpa,再热器压力 3.8Mpa、再热器温度 533℃,机组运行正常。 事故经过:12 时 39 分 28 秒,#1 炉 MFT 动作,首出为失去燃料保护动作,汽机 跳闸、发电机自动解列。12 时 40 分,#1 机做停机处理;14 时 10 分,#1 炉点 火;15 时 03 分,#1 机冲车;15 时 16 分,#1 机与系统并列;17 时 45 分,投 协调、负荷带至 400MW。 四、原因分析: 事故发生后 26 日、27 日热工检修人员对锅炉 MFT 跳闸组合继电器控制回路 及设备进行了检查,未发现异常;对本次事故涉及到的控制器内的保护逻辑进行 了检查,未发现异常;运行人员、热工检修人员分别依据 SOE 报表(26 日运行 部打印 1 份后丢失) 、OIS18 操作员站操作及事件报警记录、SIS 系统历史曲线等 进行了分析,基本得出停机顺序为:2 台一次风机全部失去逻辑信号误发→5 台 运行磨煤机相继跳闸→锅炉 MFT 失去燃料保护动作停炉→联停 2 台一次风机, 但 对于产生 2 台一次风机全部失去逻辑信号未得到统一认识;29 日 14 时 30 分在 策划部安监、生技专工组织监督下,检修部热工专业、运行部共同在#1 机组上 做了现场模拟停机试验,即将一次风机送试验位、1B 一次风机出口挡板送电, 依次做了“在 1B 一次风机出口挡板全开状态下瞬间接入阀门故障信号”试验、 “在 1B 一次风机出口挡板全开状态下瞬间中断全开信号”试验及“在 1B 一次风 机出口挡板全开状态下运行人员手动操作关、随后立即操作开”等 3 项试验,试 验结果为第 1 项、第 3 项试验过程中系统运行未见异常,第 2 项试验过程中通过 操作员站操作及事件报警记录窗口监视事件记录顺序为:1B 一次风机出口挡板 MSDD“开”状态报警信号→1D 磨煤机来“失去全部一次风机跳闸”信号→1D 磨 煤机跳闸继电器动作信号→1B 一次风机出口挡板 MSDD“开”状态报警消失信号 等,基本与#1 机停机前事件报警记录一致,因此本次停机原因可以确定如下: 1、1B 一次风机出口挡板全开状态信号回路故障造成信号瞬间消失,导致控 制器误发“2 台一次风机全部失去”逻辑信号,继而 5 台运行磨煤机相继跳闸, 最终锅炉 MFT 失去燃料保护动作停炉。 2、1A 一次风机出口挡板长期故障,造成“2 台一次风机全部失去”逻辑中 1A 一次风机回路已动作,即“2 台一次风机全部失去”逻辑 50%生成,而当 1B 一次风机回路故障时保护逻辑信号输出,最终锅炉 MFT 动作停炉。 3、“2 台一次风机全部失去”保护逻辑设计不合理,不应该引入“一次风 机出口挡板全开”信号,导致当现场一次设备故障时误发保护动作信号。 五、暴露出的问题及防范措施: 1、检修部热工专业取消目前#1 机组“2 台一次风机全部失去”控制逻辑中 “一次风机出口挡板全开”信号,#2 机组采取暂时屏蔽信号的方法,待机组停 运时彻底取消, 期间要求运行部做好因上述信号屏蔽而造成的系统运行方式变更 措施及事故预想工作;另外策划部组织运行部、检修部专业人员举一反三全面普 查目前机组保护控制逻辑中存在的过保护问题,并及时提出变更方案。上述全部 工作 4 月 8 日前完成。 2、检修部热工专业应加强对机组重要阀门、档板设备的检查维护工作,定 期开展紧固接线端子、测线路绝缘、馈电回路检查及电动头控制装置功能测试等 工作,保证重要阀门、档板设备反馈信号的可靠性。要求检修部热工专业利用本 次#1 机组 D 级检修将#1 机组重要阀门、档板设备全部检查测试完成;#2 机组利 用日常设备巡检时陆续完成,时间控制在 4 月 30 日前。 3、针对本次事故中 1A 一次风机出口挡板长期故障造成 50%保护动作生成的 现象, 检修部热工专业及控制逻辑审查小组成员应深刻反思, 提高自身安全意识、 提高自身业务水平,在今后工作中坚决杜绝类似现象发生。同时要求检修部热工 专业利用周安全活动时间开展针对性学习。 4、针对本次事故停炉过程中操作员站操作及事件报警记录无磨煤机“分 闸”信号报警缺陷, 要求检修部热工专业将目前的磨煤机“合闸”信号报警修改 为“非合闸”信号报警,此项工作#1 机组 4 月 8 日前完成,#2 机组利用随机停 磨时间陆续完成。 5、针对目前我厂机组热控系统 SAMA 图不完善情况,要求检修部热工专业在 10 月 31 日前完成修改、补充工作,策划部 11 月 30 日前完成印刷工作并下发至 运行、检修及专业管理人员。 6、针对本次事故发生后 SOE 报表丢失的现象,规定自本通报下发之日起机 组运行中事故发生后 SOE 报表的打印、收集、保管、传递工作由运行部负责,并 在第一时间内将打印原件传递至策划部安监人员, 如相应专业需要报表时可予以 复印。 7、从本次事件中还可以看出,目前我厂的逐级汇报制度执行的不顺畅。在 问题出现后,值长应及时通知部门及策划部安监,以便于人员及时到位,掌握第 一手资料,便于事故的分析判断。 六、责任认定: 1、本次事件的主要原因是“2 台一次风机全部失去”保护逻辑设计不合理, 不应该引入“一次风机出口挡板全开”信号, 导致当现场一次设备故障时误发保 护动作信号。 2、此次事件的直接原因是检修人员对现场保护不熟悉,对 1A 一次风机出口 挡板故障未引起足够的重视,在 1B 一次风机出口挡板全开状态信号回路故障造 成信号瞬间消失的情况下,导致控制器误发“2 台一次风机全部失去”逻辑信 号,继而 5 台运行磨煤机相继跳闸,最终锅炉 MFT 失去燃料保护动作停炉。案例九 浙江省电厂分散控制系统故障分析 案例九 浙江省电厂分散控制系统故障分析1 测量模件故障典型案例分析 测量模件&异常&引起的机组跳炉、跳机故障占故障比例较高,但相对来讲故 障原因的分析查找和处理比较容易,根据故障现象、故障首出信号和 SOE 记录, 通过分析判断和试验,通常能较快的查出&异常&模件。这种&异常&模件有硬性故 障和软性故障二种,硬性故障只能通过更换有问题模件,才能恢复该系统正常运 行;而软性故障通过对模件复位或初始化,系统一般能恢复正常。比较典型的案 例有三种: (1)未冗余配置的输入/输出信号模件异常引起机组故障。 如有台 130MW 机组 正常运行中突然跳机,故障首出信号为&轴向位移大Ⅱ&,经现场检查,跳机前后 有关参数均无异常,轴向位移实际运行中未达到报警值保护动作值,本特利装置 也未发讯,但 LPC 模件却有报警且发出了跳机指令。因此分析判断跳机原因为 DEH 主保护中的 LPC 模件故障引起,更换 LPC 模件后没有再发生类似故障。另一 台 600MW 机组,运行中汽机备用盘上&汽机轴承振动高&、&汽机跳闸&报警,同时 汽机高、中压主汽门和调门关闭,发电机逆功率保护动作跳闸;随即高低压旁路 快开,磨煤机 B 跳闸,锅炉因&汽包水位低&MFT。经查原因系#1 高压调门因阀位 变送器和控制模件异常,使调门出现大幅度晃动直至故障全关,过程中引起#1 轴承振动高高保护动作跳机。更换#1 高压调门阀位控制卡和阀位变送器后,机 组启动并网,恢复正常运行。 (2)冗余输入信号未分模件配置,当模件故障时引起机组跳闸:如有一台 600MW 机组运行中汽机跳闸,随即高低压旁路快开,磨煤机 B 和 D 相继跳闸,锅 炉因&炉膛压力低低&MFT。当时因系统负荷紧张,根据 SOE 及 DEH 内部故障记录, 初步判断的跳闸原因而强制汽机应力保护后恢复机组运行。二日后机组再次跳 闸,全面查找分析后,确认 2 次机组跳闸原因均系 DEH 系统三路&安全油压力低& 信号共用一模件,当该模件异常时导致汽轮机跳闸,更换故障模件后机组并网恢 复运行。另一台 200MW 机组运行中,汽包水位高Ⅰ值,Ⅱ值相继报警后 MFT 保护 动作停炉。查看 CRT 上汽包水位,2 点显示 300MM,另 1 点与电接点水位计显示 都正常。进一步检查显示 300MM 的 2 点汽包水位信号共用的模件故障,更换模件 后系统恢复正常。针对此类故障,事后热工所采取的主要反事故措施,是在检修 中有针对性地对冗余的输入信号的布置进行检查,尽可能地进行分模件处理。 (3)一块 I/O 模件损坏, 引起其它 I/O 模件及对应的主模件故障:如有台机组 &CCS 控制模件故障&及&一次风压高低&报警的同时, 上所有磨煤机出口温度、 CRT 电流、 给煤机煤量反馈显示和总煤量百分比、 氧量反馈, 燃料主控 BTU 输出消失, F 磨跳闸(首出信号为&一次风量低&)。4 分钟后 CRT 上磨煤机其它相关参数也失 去且状态变白色,运行人员手动 MFT(当时负荷 410MW)。经检查电子室制粉系统 过程控制站(PCUOl 柜 MOD4)的电源电压及处理模件底板正常, 二块 MFP 模件死机 且相关的一块 CSI 模件((模位 1-5-3,有关 F 磨 CCS 参数)故障报警,拔出检查 发现其 5VDC 逻辑电源输入回路、第 4 输出通道、连接 MFP 的 I/O 扩展总线电路 有元件烧坏 (由于输出通道至 BCS(24VDC),因此不存在外电串入损坏元件的可 能)。经复位二块死机的 MFP 模件,更换故障的 CSI 模件后系统恢复正常。根据 软报警记录和检查分析,故障原因是 CSI 模件先故障,在该模件故障过程中引起 电压波动或 I/O 扩展总线故障, 导致它 I/O 模件无法与主模件 MFPO3 通讯而故障, 信号保持原值,最终导致主模件 MFPO3 故障(所带 A-F 磨煤机 CCS 参数),CRT 上 相关的监视参数全部失去且呈白色。 2 主控制器故障案例分析 由于重要系统的主控制器冗余配置, 大大减少了主控制器&异常&引发机组跳 闸的次数。 主控制器&异常&多数为软故障, 通过复位或初始化能恢复其正常工作, 但也有少数引起机组跳闸,多发生在双机切换不成功时,如: (1)有台机组运行人员发现电接点水位计显示下降,调整给泵转速无效,而 CRT 上汽包水位保持不变。当电接点水位计分别下降至甲-300mm,乙-250mm,并 继续下降且汽包水位低信号未发,MFT 未动作情况下,值长令手动停炉停机,此 时 CRT 上调节给水调整门无效,就地关闭调整门;停运给泵无效,汽包水位急剧 上升,开启事故放水门,甲、丙给泵开关室就地分闸,油泵不能投运。故障原因 是给水操作站运行 DPU 死机, 备用 DPU 不能自启动引起。 事后热工对给泵、 引风、 送风进行了分站控制,并增设故障软手操。 (2)有台机组运行中空预器甲、乙挡板突然关闭,炉膛压力高 MFT 动作停炉; 经查原因是风烟系统 I/O 站 DPU 发生异常, 工作机向备份机自动切换不成功引起。 事后电厂人员将空预器烟气挡板甲 1、乙 1 和甲 2、乙 2 两组控制指令分离,分 别接至不同的控制站进行控制,防止类似故障再次发生。 3 DAS 系统异常案例分析 DAS 系统是构成自动和保护系统的基础,但由于受到自身及接地系统的可靠 性、现场磁场干扰和安装调试质量的影响,DAS 信号值瞬间较大幅度变化而导致 保护系统误动,甚至机组误跳闸故障在我省也有多次发生,比较典型的这类故障 有: (1)模拟量信号漂移:为了消除 DCS 系统抗无线电干扰能力差的缺陷,有的 DCS 厂家对所有的模拟量输入通道加装了隔离器,但由此带来部分热电偶和热电 阻通道易电荷积累,引起信号无规律的漂移,当漂移越限时则导致保护系统误动 作。我省曾有三台机组发生此类情况(二次引起送风机一侧马达线圈温度信号向 上漂移跳闸送风机,联跳引风机对应侧),但往往只要松一下端子板接线(或拆下 接线与地碰一下)再重新接上,信号就恢复了正常。开始热工人员认为是端子柜 接地不好或者 I/O 屏蔽接线不好引起,但处理后问题依旧。厂家多次派专家到现 场处理也未能解决问题。后在机组检修期间对系统的接地进行了彻底改造,拆除 原来连接到电缆桥架的 AC、DC 接地电缆;柜内的所有备用电缆全部通过导线接 地;UPS 至 DCS 电源间增加 1 台 20kVA 的隔离变压器,专门用于系统供电,且隔 离变压器的输出端 N 线与接地线相连,接地线直接连接机柜作为系统的接地。同 时紧固每个端子的接线;更换部份模件并将模件的软件版本升级等。使漂移现象 基本消除。 (2)DCS 故障诊断功能设置不全或未设置。信号线接触不良、断线、受干扰, 便信号值瞬间变化超过设定值或超量程的情况,现场难以避免,通过 DCS 模拟量 信号变化速率保护功能的正确设置, 可以避免或减少这类故障引起的保护系统误 动。但实际应用中往往由于此功能未设置或设置不全,使此类故障屡次发生。如 一吹风机 B 跳闸引起机组 RB 动作,首出信号为轴承温度高。经查原因是由于测 温热电阻引线是细的多股线,而信号电缆是较粗的单股线,两线采用绞接方式, 在震动或外力影响下连接处松动引起轴承温度中有点信号从正常值突变至无穷 大引起(事后对连接处进行锡焊处理)。类似的故障有:民工打扫现场时造成送风 机轴承温度热电阻接线松动引起送风机跳闸;轴承温度热电阻本身损坏引起一次 风机跳闸;因现场干扰造成推力瓦温瞬间从 99℃突升至 117℃,l 秒钟左右回到 99℃,由于相邻第八点已达 85℃,满足推力瓦温度任一点 1O5℃同时相邻点达 85℃跳机条件而导致机组跳闸等等。预防此类故障的办法,除机组检修时紧固电 缆和电缆接线,并采用手松拉接线方式确认无接线松动外,是完善 DCS 的故障诊 断功能, 对参与保护连锁的模拟量信号, 增加信号变化速率保护功能尤显重要(一 当信号变化速率超过设定值,自动将该信号退出相应保护并报警。当信号低于设 定值时,自动或手动恢复该信号的保护连锁功能)。 (3)DCS 故障诊断功能设置错误:我省有台机组因为电气直流接地,保安 IA 段工作进线开关因跳闸,引起挂在该段上的汽泵 A 的工作油泵 A 连跳,油泵 B 连锁启动过程中由于油压下降而跳汽泵 A, 汽泵 B 升速的同时电泵连锁启动成功。 但由于运行操作速度过度, 电泵出口流量超过量程, 超量程保护连锁开再循环门, 使得电泵实际出水小,B 泵转速上升到 5760 转时突然下降 1000 转左右(事后查 明是抽汽逆止阀问题),最终导致汽包水位低低保护动作停炉。此次故障是信号 超量程保护设置不合理引起。一般来说,DAS 的模拟量信号超量程、变化速率大 等保护动作后, 应自动撤出相应保护, 待信号正常后再自动或手动恢复保护投运。 4 软件故障案例分析 分散控制系统软件原因引起的故障,多数发生在投运不久的新软件上,运行 的老系统发生的概率相对较少,但一当发生,此类故障原因的查找比较困难,需 要对控制系统软件有较全面的了解和掌握,才能通过分析、试验,判断可能的故 障原因, 因此通常都需要厂家人员到现场一起进行。 这类故障的典型案例有三种: (1)软件不成熟引起系统故障:此类故障多发生在新系统软件上,如有台机组 80%额定负荷时,除 DEH 画面外所有 DCS 的 CRT 画面均死机(包括两台服务器), 参数显示为零,无法操作,但投入的自动系统运行正常。当时采取的措施是:运 行人员就地监视水位,保持负荷稳定运行,热工人员赶到现场进行系统重启等紧 急处理,经过 30 分钟的处理系统恢复正常运行。故障原因经与厂家人员一起分 析后,确认为 DCS 上层网络崩溃导致死机,其过程是服务器向操作员站发送数据 时网络阻塞,引起服务器与各操作员站的连接中断,造成操作员站读不到数据而 不停地超时等待,导致操作员站图形切换的速度十分缓慢(网络任务未死)。针对 管理网络数据阻塞情况,厂家修改程序考机测试后进行了更换。另一台机组曾同 时出现 4 台主控单元&白灯&现象, 现场检查其中 2 台是因为 A 机备份网停止发送, 1 台是 A 机备份网不能接收,1 台是 A 机备份网收、发数据变慢(比正常的站慢几 倍)。这类故障的原因是主控工作机的网络发送出现中断丢失,导致工作机发往 备份机的数据全部丢失,而双机的诊断是由工作机向备份机发诊断申请,由备份 机响应诊断请求,工作机获得备份机的工作状态,上报给服务器。由于工作机的 发送数据丢失,所以工作机发不出申请,也就收不到备份机的响应数据,认为备 份机故障。临时的解决方法是当长时间没有正确发送数据后,重新初始化硬件和 软件,使硬件和软件从一个初始的状态开始运行,最终通过更新现场控制站网络 诊断程序予以解决。 (2)通信阻塞引发故障:使用 TELEPERM-ME 系统的有台机组,负荷 300MW 时, 运行人员发现煤量突减,汽机调门速关且 CRT 上所有火检、油枪、燃油系统均无 信号显示。热工人员检查发现机组 EHF 系统一柜内的 I/O BUS 接口模件 ZT 报警 灯红闪,操作员站与 EHF 系统失去偶合,当试着从工作站耦合机进入 OS250PC 软件包调用 EHF 系统时, 提示不能访问该系统。 通过查阅 DCS 手册以及与 SIEMENS 专家间的电话分析讨论,判断故障原因最大的可能是在三层 CPU 切换时,系统处 理信息过多造成中央 CPU 与近程总线之间的通信阻塞引起。 根据商量的处理方案 于当晚 11 点多在线处理,分别按三层中央柜的同步模件的 SYNC 键,对三层 CPU 进行软件复位:先按 CPUl 的 SYNC 键,相应的红灯亮后再按 CPU2 的 SYNC 键。第 二层的同步红灯亮后再按 CPU3 的同步模件的 SYNC 键,按 3 秒后所有的 SYNC 的 同步红灯都熄灭,系统恢复正常。 (3)软件安装或操作不当引起;有两台 30 万机组均使用 Conductor NT5.0 作为 其操作员站,每套机组配置 3 个 SERVER 和 3 个 CLIENT,三个 CLIENT 分别配置 为大屏、值长站和操作员站,机组投运后大屏和操作员站多次死机。经对全部操 作员站的 SERVER 和 CLIENT 进行全面诊断和多次分析后,发现死机的原因是:1) 一台 SERVER 因趋势数据文件错误引起它和挂在它上的 CLIENT 在当调用趋势画面 时画面响应特别缓慢(俗称死机)。在删除该趋势数据文件后恢复正常。2)一台 SERVER 因文件类型打印设备出错引起该 SERVER 的内存全部耗尽,引起它和挂在 它上的 CLIENT 的任何操作均特别缓慢,这可通过任务管理器看到 DEV.EXE 进程 消耗掉大量内存。该问题通过删除文件类型打印设备和重新组态后恢复正常。3) 两台大屏和工程师室的 CLIENT 因声音程序没有正确安装,当有报警时会引起进 程 CHANGE.EXE 调用后不能自动退出, 大量的 CHANGE.EXE 堆积消耗直至耗尽内存, 当内存耗尽后,其操作极其缓慢 (俗称死机)。重新安装声音程序后恢复正常。 此外操作员站在运行中出现的死机现象还有二种:一种是鼠标能正常工作,但控 制指令发不出,全部或部分控制画面不会刷新或无法切换到另外的控制画面。这 种现象往往是由于 CRT 上控制画面打开过多,操作过于频繁引起,处理方法为用 鼠标打开 VMS 系统下拉式菜单,RESET 应用程序,10 分钟后系统一般就能恢复正 常。另一种是全部控制画面都不会刷新,键盘和鼠标均不能正常工作。这种现象 往往是由操作员站的 VMS 操作系统故障引起。此时关掉 OIS 电源,检查各部分连 接情况后再重新上电。如果不能正常启动,则需要重装 VMS 操作系统;如果故障 诊断为硬件故障,则需更换相应的硬件。 (4)总线通讯故障:有台机组的 DEH 系统在准备做安全通道试验时,发现通道 选择按钮无法进入,且系统自动从&高级&切到&基本级&运行,热控人员检查发现 GSE 柜内的所有输入/输出卡(CSEA/CSEL)的故障灯亮, 经复归 GSE 柜的 REG 卡后, CSEA/CSEL 的故障灯灭,但系统在重启&高级&时,维护屏不能进入到正常的操作 画面呈死机状态。根据报警信息分忻,故障原因是系统存在总线通讯故障及节点 故障引起。 由于阿尔斯通 DEH 系统无冗余配置, 当时无法处理, 后在机组调停时, 通过对基本级上的 REG 卡复位,系统恢复了正常。 (5)软件组态错误引起:有台机组进行#1 中压调门试验时,强制关闭中间变 量 IVlRCO 信号,引起#l-#4 中压调门关闭,负荷从 198MW 降到 34MW,再热器压 力从 2.04MP 升到 4.OMpa,再热器安全门动作。故障原因是厂家的 DEH 组态,未 按运行方式进行,流量变量本应分别赋给 TVlRCO-IV4RCO,实际组态是先赋给 IVlRCO,再通过 IVlRCO 分别赋给 IV2RCO-IV4RCO。因此当强制 IVlRCO=0 时,所 有调门都关闭,修改组态文件后故障消除。 5 电源系统故障案例分析 DCS 的电源系统,通常采用 1:1 冗余方式(一路由机组的大 UPS 供电,另一 路由电厂的保安电源供电),任何一路电源的故障不会影响相应过程控制单元内 模件及现场 I/O 模件的正常工作。但在实际运行中,子系统及过程控制单元柜内 电源系统出现的故障仍为数不少,其典型主要有: (1)电源模件故障:电源模件有电源监视模件、系统电源模件和现场电源模件 3 种。现场电源模件通常在端子板上配有熔丝作为保护,因此故障率较低。而前 二种模件的故障情况相对较多:1)系统电源模件主要提供各不同等级的直流系统 电压和 I/O 模件电压。 该模件因现场信号瞬间接地导致电源过流而引起损坏的因 素较大。 因此故障主要检查和处理相应现场 I/O 信号的接地问题, 更换损坏模件。 如有台机组负荷 520MW 正常运行时 MFT,首出原因&汽机跳闸&。CRT 画面显示二 台循泵跳闸,备用盘上循泵出口阀<86°信号报警。5 分钟后运行巡检人员就地 告知循泵 A、B 实际在运行,开关室循泵电流指示大幅晃动且 A 大于 B。进一步 检查机组 PLC 诊断画面,发现控制循泵 A、B 的二路冗余通讯均显示&出错&。43 分钟后巡检人员发现出口阀开度小就地紧急停运循泵 A、B。事后查明 A、B 两路 冗余通讯中断失去的原因, 是为通讯卡提供电源支持的电源模件故障而使该系统 失电,中断了与 PLC 主机的通讯,导致运行循泵 A、B 状态失去,凝汽器保护动 作,机组 MFT。更换电源模件后通讯恢复正常。事故后热工制定的主要反事故措 施,是将两台循泵的电流信号由 PLC 改至 DCS 的 CRT 显示,消除通信失去时循泵 运行状态无法判断的缺陷;增加运行泵跳闸关其出口阀硬逻辑(一台泵运行, 一台 泵跳闸且其出口阀开度>30 度,延时 15 秒跳运行泵硬逻辑;一台泵运行,一台 泵跳闸且其出口阀开度>0 度,逆转速动作延时 30 秒跳运行泵硬逻辑);修改凝 汽器保护实现方式。2)电源监视模件故障引起:电源监视模件插在冗余电源的中 间,用于监视整个控制站电源系统的各种状态,当系统供电电压低于规定值时, 它具有切断电源的功能,以免损坏模件。另外它还提供报警输出触点,用于接入 硬报警系统。在实际使用中,电源监视模件因监视机箱温度的 2 个热敏电阻可靠 性差和模件与机架之间接触不良等原因而故障率较高。 此外其低电压切断电源的 功能也会导致机组误跳闸,如有台机组满负荷运行,BTG 盘出现&CCS 控制模件故 障&报警,运行人员发现部分 CCS 操作框显示白色,部分参数失去,且对应过程 控制站的所有模件显示白色,6s 后机组 MFT,首出原因为 &引风机跳闸&。约 2 分钟后 CRT 画面显示恢复正常。当时检查系统未发现任何异常(模件无任何故障 痕迹,过程控制站的通讯卡切换试验正常)。机组重新启动并网运行也未发现任 何问题。事后与厂家技术人员一起专题分析讨论,并利用其它机组小修机会对控 制系统模拟试验验证后, 认为事件原因是由于该过程控制站的系统供电电压瞬间 低于规定值时,其电源监视模件设置的低电压保护功能作用切断了电源,引起控 制站的系统电源和 24VDC、5VDC 或 l5VDC 的瞬间失去,导致该控制站的所有模件 停止工作(现象与曾发生过的 24VDC 接地造成机组停机事件相似),使送、引风机 调节机构的控制信号为 0,送风机动叶关闭(气动执行机构),引风机的电动执行 机构开度保持不变(保位功能),导致炉膛压力低,机组 MFT。 (2)电源系统连接处接触不良:此类故障比较典型的有: 1)电源系统底板上 5VDC 电压通常测量值在 5.10~5.2OVDC 之间,但运 行中测量各柜内进模件的电压很多在 5V 以下,少数跌至 4.76VDC 左右,引起部 分 I/O 卡不能正常工作。 经查原因是电源底板至电源母线间连接电缆的多芯铜线 与线鼻子之间,表面上接触比较紧,实际上因铜线表面氧化接触电阻增加,引起 电缆温度升高,压降增加。在机组检修中通过对所有 5VDC 电缆铜线与线鼻子之 间的焊锡处理,问题得到解决。 2)MACS-IDCS 运行中曾在两个月的运行中发生 2M801 工作状态显示故障 而更换了 13 台主控单元,但其中的多数离线上电测试时却能正常启动到工作状 态,经查原因是原主控 5V 电源,因线损和插头耗损而导致电压偏低;通过更换主 控间的冗余电缆为预制电缆;现场主控单元更换为 2M8OlE-DOl,提升主控工作电 源单元电压至 5.25V 后基本恢复正常。 3)有台机组负荷 135MW 时,给水调门和给水旁路门关小,汽包水位急 速下降引发 MFT。事后查明原因是给水调门、给水旁路门的端子板件电源插件因 接触不良,指令回路的 24V 电源时断时续,导致给水调门及给水旁路门在短时内 关下,汽包水位急速下降导致 MFT。 4)有台机组停炉前,运行将汽机控制从滑压切至定压后,发现 DCS 上汽 机调门仍全开,主汽压力 4260kpa,SIP 上显示汽机压力下降为 1800kpa,汽机主 保护未动作,手动拍机。故障原因系汽机系统与 DCS、汽机显示屏通讯卡件 BOXl 电源接触点虚焊、接触不好,引起通讯故障,使 DCS 与汽机显示屏重要数据显示 不正常,运行因汽机重要参数失准手动拍机。经对 BOXl 电源接触点重新焊接后 通讯恢复。 5)循泵正常运行中曾发出#2UPS 失电报警,20 分钟后对应的#3、#4 循 泵跳闸。由于运行人员处理及时,未造成严重后果。热工人员对就地进行检查发 现#2UPS 输入电源插头松动,导致#2UPS 失电报警。进行专门试验结果表明,循 泵跳闸原因是 UPS 输入电源失去后又恢复的过程中, 引起 PLC 输入信号抖动误发 跳闸信号。 (3)UPS 功能失效:有台机组呼叫系统的喇叭有杂音,通信班人员关掉该系统 的主机电源查原因并处理。重新开启该主机电源时,呼叫系统杂音消失,但集控 室右侧 CRT 画面显示全部失去,同时 MFT 信号发出。经查原因是由于呼叫系统主 机电源接至该机组主 UPS,通讯人员在带载合开关后,给该机组主 UPS 电源造成 一定扰动,使其电压瞬间低于 195V,导致 DCS 各子系统后备 UPS 启动,但由于 BCS 系统、历史数据库等子系统的后备 UPS 失去带负荷能力(事故后试验确定), 造成这些系统失电,所有制粉系统跳闸,机组由于&失燃料&而 MFT。 (4)电源开关质量引起:电源开关故障也曾引起机组多次 MFT,如有台机组的 发电机定冷水和给水系统离线,汽泵自行从&自动&跳到&手动&状态;在 MEH 上重 新投入锅炉自动后,汽泵无法增加流量。1 分钟后锅炉因汽包水位低 MFT 动作。 故障原因经查是 DCS 给水过程控制站二只电源开关均烧毁,造成该站失电,导致 给水系统离线,无法正常向汽泵发控制信号,最终锅炉因汽包水位低 MFT 动作。 6 SOE 信号准确性问题处理 一旦机组发生 MFT 或跳机时, 运行人员首先凭着 SOE 信号发生的先后顺序来 进行设备故障的判断。因此 SOE 记录信号的准确性,对快速分析查找出机组设备 故障原因有着很重要的作用。这方面曾碰到过的问题有: (l)SOE 信号失准:由于设计等原因,基建接受过来的机组,SOE 信号往往存 在着一些问题(如 SOE 系统的信号分辨力达不到指标要求却因无测试仪器测试而 无法证实,信号源不是直接取自现场,描述与实际不符,有些信号未组态等等), 导致 SOE 信号不能精确反映设备的实际动作情况。有台机组 MFT 时,光字牌报警 &全炉膛灭火&,检查 DCS 中每层的 3/4 火检无火条件瞬间成立,但 SOE 却未捉捕 到&全炉膛灭火&信号。另一台机组 MFT 故障,根据运行反映,首次故障信号显示 &全炉膛灭火&,同时有&DCS 电源故障&报警,但 SOE 中却未记录到 DCS 电源故障 信号。这使得 SOE 系统在事故分析中的作用下降,增加了查明事故原因的难度。 为此我省各电厂组织对 SOE 系统进行全面核对、整理和完善,尽量做到 SOE 信号 都取自现场,消除 SOE 系统存在的问题。同时我们专门开发了 SOE 信号分辨力测 试仪,经浙江省计量测试院测试合格后,对全省所属机组 SOE 系统分辨力进行全 部测试,掌握了我省 DCS 的 SOE 系统分辨力指标不大于 lms 的有四家,接近 lms 的有二家,4ms 的有一家。 (2)SOE 报告内容凌乱:某电厂两台 30 万机组的 INFI-90 分散控制系统,每 次机组跳闸时生成的多份 SOE 报告内容凌乱, 启动前总是生成不必要的 SOE 报告。 经过 1)调整 SEM 执行块参数,把触发事件后最大事件数及触发事件后时间周期 均适当增大。2)调整 DSOE Point 清单,把每个通道的 Simple Trigger 由原来的 BOTH 改为 OTOl,Recordable Event。3)重新下装 SEM 组态后,问题得到了解决。 (3)SOE 报表上出现多个点具有相同的时间标志:对于 INFI-90 分散控制系 统,可能的原因与处理方法是:1)某个 SET 或 SED 模件被拔出后在插入或更换, 导致该子模件上的所有点被重新扫描并且把所有状态为 1 的点(此时这些点均有 相同的跳闸时间)上报给 SEM。2)某个 MFP 主模件的 SOE 缓冲区设置太小产生溢 出,这种情况下,MFP 将会执行内部处理而复位 SOE,导致其下属的所有 SET 或 SED 子模件中, 所有状态为 1 的点(这些点均有相同跳闸时间)上报给了 SEM 模件。 处理方法是调整缓冲区的大小(其值由 FC241 的 S2 决定,一般情况下调整为 100)。3)SEM 收到某个 MFP 的事件的时间与事件发生的时间之差大于设定的最大 等待时间(由 FC243 的 S5 决定),则 SEM 将会发一个指令让对应的 MFP 执行 SOE 复位,MFP 重新扫描其下属的所有 SOE 点,且将所有状态为 1 的点(这些点均有 相同的跳闸时间)上报给 SEM。在环路负荷比较重的情况下(比如两套机组通过中 央环公用一套 SEM 模件),可适当加大 S5 值,但最好不要超过 60 秒。 7 控制系统接线原因 控制系统接线松动、错误而引起机组故障的案例较多,有时此类故障原因很 难查明。 此类故障虽与控制系统本身质量无关, 但直接影响机组的安全运行, 如: (1)接线松动引起:有台机组负荷 125MW,汽包水位自动调节正常,突然给水 泵转速下降,执行机构开度从 64%关至 5%左右,同时由于给水泵模拟量手站输出 与给水泵液偶执行机构偏差大(大于 10%自动跳出)给水自动调节跳至手动,最低 转速至 1780rpm,汽包水位低低 MFT 动作。原因经查是因为给水泵液偶执行机构 与 DCS 的输出通道信号不匹配,在其之间加装的信号隔离器,因 24VDC 供电电源 接线松动失电引起。紧固接线后系统恢复正常。事故后对信号隔离器进行了冗余 供电。 (2)接线错误引起:某#2 机组出力 300MW 时, 汽泵跳闸(无跳闸原因首出、 #2B 无大屏音响报警),机组 RB 动作,#2E 磨联锁跳闸,电泵自启,机组被迫降负荷。 由于仅有 ETS 出口继电器动作记录,无#2B 小机跳闸首出和事故报警,且故障后 的检查试验系统都正常,当时原因未查明。后机组检修复役前再次发生误动时, 全面检查小机现场紧急跳闸按钮前接的是电源地线,跳闸按钮后至 PLC,而 PLC 后的电缆接的是 220V 电源火线,拆除跳闸按钮后至 PLC 的电缆,误动现象消除, 由此查明故障原因是是跳闸按钮后至 PLC 的电缆发生接地, 引起紧急跳闸系统误 动跳小机。 (3)接头松动引起:一台机组备用盘硬报警窗处多次出现&主机 EHC 油泵 2B 跳闸&和&开式泵 2A 跳闸&等信号误报警, 通过 CRT 画面检查发现 PLC 的 A 路部分 I/O 柜通讯时好时坏, 进一步检查发现机侧 PLC 的 3A、 5A 和 6 的 4 个就地 I/O 4、 柜二路通讯同时时好时坏,与此同时机组 MFT 动作,首出原因为汽机跳闸。原因 是通讯母线 B 路在 PLC4 柜内接头和 PLC5、 PLC4 柜本身的通讯分支接头有轻微 松动,通过一系列的紧固后通讯恢复正常。 针对接线和接头松动原因引起的故障, 我省在基建安装调试和机组检修过程 中,通过将手松拉接线以确认接线是否可靠的方法,列入质量验收内容,提高了 接线质量,减少了因接线质量引起的机组误动。同时有关电厂制定了热工控设备 通讯电缆随机组检修紧固制度,完善控制逻辑,提高了系统的可靠性。 8 控制系统可靠性与其它专业的关系 需要指出的是 MFT 和 ETS 保护误动作的次数,与有关部门的配合、运行人员 对事故的处理能力密切相关,类似的故障有的转危为安,有的导致机组停机。一 些异常工况出现或辅机保护动作,若运行操作得当,本可以避免 MFT 动作(如有 台机组因为给煤机煤量反馈信号瞬时至零,30 秒后逻辑联锁磨煤机热风隔离挡 板关闭,引起一次风流量急降和出口风温持续下跌,热风调节挡板自动持续开至 100%, 冷风调节挡板由于前馈回路的作用而持续关小, 使得一次风流量持续下降。 但由于热风隔离挡板有卡涩,关到位信号未及时发出,使得一次风流量小至造成 磨煤机中的煤粉积蓄,第 5 分钟时运行减少了约 10%的煤量,约 6 分钟后热风隔 离挡板突然关到位,引起一次风流量的再度急剧下降,之后按设计连锁逻辑,冷 风隔离挡板至全开, 使得一次风流量迅速增大, 并将磨煤机 C 中的蓄煤喷向炉膛, 造成锅炉燃烧产生局部小爆燃,引风机自动失控于这种异常情况,在三个波的扰 动后(约 1 分钟),炉膛压力低 MFT。当时 MFT 前 7 分钟的异常工况运行过程中, 只要停运该台磨煤机就可避免 MFT 故障的发生)。此外有关部门与热工良好的配 合,可减少或加速一些误动隐患的消除;因此要减少机组停组次数,除热工需在 提高设备可靠性和自身因素方面努力外, 还需要热工和机务的协调配合和有效工 作,达到对热工自动化设备的全方位管理。需要运行人员做好事故预想,完善相 关事故操作指导,提高监盘和事故处理能力。 三、提高热工自动化系统可靠性的建议 随着热工系统覆盖机、电、炉运行的所有参数,监控功能和范围的不断扩大 以及机组运行特点的改变和 DCS 技术的广泛应用, 热控自动化设备已由原先的配 角地位转变为决定机组安全经济运行的主导因素,其任一环节出现问题,都有导 致热控装置部分功能失效或引发系统故障,机组跳闸、甚至损坏主设备的可能。 因此如何通过科学的基础管理,确保所监控的参数准确、系统运行可靠是热工安 全生产工作中的首要任务。在收集、总结、吸收同仁们自动化设备运行检修、管 理经验和保护误动误动原因分析的基础上,结合热工监督工作实践,对提高热工 保护系统可靠性提出以下建议,供参考: 3.1 完善热工自动化系统 (1)解决操作员站电源冗余问题:过程控制单元柜的电源系统均冗余配置, 但 所有操作员站的电源通常都接自本机组的大 UPS,不提供冗余配置。如果大 UPS 电压波动,将可能引起所有操作员站死机而不得不紧急停运机组,但由于死机后 所有信号都失去监视,停机也并非易事。为避免此类问题发生,建议将每台机组 的部分操作员站与另一台机组的大 UPS 交叉供电, 以保证当本机大 UPS 电压波动 时,仍有 2 台 OIS 在正常运行。 (2)对硬件的冗余配置情况进行全面核查,重要保护信号尽可能采取三取二 方式,消除同参数的多信号处理和互为备用设备的控制回路未分模件、分电缆或 分电源(对互为备用的设备)现象,减少一模件故障引起保护系统误动的隐患。 (3)做好软报警信号的整理:一台 600MW 机组有近万个软报警点, 这些软报警 点往往未分级处理,存在许多描述错误,报警值设置不符设计,导致操作画面上 不断出现大量误报警,使运行人员疲倦于报警信号,从而无法及时发现设备异常 情况,也无法通过软报警去发现、分析问题。为此组织对软报警点的核对清理, 整理并修改数据库里软报警量程和上、下限报警值;通过数据库和在装软件逻辑 的比较,矫正和修改错误描述,删除操作员站里重复和没有必要的软报警点,对 所有软报警重新进行分组、分级,采用不同的颜色并开通操作员站声音报警,进 行报警信号的综合应用研究,使软报警在运行人员监盘中发挥作用。 (4)合埋设置进入保护联锁系统的模拟量定值信号故障诊断功能的处理,如 信号变化速率诊断处理功能的利用,可减少因接线松动、干扰信号或设备故障引 起的信号突变导致系统故障的发生,未设置的应增加设置。 (5)继续做好热工设备电源回路的可靠性检查工作,对重要的保护装置及 DCS、DEH 系统,定期做好电源切换试验工作,减少或避免由于电源系统问题引 起机组跳机等情况发生。 (6)加强对测量设备现场安装位置和测量管路敷设的检查,消除不满足规程 要求隐患, 避免管路积水和附加的测量误差, 导致机组运行异常工况的再次发生。 (7)加强对电缆防损、和敷设途径的防火、防高温情况检查,不符要求处要 及时整改, 尤其是燃机机组, 要避免因烟道漏气烧焦电缆, 导致跳机故障的发生。 (8)电缆绝缘下降、接线不规范(松动、毛刺等)、通讯电缆接头松动、信号 线拆除后未及时恢复等,引起热工系统异常情况的屡次发生,表明随着机组运行 时间的延伸,电缆原先紧固的接头和接线,可能会因气候、氧化等因素而引起松 动,电缆绝缘可能会因老化而下降。为避免此类故障的发生,各电厂应将热工重 要系统电缆的绝缘测量、电缆接线和通讯电缆接头紧固、消除接线外露现象等, 列入机组检修的热工常规检修项目中,并进行抽查验收,对所有接线用手松拉, 确认接线紧固,消除接线松动而引发保护系统误动的隐患。 (9)开展热工保护、连锁信号取样点可靠性、保护逻辑条件及定值合理性的 全面梳理评估工作,经过论证确认,进行必要的整改,(如给泵过量程信号设计 为开再循环门的,可能会引起系统异常,应进行修改)。完善机组的硬软报警、 报警分级处理及定值核对,确保其与经审核颁发的热工报警、保护定值表相符。 保警信号综合利用。 3.2 加强热控自动化系统的运行维护管理 (1)模件吹扫:有些 DCS 的模件对灰和静电比较敏感, 如果模件上的积灰较多 可能会造成该模件的部分通道不能正常工作甚至机组 MFT,如我省曾有台机组, 一个月内相继 5 次 MFT,前四次 MFT 动作因 GPS 校时软件有问题,导致历史库、 事故追忆、SOE 记录时间不一致,事故原因未能查明。在 GPS 校时软件问题得到 处理后发生第五次 MFT 时, 根据记录查明 MFT 动作原因系 DCS 主控单元一内部模 件未进行喷涂绝缘漆处理,表面积灰严重使内部模件板上元器件瞬间导通,导致 控制单元误发网络信号引起。更换该控制单元模件和更改组态软件后,系统恢复 正常运行。因此要做好电子室的孔洞封堵,保持空气的清洁度,停机检修时及时 进行模件的清扫。但要注意,有些机组的 DCS 模件吹扫、清灰后,往往发生故障 率升高现象(有电厂曾发生过内部电容爆炸事件), 其原因可能与拨插模件及吹扫 时的防静电措施、压缩空气的干燥度、吹扫后模件及插槽的清洁度等有关,因此 进行模件工作时,要确保防静电措施可靠,吹扫的压缩空气应有过滤措施(最好 采用氮气吹扫),吹扫后模件及插槽内清洁。 (2)风扇故障、不满足要求的环境温湿度和灰尘等小问题,有可能对设备安 全产生隐患,运行维护中加强重视。 (3)统计、 分析发生的每一次保护系统误动作和控制系统故障原因(包括保护 正确动作的次数统计),举一反三,消除多发性和重复性故障。 (4)对重要设备元件,严格按规程要求进行周期性测试。完善设备故障、运 行维护和损坏更换登记等台帐。 (5)完善热工控制系统故障下的应急处理措施(控制系统故障、死机、重要控 制系统冗余主控制器均发生故障)。 (6)根据系统和设备的实际运行要求,每二年修订保护定值清册一次,并把 核对、校准保护系统的定值作为一项标准项目列入机组大小修项目中。重要保护 系统条件、定值的修改或取消,宜取得制造厂同意,并报上级主管部门批准、备 案。 (7)通过与规定值、出厂测试数据值、历次测试数据值、同类设备的测试数 据值比较,从中了解设备的变化趋势,做出正确的综合分析、判断,为设备的改 造、调整、维护提供科学依据。 3.3 规范热工自动化系统试验 (1)完善保护、 联锁系统专用试验操作卡(操作卡上对既有软逻辑又有硬逻辑 的保护系统应有明确标志);检修、 改造或改动后的控制系统, 均应在机组起动前, 严格按照修改审核后的试验操作卡逐步进行试验。 (2)各项试验信号应从源头端加入,并尽量通过物理量的实际变化产生。试 验过程中如发现缺陷,应及时消除后重新试验(特殊试验项目除外)直至合格。 (3)规范保护信号的强制过程(包括强制过程可能出现的事故事前措施,信 号、图纸的核对,审批人员的确认把关,强制过程的监护及监护人应对试验的具 体操作进行核实和记录等),强调信号的强置或解除强置,必须及时准确地作好 记录和注销工作。 (4)所有试验应有试验方案(或试验操作单)、试验结束后应规范的填写试验 报告(包括试验时间、试验内容、试验步骤、验收结果及存在的问题),连同试验 方案、试验曲线等一起归档保存。 3.4 继续做好基建机组、改造机组、检修机组的全过程热工监督工作 (1)对设备选型、采购、验收、安装、调试、竣工图移交等各个环节严把质 量关,确保控制系统和设备指标满足要求。 (2)充分做好控制系统改造开工前的准备工作(包括设计、出厂验收、图纸消 化等)。 (3)严格执行图纸管理制度,加强检修、改造施工中的图纸修改流程管理, 图纸修改应及时在计算机内进行,以保证图纸随时符合实际;试验图纸应来自确 认后的最新版本。 (4)计算机软件组态、保护的定值和逻辑需进行修改或改进时,应严格执行 规定的修改程序;修改完毕应及时完成对保护定值清册和逻辑图纸的&修改, 组态 文件进行拷贝,并与保护修改资料一起及时存档。 (5)机组检修时进行控制系统性能与功能的全面测试,确保检修后的控制系 统可靠。 3.5 加强培训交流 (1)定期进行人员的安全教育和专业技术培训,不断提高人员的安全意识和 专业水平,提高人员对突发事件的准确判断和迅速处理能力。减少检修维护和人 为原因引起的热工自动化系统故障。 (2)加强电厂间交流,针对热工中存在的问题,组织专业讨论会,共同探讨 解决问题办法。 (3)完善热工保护定值及逻辑修改制度;认真组织学习;严格执行热工保护连 锁投撤制度;实行热工保护定值及逻辑修改、热工保护投撤、热工保护连锁信号 强制与解除强制监护制。案例十聊城热电有限公司#4 系统复位导致停机 聊城热电有限公司 机组 DCS 系统复位导致停机2003 年 10 月 22 日,聊城热电有限公司#4 机组 DCS 系统设备制造厂家上海 新华公司工作人员在 DCS 工程师站工作时,造成 DCS 系统复位,全部联锁、自动 和 CRT 显示失灵,锅炉灭火,运行人员打闸停机。因#0 高备变高压侧 303 开关自 投不成, #4 机组厂用电消失,两台交流润滑油泵失电未掉闸,直流油泵未能联 启,造成#4 汽轮发电机组轴承化瓦。现将事故进行通报,要求各单位认真组织 学习,举一反三,切实吸取事故教训,结合本单位情况,制定有效措施,坚决杜 绝类似事故的发生。 一、事故情况 2003 年 10 月 22 日, 事故发生前, 机有功 115MW, #4 无功 30MVar, 频率 49.99Hz。 新华公司人员在 DCS 工程师站工作,进行控制软件下载更新。8:34 分,DCS 系 统的#27、#6、#11 DPU 发生故障,DPU 切换。8:36 分,DCS 系统的#6DPU 重启成功,#26DPU 切主控成功。8:38 分,DCS 系统的#1-#7DPU 陆续重启、切换。8: 40 分,DCS 系统复位,系统各联锁、自动全部自动解除,显示数据为坏点,给粉 机的控制信号由 1 自动复位为 0,所有给粉机停运,锅炉灭火。 运行人员在 DCS 画面减负荷无效,锅炉汽温汽压快速下降。 8:44 分,汽温降到 460℃,立即打闸停机。204 开关跳闸、高厂变 040、605、 606 开关跳闸,6KV Ⅴ、Ⅵ段备自投动作,#4 机 6KV Ⅴ、Ⅵ段备用电源 650、660 开关自投成功,#0 高备变高压侧 303 开关自投不成功,机炉动力设备掉闸。 两台交流润滑油泵失电未掉闸,润滑油压低联启直流油泵通过 DCS 实现,直流油 泵未能联启,运行人员立即手动启动直流油泵。电气运行人员立即手动合上#0 高备变 303 开关,#4 机厂用电恢复正常。 8:52 分,转子转速到零,惰走 7 分钟,导致汽机轴瓦化瓦,盘车无法投入, 手动盘车不动,立即进行闷缸处理。 二、事故暴露出的问题: 1、对外来厂家人员监护管理不到位,未严格执行电子间管理制度,造成新 华公司人员在 DCS 工程师站工作时,导致 DCS 混乱异常,锅炉灭火,联锁、自动、 CRT 显示失灵。 2、保厂用电、保主机设备的安全措施、技术措施、异常事故处理措施和操 作预想不利,没有及时手动启动直流油泵,造成交流油泵失电后直流油泵又不联 动的情况下机组轴瓦化瓦。 三、防范措施: 1、各厂认真接受此次事故的教训,举一反三,立即进行一次全厂性的安全 大检查。坚决克服思想麻痹。对各系统、各专业存在的不安全问题提出整改方案 和实施计划。 月 12 日前将检查情况通过 OA 系统报鲁能发展安监部和发电技术 11 部。鲁能发展集团公司将采取不同方式进行抽查。 2、严格加强对外来工作人员现场工作的管理,要与本厂职工同样对待,严 格采用工作许可制度,未经许可不能开工。 3、严格执行电子间管理制度,杜绝无关人员进出电子间,DCS 工程师站的维 护工作由专人负责。一般情况下不允许在机组正常运行时进行 DCS 软件下载等工 作。 4、各厂要针对各厂的薄弱环节,制定保人身、保主机设备措施,要求事故 停机前首先启动直流油泵,条件允许时先倒厂用电后停机。 5、对直流油泵联锁控制进行完善,增加掉闸直联方式和低油压联动并存联 锁,接线方式增加一套硬连接。直流油泵控制开关应便于运行人员事故处理时的 操作。 6、强化运行人员培训。制订在各种异常,特别是极端情况下运行人员如何 保人身、保主机设备的事故预想和处理措施,确保在自动控制异常时运行人员临 危不乱。案例十一一 事故经过某厂#3 某厂 机 ETS 电缆故障引起机组跳闸停机事故8 月 27 日晚 23:32,某厂#3 号机组跳闸,同时锅炉 MFT(FSSS 首出原因“汽 机跳” ,DEH 首出“电气跳”。根据记录检查,#1 发变组保护 PR-3 屏(即主变非 ) 电量保护)中,K386-2G 出口继电器动作,零功率切机保护动作,PR-1 屏、PR-2 屏 K186-1G 出口继电器动作。厂用电切换正常,机组跳闸后主汽压力至 18.5MPa, 但旁路未动,主机最高转速 3130 转/分。8 月 28 日 19:02,汽机挂闸在线试验 正常后冲转。19:24,汽机冲转至 3000 转/分,参数检查正常。19:53,机组并 网,恢复正常运行。 二 原因分析 2.1 热工 ETS 的 DC 110V 电缆绝缘损坏造成间歇性短路,引起直流系统电压 (对地)波动,直流绝缘监测装置注入一超低频信号来检测接地的直流支路,而 主变非电量保护的动作接点均是由主变本体送至保护屏的,二次电缆长,电缆的 对地分布电容较大,直流检测仪所加的干扰信号通过电缆的耦合电容叠加到非电 量保护(快速压力保护)上,造成#3 主变非电量保护误动出口跳机。在 110V 直 流绝缘监测装置的电源分合试验时佐证了这一分析。而造成热工 ETS 的 DC 110V 电缆绝缘损坏的原因是由于基建安装单位火电公司在安装主机机头高温区域内 的信号电缆时使用了普通的信号电缆,没有正确使用高温电缆;电缆的布置存在 严重缺陷,如电缆穿越高温区域且众多的重要信号使用了同一根电缆。由于电缆 长期受高温烘烤,致使绝缘层损坏,信号间相互短路,使得 ETS 110V 直流电源 存在合环现象; 2.2 而旁路系统故障,当主机跳闸、主汽压力上升至 18.5MPa 时,旁路无法 正常打开(在机组再启动时发现旁路系统共有 6 只阀门无法正常打开)也是造成 此次事故的重要原因之一。经检查发现:2 只低旁喷水截止阀是由于就地电磁阀 卡涩造成无法打开;高旁压力调节阀和高低旁温度调节阀无法打开是由于旁路控 制柜内控制关指令输出固态继电器损坏造成。因此实际上在机组正常运行时,旁 路系统已存在问题隐患,一旦机组出现故障,旁路系统将无法正确动作而起不到 保护作用,严重影响机组的安全运行; 2.3 #3 机 EH 系统各汽门伺服执行机构及快关电磁阀在线运行无法隔离。只 有停机以后才能对汽门伺服阀及快关电磁阀卡涩的缺陷进行处理,这说明设计不 合理。这次在汽机冲转过程中右侧中调门伺服阀及快关电磁阀卡涩,停机消缺更 说明这一点; 2.4 直流绝缘监测装置与保护装置两厂家在设计前未做动模试验,造成保护 误动; 2.5 直流绝缘监测装置发送低频信号寻找接地点时,由于非电量保护(C30) 的开关光隔抗干扰能力差,造成非电量保护误动(在 4 主变非电量保护进行了试 验,启动功率只有 21mVA,设计技术指标的启动功率为 5VA) 。 三 防范措施 3.1# #3 主变非电量保护(C30)中开关量输入信号接点灵敏度太高,为增加可靠性,串接中间继电器。 3.2 更换所有#3 机主机机头高温区域内的信号电缆,共 6 根。电缆走向改为直接从 13.7m 层走,避开了高温区,并做好保护套管。 3.3 各汽门伺服执行机构前的 EH 油管道上加装隔离阀。案例十二一.事件经过某电厂 12 月 6 日#2 机水位保护拒动事件02 年 12 月 6 日 21:30 左右,某电厂#2 炉汽包水位 CRT 显示与电接点水位 指示偏差大,联系热工人员到现场检查,此时机组负荷 300MW,汽包水位 CRT 显 示-50mm,就地水位计(未冲洗)显示与 CRT 指示接近,电接点水位-330mm。21: 43:54 电接点水位低至-350m

我要回帖

更多关于 工业仪表与自动化装置 的文章

 

随机推荐