技术频道

工业网络故障及应对方案

  在当今网络的分级管理几乎遍布所有较大型的工业控制网络,一般都划分为level1基础自动化级、level2过程自动化级、level3生产控制级。在济南钢铁集团,这样的工业网络系统也是遍布整个工艺流程。虽然工业网络控制功能强大,但也需要有好的维护以及正确实用的应用程序来适应。下面就是在济钢集团某分厂发生的一例网络故障的情况。

  1基本情况

  2002年12月济钢集团自动化部与某分厂联合进行了该分厂整个生产线的自动化控制改造,其中,改造过程很重要的一部分就是在原有的level1基础自动化级上,扩展level2过程自动化级,由于是改造工程、同时也为了节约投资。level2过程自动化级并没有遍及整个基础自动化级。作为初期目标,在level2过程自动化级上,设置了一台服务器,另有10台左右的工作站,构成了该分厂核心的生产管理控制中心,几乎全部的生产线启停操作、目标设置、数据管理都由该中心完成。整个网络拓扑结构、实际排列顺序及类型,

  其中level1基础自动化部分:PLC1~4为操作控制基础自动化控制器,机型为E984-685,属于此次改造仅存的未变动部分,其余全部是新增部分;PLC5~6为基础自动化一级模型运算处理控制器,机型为Quantum140-CPU-434-12。所有PLC1~6之间的数据通讯都通过1Mbit/s的MODBUSPLUSE网络完成。由于该网络线路较长中间增设了2台中继器,并按布线要求,在网络两端各配备有120Ω的终端电阻。在level2过程自动化部分设有服务器SERVERC1~C10共10台工作站,另外PLC5~6也起到类似网关作用,同时也连接在level2过程自动化部分,通过交换机连接在一起。网络类型为100Mbit/s的以太网。这里举例说明数据流向:当C1对PLC1的数据进行写操作时,首先,向服务器SERVER申请,服务器SERVER接到申请后,将所写内容,通过以太网写入PLC6中相对应的寄存器。至此2级操作即告完成。然后PLC6中所写内容寄存器会按照PLC6中的逻辑程序进行MSTR传送,通过1级的MODBUSPLUSE网络写入PLC1中所对应的寄存器。从而达到C1控制PLC1的目的。读操作也是类似此法处理的。

  2故障现象及原因分析

  12月16日,该分厂改造结束,刚投入生产不久,突然发现C1~C10上显示的数据全部不随现场设备状态更新了,紧接着检查服务器SERVER,发现SERVER数据也不刷新。当时,检查人员认为SERVER服务不响应了,于是重新启动服务器SERVER,一次重启后,全部系统恢复正常。其后的1~2天里,此现象时断时续又发生了多次,有时服务器SERVER,还需重启两次,才恢复正常。也就是说故障时间一般不超过30分钟。还有一个特点,故障从不发生在深夜,另外该现象也给故障排查带来了一定困难:通讯中断的数据处理是保持最终状态的,很可能虽然故障发生,但由于现场设备状态未发生改变而不易被操作者发现,从而忽略过去。这种现象的发生极大的影响了生产的正常运行,导致了多次生产线停机。

  12月18日此故障再次出现,工作站数据标签与服务器数据标签内容吻合,证明2级网络通讯正常。服务器数据标签与PLC6的寄存器数据标签内容吻合。证明服务器数据交换正常。当检查PLC6与PLC2通讯时,发现PLC1、PLC2的MODBUSPLUSE的通讯指示灯闪烁均不正常,而PLC6的闪烁正常。按理说PLC6、PLC2、PLC1之间为柜间线,也无人接触不该导致通讯中断。经简单目视检查后,没有发现问题。由于PLC1、PLC2同处于网路后半段,遂认为有因素在影响整个网路后半段。立即前往距离约50米外的网路后半段终端点-电气值班室。经检查MODBUSPLUSE网络终端电阻接线接触不良,引起短路,导致网络阻抗不匹配,信号反射率上升,引起波形失真,从而影响到网路后半段最近的3个节点不能正常工作。重新接线后,系统立即恢复正常。事后询问得知,电气值班室这几日一直在装修,白天屡屡搬动设备可能就是因为设备移动导致终端电阻时好时坏,这也解释了为何故障从不发生在深夜的疑问。

  3改进措施

  现在网络化工业控制在工业生产中处于至关重要的地位,其通讯安全理应得到足够的重视。一些次重要或可有可无的网络节点应尽量减少或做分段处理。布线点一定要确保网路安全可靠。这一点尤其在总线式网络上特别突出。从而在根源上减少甚至杜绝故障。除了在硬件设置上进行了重新安置,还在网络故障软件诊断上,下了很大功夫。经过反复论证,实现了网路故障的即时诊断。即使出问题的不单单是网路线路,还包括电源中断、CPU损坏、通讯辅助设备损坏等,也能够在极短的时间内判断故障点及故障范围。具体做法如下:在PLC1~6以及服务器分别设置一个动态变化的位寄存器和位数据标签,它们不断地以1秒一次的频率变化,由0→1再由1→0。这样在C1~C10上可以清楚的看到PLC1~6以及服务器中,谁与工作站通讯中断了。同时配合PLC以及服务器的状态字传输,可以方便的得到通讯故障原因,如果应用数据库技术还可以进行网络故障的历史记录和查询。

 

 

 

 

文章版权归西部工控xbgk所有,未经许可不得转载。