冗馀技术是增加额外的设备,以使系统更可靠、安全地运行。 冗馀分类方法多种多样,根据在系统中的位置,冗馀可以分为部件级、部件级和系统级; 根据冗馀性的程度,可以分为1:1冗馀性、1:2冗馀性、1:n冗馀性等各种各样的种类。 在当前部件可靠性不断提高的情况下,与其他形式的冗馀方式相比,1:1部件级热冗馀是一种有效、相对简单、配置灵活的冗馀技术实现方式,如I/O卡部件冗馀、电源冗馀、主控制器冗馀等因此,目前国内外主流过程控制系统多采用这种方式。 当然,一些本地设计也提供了组件级或多种冗馀方式相结合的成功示例。 由两个部件组成的并联系统(相互冗馀)与一个部件相比,平均无故障时间增加1.5倍。

但是,两个部件并不是简单地并行工作,而是需要硬件、软件、通信等协同工作。 将相互冗馀的两个部件构成为一个有机整体,通常包括以下多个技术要点。

1 )信息同步技术

这是实现工作备用部件间无扰动(Bumpless )开关技术的前提,只有根据控制的实时性要求进行高速高效的信息同步,保证工作备用部件间的步调一致地工作,才能实现冗馀部件间的无扰动开关

在热备用工作模式下,其中一个处于工作状态(工作卡),实现系统的数据采集、运算、控制输出、网络通信等功能; 另一块处于待机状态(备用卡),实时跟踪工件卡的内部控制状态(即状态同步)。 工作/备用卡之间的正/负逻辑是互斥的,一个是工作卡,另一个一定是备用卡,它们之间有冗馀的控制电路(也称为工作/备用控制电路)和信息通信电路,两块卡协调同时且有序也就是说,用户要使用,被认为只有一个部件。 通常,动作、备用部件之间通过高速且冗馀的通信信道(串行或并行),实现运转状态的相互检查和控制状态的同步(例如,配置信息、输出阀位、控制参数等)。

2 )故障检测技术

为了在系统故障时及时将冗馀部分投入工作,必须具备高精度的在线故障检测技术,实现故障发现、故障定位、故障隔离和故障报警。 故障检测包括电源、微处理器、数据通信链路、数据总线、I/O状态等。 其中故障诊断包括故障自诊断和故障互检(工作、备用插件部件之间的互检)

3 )故障仲裁技术和切换技术

准确发现故障后,还需及时确定故障部位,分析故障严重程度,依赖上述冗馀控制电路对动作、备用故障状态进行分析、比较和仲裁,判断是否需要动作/备用之间的状态切换。 把控制权换成冗馀的备用部件,还必须保证高速、安全、无干扰。 处于工作状态的部件发生故障(停电、复位、软件故障、硬件故障等)或工作部件故障严重于备用部件时,备用部件应及时无干扰地交接工作部件的所有控制任务,不影响现场控制此外,切换时间需要为毫秒级,进而为微秒级,使得外部控制对象的失控和检测信息的失效等不由于该部件的故障而发生。 此外,还需要尽快通过网络通信和当场的LED显示进行警报,向用户告知故障的部件和故障状况,进行及时维护。

4 )热插拔技术

为了保证容错系统的高可靠性,必须尽量缩短系统的平均修复时间MTBR。 为此,必须设计为提高单元的独立性、修复性、故障维护性。 实现故障部件的在线维护和更换也是冗馀技术的重要组成部分,是实现控制系统故障部件快速修复技术的关键。 部件热插拔功能可在不中断系统正常控制功能的情况下添加或更换组件,使系统顺利运行。

5 )故障隔离技术

在冗馀设计的情况下,工作、备用部件之间的故障应尽量考虑相互不影响或影响的概率相当低(0.01% ),故障被认为是隔离的。 这样,处于备用状态的部件发生故障时,不会影响冗馀的工作部件和其他相关部件的正常运行,可以保证冗馀性的有效性。

1 )作为主控制卡/设备的CPU冗馀

2 )电源系统冗馀

3 )网络系统冗馀。

采用冗馀网卡和冗馀网络接口。 正常工作时,冗馀的两条数据高速路径同时并行工作,自动分配网络流量,考虑负载均衡的冗馀设计,提高系统网络的通信带宽。 如果一条路径出现故障(网卡损坏或出现线路故障),另一条路径将自动承担所有通信负载,保证通信正常进行。

4 )冷却系统冗馀。

利用控制柜内可自动切换的冗馀风扇,实时监测风扇和机柜内的温度,工作风扇故障或库内温度过高时自动报警,自动启动备用风扇。

5 )信息冗馀。