五.关于容错涉及概念解释
1. 堆叠: 把两块VSX主板通过PC104接口叠加到一起。
2. BoR: BoR(bridge of redundancy),这是我公司专为容错性设计的一组总线,总线的两端分别连接到两块主板(A,B)的容错接口(Redundancy)线序如下图
A SYS |
B SYS |
1 (GND) |
1 (GND) |
2 (SYSTEM-A Fail out) |
3 (Ext-SYSTEM Fail in) |
3 (Ext-SYSTEM Fail in) |
2 (SYSTEM-A Fail out) |
4 (GPCS0) |
5 SYS-GPCS-in |
5 SYS-GPCS-in |
4 (GPCS0) |
6 (TxD9) |
7 (RxD9) |
7 (RxD9) |
6 (TxD9) |
3. COM9 :在我公司板卡上还有个com9 在BIOS 中: Chipset→Southbridge Configuration →Redundancy Control Configuration 下 设置端口地址与中断号,COM9可以作为中两个系统信息的比对,保持主从板卡信息同步,当然您还可以把com9作为一个高速串口用用于两个板卡间任意信息的传送。
如图所示:
4. 可控与非可控
所谓可控I/O 是指同一个I/O被两个设备共同使用,主机为工作机有控制I/O权,从只是追随主在跑并不参与控制 。
常用可控I/O有:串口,并口,GPIO,键盘鼠标。
非可控I/O有:USB ,网口,LCD…………….
六.容错理论的测试
1. 对寄存器地址6DH的测试,通过寄存器地址6DH数据的读取判断系统为Master or Slave ,你可以用软件读取6DH的值(00000010为主Master, 00000001 为从Slave)来判断主从主板。
如图所示:
2. 在debug 模式下通过对SRAM地址值的读写来判断主从盘,在Master的系统上可以访问Slave系统的SRAM空间,访问(读/写)的方式可以在BIOS中设定,而SLAVE系统不可以访问Master系统的SRAM。因为Master有主控权而Slave没有。
七.应用典型案例分析
上图为某一航空司地面控制台,当主机开启power按下,两片VSX-6154主板同时启动,按照时间先后随机决定一个为Master,另一个为Slave。Master拥有主控权并抑制Slave的各项功能,所以显示器显示Master内容,Slave只是跟着Master跑。Mastert收到信息把信息传递到显示器上,同时通过BoR总线完成与slave的信息比对,达到信息的同步。如果Master因为意外而重启,这时Master在死机的一瞬间把控制权推向Slave,Slave接过Master的信号就变成了Master,将继续运行。原Master通过重启或者修复后就失去了控制权力变成跟着新的Slave,等到有时机再次接手Master的工作。
控制室在监测飞机状况后指挥人员指导飞机有次序的飞行,起飞和降落,这时突然Master由于意外重新启动,Slave立即接手主的工作,采集雷达信息并在显示器上显示,Master在重启完成后,变成Slave,原来的Master变成了Slave,通过COM9读取主的信息,与主信息达到同步,时刻准备着接手主的工作,而发生的这一切在控制台前指挥的人员并不知道。如果只有一块主板,那么所发生的一切就可想而知了。
八.综上所述, Vortex86SX容错功能实现非常简单,且功能强大。它主要有以下几大特点:
Master/Slave主板谐调工作
可诊断六种不可预知的系统死机故障
Master/Slave主板可在1 us(10的负6次方秒)内转换
可抑制Slave主板下的ISA总线
可编程抑制Slave主板的I/O端口(在BIOS中设置)
设计高速串口作Master/Slave主板间的数据传输
Master/Slave主板各提供4KB SRAM作数据交换与备份
支持系统死机计数