GoldenLife HA for Linux版可以適用於Redhat Linux,Turbo Linux等目前流行的Linux發行版本。提供了操作系統的故障檢測及恢復,有完善的網絡檢測機制,可以在網絡,網卡出現故障時完成系統切換,並免費提供Oracle,Sybase,Informix數據庫恢復工具包,可以有效完成對數據庫檢測及用戶自定義的資源保護。
1、定義:
GoldenLife提供了一個完全容錯的軟件解決方案,並提供數據、應用程序和通信資源的高度可用性。GoldenLife會自動地提供錯誤檢測和多層現場恢復。
在出現故障的情況下,GoldenLife會將保護資源自動轉換到一個根據優先而設定的系統。在實際進行切換用戶時,會經歷一個十分短暫的休眠,但是,當系統完成了切換操作后,GoldenLife會在所選擇的系統上自動地恢復操作。
可以被GoldenLife3.0保護起來的資源是:
o卷(Volume)
oIP地址
o共享文件
oLAN(局域網)管理器服務器名稱
o數據庫應用
o用戶應用程序
2、故障檢測
GoldenLife在集群節點間保持著間歇的通信信號,也叫做心跳信號,是錯誤檢測的一個機制,即通過每一個通信路徑,在兩個對等系統之間進行週期性的握手,如果連續沒有收到的心跳信號到了一定的數目,GoldenLife把這唯一的一條通信路徑標為失效時,GoldenLife 便立即開始恢復過程。然而,如果你有冗余路徑,GoldenLife能夠能過第二條路徑確定是系統故障還是只是能信路徑有問題。如果GoldenLife開啟優先級第二的通信路徑並收到了心跳信號,它就不開始failover恢復,只需要把第一條通信路徑標成紅色(失效),作為信號告訴你需要修理一下有故障的路徑。
一般情況下GoldenLife只在下列事件發生時,啟動系統恢復功能:
o所有的通信路徑故障。如果所有節點都沒能收到心跳信號,把所有通信路徑都標為失效,GoldenLife開始安全檢查。
o安全檢查失敗。當所有通信路徑故障時,GoldenLife向整個網絡發出安全檢查信號。如果信號指出配對系統還“活”著的時候,GoldenLife不啟動Failover。如果安全檢查沒從配對節點返回信號,GoldenLife就開始Failover。
因而,為了減少由於潛在的通訊錯誤所引起的不必要的系統切換,建議您使用不同介質的多條通信路徑。
3、通信路徑
GoldenLife支持在節點之間和心跳通訊中,使用如下的通訊路徑:
1.socket,即套接字 你使用任何的網絡硬件接口,只要它能夠支持TCP/IP的通訊協議。這樣的硬件包括:以太網、快速以網、令牌環網以及FDDI或CDDI。
2.串行口 在GoldenLife配置中,你應當配置有一個串行口通信 路徑。串口通信路徑需要利用RS232的擬調解線路來與GoldenLife系統相連接。
3.共享磁盤 你可以定義一個共享磁盤分區來作為GoldenLife的通訊中介。可以只使用小至IMB的分區,當然,也可以使用更大的空間。
例如,如果兩個服務器被一個串口連接起來,並且,從屬服務器來的心跳信號無法被主服務器所檢測到,則下面之一是可能引起這一現象的原因:
o服務器的RS-232卡或者端口失敗
o電纜失效
o主服務器暫時挂起
o主服務器失敗
失效切換只可能在最後一種情況下才發生。因此,節點間的多種通信路徑可以幫助避免不必要的失效切換。
北京三木聯合信息技術有限公司
聯繫人:王勝春
手 機:15858715716
商務QQ:910673596
M S N:wang.158@hotmail.com
E-mail:wonsc@126.com