所屬欄目:機電一體化論文 發(fā)布日期:2015-01-19 15:59 熱度:
[摘 要]介紹了數(shù)據(jù)備份策略與容災技術(shù),闡述容災系統(tǒng)的指標以及容災等級。并通過基于異步復制機制實施了本地信息化系統(tǒng)的遠程容災中心,實現(xiàn)了信息系統(tǒng)的高可用性。測試結(jié)果驗證該方案具有可靠地的備份性能和數(shù)據(jù)有效性。
[關(guān)鍵詞]期刊投稿范文,備份,異地備份,容災能力
引言
隨著運營商企業(yè)信息化進程的不斷深化,管理信息系統(tǒng)已經(jīng)成為支撐企業(yè)業(yè)務運行的重要平臺,同時業(yè)務的發(fā)展也對管理信息系統(tǒng)的業(yè)務支撐能力和可靠運行的要求越來越高。陜西移動基礎(chǔ)設(shè)施的集中建設(shè)在實現(xiàn)業(yè)務快速響應和控制運營成本的同時,也帶來故障點集中的風險問題,如自然災害、電網(wǎng)停電等不可控風險。因此,適時、合理的規(guī)劃和開展異地容災建設(shè),成為確保信息化系統(tǒng)高可用的重要手段。
1.備份及容災
1.1 備份
常用的備份策略有3種:全量備份、增量備份和差量備份[1]。差分備份在備份的代價和效率對于前兩種備份策略進行折衷,在上一次全量備份的基礎(chǔ)上,對所指定的數(shù)據(jù)集在上次全量備份后發(fā)生了改變的數(shù)據(jù)進行備份,備份的數(shù)據(jù)量通常大于增量備份量,但小于數(shù)據(jù)總量。
1.2 容災
容災主要是指在計算機系統(tǒng)因軟件或硬件故障時,仍然能夠保證系統(tǒng)工作的能力。容災涉及到的內(nèi)容比較廣泛,對容災的分類也可從不同層面上進行。通常情況下,可從容災抵御災難的程度和容災功能的有效范圍兩個角度對容災進行分類[2]。容災系統(tǒng)根據(jù)具體的抵御災難的能力,可分為數(shù)據(jù)容災和應用容災兩類。
第一、數(shù)據(jù)容災。它主要側(cè)重于對數(shù)據(jù)的保護,通常需要在異地建立數(shù)據(jù)系統(tǒng)實現(xiàn),該系統(tǒng)一般是本地生產(chǎn)系統(tǒng)關(guān)鍵數(shù)據(jù)的實時復制,即指將本地系統(tǒng)的關(guān)鍵數(shù)據(jù)進行備份保存,不涉及具體應用業(yè)務。
第二、應用服務容災。它是更高級別的容災,建立能夠完全實現(xiàn)本地應用功能的遠程應用系統(tǒng)。災難發(fā)生前,該遠程系統(tǒng)與本地進行數(shù)據(jù)同步,一旦發(fā)生災難,遠程系統(tǒng)會接管本地系統(tǒng)業(yè)務,繼續(xù)提供服務,保證業(yè)務的連續(xù)性。
從本質(zhì)上來講,二者是密不可分的。數(shù)據(jù)容災是應用容災的基礎(chǔ),沒有數(shù)據(jù)的一致性,就不可能有應用的連續(xù)性。應用容災又是數(shù)據(jù)容災的延伸,不但保證災難發(fā)生時數(shù)據(jù)不丟失,還保證了業(yè)務的連續(xù)性。
2.容災能力指標
2.1 RPO與RTO
容災系統(tǒng)優(yōu)劣的判斷通常用災難后的數(shù)據(jù)丟失量和災難后系統(tǒng)的恢復時間來衡量。公認的有兩個技術(shù)指標:RPO和RTO[4]。
RPO是指當災難發(fā)生的時刻到本地業(yè)務系統(tǒng)與容災備份中心最近一次同步數(shù)據(jù)時刻的時間間隔,是以時間為單位以數(shù)據(jù)為出發(fā)點,說明了容災系統(tǒng)所能容忍的數(shù)據(jù)丟失量。RTO是指災難發(fā)生時刻與業(yè)務或容災系統(tǒng)徹底恢復業(yè)務正常運行的時刻之間的時間間隔,用來衡量業(yè)務服務的影響程度。
RPO針對的是數(shù)據(jù)丟失,RTO針對的是服務丟失,RPO與RTO越小,系統(tǒng)的可用性就越高, 但二者沒有必然的關(guān)聯(lián)。RPO和RTO的合理制定,需要以風險分析和業(yè)務影響分析為前提,同時結(jié)合實際業(yè)務需求來完成。
2.2 容災能力級別
根據(jù)數(shù)據(jù)中心對災難恢復RPO與RTO要求的不同,按照國際標準, 數(shù)據(jù)中心的災難恢復水平可以劃分為如下所示的七個等級[5](表1)。
顯然, 各等級標準在技術(shù)方案、災備響應時間、投資管理的復雜性等方面有較大差別。在實際工程中需要根據(jù)備份恢復數(shù)據(jù)量、生產(chǎn)和災備中心的距離、災難時的恢復時效等進行方案規(guī)劃。
3.同城與異地災備
3.1 同城與異地災備方式
從容災功能的有效范圍來分可以分為同城災備和異地災備。同城災備方案是在同城或相近區(qū)域內(nèi)建立兩個數(shù)據(jù)中心,一個為生產(chǎn)中心,負責日常生產(chǎn)運行; 另一個為災難備份中心,負責在災難發(fā)生后的計算機系統(tǒng)運行。該方案生產(chǎn)與災備中心的距離較近,容易實現(xiàn)數(shù)據(jù)的同步鏡像,保證高效的數(shù)據(jù)完整性。同城災難備份方案一般用于供電故障、計算機系統(tǒng)以及人為操作等引起的災難。
異地災備一般是在兩個較遠的(100公里以上)的城市分別建立生產(chǎn)中心和災備中心,實現(xiàn)遠距離的災難備份。異地災備能夠防范地震、水災等不可抗風險。
同城災備和異地災備各有所長。為達到最理想的防災效果,在保證計算機系統(tǒng)性能的前提下,可考慮采用同城和異地各建立一個災備中心的解決方案。
3.2 數(shù)據(jù)復制技術(shù)
在災難備份系統(tǒng)的建立中,數(shù)據(jù)復制是其技術(shù)的核心。數(shù)據(jù)復制技術(shù)主要是將生產(chǎn)中心的生產(chǎn)數(shù)據(jù)復制成災難備份數(shù)據(jù),災難備份數(shù)據(jù)與生產(chǎn)數(shù)據(jù)應保持一致。目前,數(shù)據(jù)復制的主要方式有同步數(shù)據(jù)復制和異步數(shù)據(jù)復制兩種[3][6]:
3.2.1 同步數(shù)據(jù)復制
同步數(shù)據(jù)復制方式是在主機向本地磁盤寫數(shù)據(jù)的同時,將數(shù)據(jù)傳到備份中心的磁盤,在確認遠程備份系統(tǒng)的數(shù)據(jù)同步更新后,完成寫數(shù)據(jù)的操作。同步數(shù)據(jù)方式的數(shù)據(jù)實時性強,災難發(fā)生時備份數(shù)據(jù)能夠與生產(chǎn)數(shù)據(jù)保持一致,幾乎沒有數(shù)據(jù)丟失。其缺點是由于數(shù)據(jù)更新操作時間長,影響應用的性能[7]。同時,由于數(shù)據(jù)在兩個站點之間傳輸,使得I/O時間受到兩個站點之間距離的影響,距離很難突破60公里。由于傳輸技術(shù)的限制,該方式對生產(chǎn)中心和備份中心之間的距離和通信質(zhì)量有嚴格要求,一般適用于近距離的同城備份。
3.2.2 異步數(shù)據(jù)復制
異步數(shù)據(jù)復制方式的主要原理是在主機系統(tǒng)向本地寫磁盤數(shù)據(jù)后,將本地生產(chǎn)數(shù)據(jù)以后臺的方式復制到異地。異步數(shù)據(jù)方式對數(shù)據(jù)的更新操作不必等本地卷和備份卷的數(shù)據(jù)都更新完畢后才算是更新完成,因此減少了更新操作的時間,同時對主機性能的影響較小。但是,由于不同步,會出現(xiàn)數(shù)據(jù)的丟失。企業(yè)選擇復制模式應該結(jié)合自身的容災目標和實際情況來考慮。 4.異地容災系統(tǒng)方案實現(xiàn)
4.1 方案概述
為了保證數(shù)據(jù)復制架構(gòu)的通用性和標準化,在綜合兼顧成本和效率的基礎(chǔ)上,陜西移動管理信息系統(tǒng)實施建立了異地災備中心,規(guī)劃并建成了陜西公司與集團公司統(tǒng)一的數(shù)據(jù)復制平臺,同時進行了災備系統(tǒng)卷管理的標準化工作。
4.2 邏輯卷改造
災備中心項目的建設(shè)采用了基于主機卷復制的解決方案。VxVM首先對AIX操作系統(tǒng)進行改造,在物理磁盤的基礎(chǔ)上產(chǎn)生一個由可變塊大小組成的條帶化的抽象層VM,把多個物理磁盤組成一個卷組(DG),再從DG中劃分邏輯卷。邏輯卷提供與傳統(tǒng)物理磁盤提供的類似功能,在卷之上創(chuàng)建文件系統(tǒng),改造后的結(jié)構(gòu)圖如圖1所示。由于VxVM是通過底層卷組操作,具有比操作系統(tǒng)以及文件系統(tǒng)層面更高的讀寫性能,同時由于邏輯卷可以在不停機的情況下進行動態(tài)調(diào)整,提高系統(tǒng)的可用性。
4.3 基于異步復制的容災實現(xiàn)
容災備份的機制是同時打開省公司的生產(chǎn)卷和災備中心對應的備份卷,當陜西本地應用系統(tǒng)有I/O操作或是數(shù)據(jù)塊變化時,將此I/O或數(shù)據(jù)塊的變化以實時異步的方式在災備中心對應的備份卷上發(fā)起請求,從而實現(xiàn)在不影響本地系統(tǒng)性能的基礎(chǔ)上兩邊數(shù)據(jù)的異步復制。
在災難恢復方面,接管平臺實現(xiàn)廣域網(wǎng)的集群管理,實現(xiàn)控制臺管理集群系統(tǒng),并實時監(jiān)測每個網(wǎng)元的運行狀況。當本地發(fā)生無法恢復的嚴重故障或災難而導致的業(yè)務中斷,接管平臺監(jiān)測到本地應用退服,可根據(jù)策略自動或手工快速地從遠端接管平臺進行業(yè)務的接管,恢復正常應用。異地容災結(jié)構(gòu)圖如圖2所示。
4.2 應用效果
根據(jù)管理信息系統(tǒng)核心應用OA以及ERP的數(shù)據(jù)級容災備份以及應用系統(tǒng)接管的要求,對高可用性指標進行持續(xù)的監(jiān)控與運維,改進包括規(guī)劃執(zhí)行等環(huán)節(jié)的管理體系。從建成后的應用驗證結(jié)果,災備系統(tǒng)實現(xiàn)了管理信息系統(tǒng)四到五級的系統(tǒng)容災能力,提高管理信息系統(tǒng)整體安全性,滿足內(nèi)控和外部監(jiān)管的需要,保證業(yè)務的連續(xù)運行能力。
5.結(jié)束語
隨著業(yè)務的發(fā)展和技術(shù)的變革,信息系統(tǒng)的邏輯架構(gòu)和功能、數(shù)據(jù)和配置信息處于不斷地變化中,必須建立持續(xù)的監(jiān)控、改進流程和規(guī)范的管理方法,才能保持并持續(xù)改進系統(tǒng)的高可用水平。
信息系統(tǒng)的容災系統(tǒng)建設(shè)是一個長期、全面、持續(xù)完善的工作,企業(yè)應結(jié)合組織的整體規(guī)劃目標,依靠可靠的技術(shù)手段和完善的管理體系。通過制定、實施和不斷改進信息系統(tǒng)高可用性建設(shè)計劃,提升信息系統(tǒng)服務質(zhì)量,確保業(yè)務的持續(xù)運行。
文章標題:期刊投稿范文基于異步復制的容災系統(tǒng)研究
轉(zhuǎn)載請注明來自:http://www.optiwork.cn/fblw/ligong/jidianyitihua/24949.html
攝影藝術(shù)領(lǐng)域AHCI期刊推薦《Phot...關(guān)注:105
Nature旗下多學科子刊Nature Com...關(guān)注:152
中小學教師值得了解,這些教育學...關(guān)注:47
2025年寫管理學論文可以用的19個...關(guān)注:192
測繪領(lǐng)域科技核心期刊選擇 輕松拿...關(guān)注:64
及時開論文檢索證明很重要關(guān)注:52
中國水產(chǎn)科學期刊是核心期刊嗎關(guān)注:54
國際出書需要了解的問題解答關(guān)注:58
合著出書能否評職稱?關(guān)注:48
電信學有哪些可投稿的SCI期刊,值...關(guān)注:66
通信工程行業(yè)論文選題關(guān)注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關(guān)注:120
評職稱發(fā)論文好還是出書好關(guān)注:68
復印報刊資料重要轉(zhuǎn)載來源期刊(...關(guān)注:51
英文期刊審稿常見的論文狀態(tài)及其...關(guān)注:69
Web of Science 核心合集期刊評估...關(guān)注:58
理工論文范文
建筑設(shè)計論文 城市規(guī)劃論文 礦業(yè)論文 機電一體化論文 包裝論文 交通運輸論文 化工論文 電力論文 水力論文 自動化論文 車輛論文 冶金論文 工業(yè)設(shè)計論文 機械論文
期刊百科問答
copyright © www.optiwork.cn, All Rights Reserved
搜論文知識網(wǎng) 冀ICP備15021333號-3