客服熱線:400-868-5678

??

您所在的位置:首頁 > 新聞中心 > 媒體報道

技術創新優秀案例之一 北京農商銀行:三地多活數據中心, 打造中小銀行災備體系建設新模式

2019年03月19日      來源:金科創新社      點擊次數:

近年來,隨著國家和行業監管部門對金融機構信息系統風險管理的要求不斷提高,以及商業銀行自身基于防范災難和風險、保障業務連續性需求考慮,國內銀行業相續啟動災備體系建設,建立同城和異地災備中心,“兩地三中心”成為國內銀行業主流災備模式。

“兩地三中心”是指同城雙中心加異地災備中心的業務連續性容災模式,目前國內商業銀行普遍采用“大同城、小異地”的“兩地三中心”架構。“大同城”是在商業銀行所在地建設兩個數據中心,通過部署必要的軟硬件設備,使所有系統在兩個中心都擁有相同處理能力的運行環境,通過數據同步技術,實現生產數據在兩個中心之間的實時同步。“小異地”是在商業銀行所在地之外一個城市(一般相距幾百公里以上)建設異地數據中心,當發生地域性災難時,以保障銀行關鍵業務在重要渠道可以繼續服務、對全行生產數據進行以保護為目的而建立的異地災備數據中心。

災備體系建設與管理是復雜的持續性系統工程,投資巨大,且建設周期長、實施難度大。不僅對技術實力要求高,而且考驗管理水平,涉及科技戰略、IT治理、運維管理等諸多內容。因此,兩地三中心建設和運維中通常存在如下問題:一是一些中小銀行的災備建設還處在數據和應用系統備份和恢復階段,尚未做到有效保障業務持續運行,沒有最大限度發揮災備系統作用;二是一些區域性銀行異地容災備份能力不足,面臨“有備份、無切換”的局面;三是災備中心用于備份的服務器往往處于空閑狀態,IT資源沒有得到充分有效的利用。

針對上述問題,近年來多活數據中心的概念被引入,成為兩地三中心的升級版,災備體系隨之進入新的發展階段。日前,記者走訪了北京農商銀行“三地多活數據中心”案例,該項目在農信銀資金清算中心主辦的“2018年度農村金融科技創新優秀案例評選”活動中獲得“2018年度農村金融科技創新技術創新優秀案例”。

“隨著集中式架構向分布式架構轉換以及云計算的實施,未來海量系統的運維模式之下,對于災備和業務連續性的要求會越來越高,多活數據中心一定是未來發展的方向。”該項目負責人北京農商銀行運行維護中心田野指出。“三地多活數據中心”項目從方案設計到技術實施均為北京農商銀行自主獨立完成,對于當前處于探索期的多活技術,北京農商銀行在方法論和實施經驗方面進行了有益嘗試,對于農村中小金融機構災備體系以及信息科技建設具有借鑒和參考意義。

保障業務連續性

北京農商銀行按照 “先同城、后異地;大同城、小異地”的總方針,于2015年和2016年先后啟動了重要信息系統的同城、異地災備建設項目,并于2018年7月完成“三地多活數據中心”項目。目前,北京農商銀行6個重要業務實現同城兩中心雙活,柜面應用系統實現兩地三中心多活.

“三中心多活的數據中心運行模式,一方面進一步增強了我行信息系統業務運行的連續性、可靠性。在災備中心冷備的模式下,如果生產數據中心癱瘓,需要兩個小時、甚至更長時間才能啟動災備中心,在啟動災備中心的時間里,用戶交易會嚴重受損。‘三中心多活’強化了應用層面的容錯和故障處置手段之后,在主數據庫故障時,應用可快速把主數據庫切換到其他機房的從數據庫。另一方面災備中心建設的投資巨大同時每年運維成本極高,如果資源處于閑置狀態是相當浪費的。三中心多活的運行模式把閑置的資源整合,充分利用資源,避免造成浪費。”田野說。

“其項目價值主要體現在三個方面:一是確保業務連續性。業務連續性是指園區級、城市級或地區級發生災難后,IT系統能夠盡快恢復并繼續提供服務能力。主要解決和應對火災、長時間停電停水、地震、戰爭等災難事件對IT系統的破壞。衡量連續性水平的主要指標是恢復時間目標(RTO)和恢復點目標(RPO)。通常使用磁盤和數據庫同步或異步數據復制,磁帶等數據全量和增量備份恢復、應用和網絡多點接入、應用系統多寫等技術手段,達到不同級別的RPO和RTO連續性指標要求。

二是確保系統的高可用性。系統的高可用性是指非災難的局部故障情況下,能繼續訪問應用的能力,需要從基礎設施、存儲、服務器、操作系統、數據庫、中間件、應用系統、運維流程和應急方案等多個層次進行設計。如在基礎設施層面對電力、空調、消防、抗震等進行冗余設計;在存儲層面采用兩套或多套存儲陣列構建冗余架構,任意存儲出現故障時,其余存儲陣列能夠提供完整的數據服務;在運維流程和應急層面建立與高可用技術架構配套的運維體系、制度和應急方案,定期演練,從而使高可用架構發揮實際效用。

三是負載均衡性能壓力。IT系統容量性能配置決定了IT建設運維成本,合理規劃生產、同城、異地站點之間的容量配比,是平衡IT投入與產出的重要依據。為此,北京農商銀行基于以上連續性和可用性規劃設計思路,對多個數據中心的IT系統進行了統一的容量規劃,合理數據配備不同的基礎設施、軟硬件、運維管理資源,最大限度地提高兩地三數據中心之間資源的整體使用率,以節約和控制IT成本。同時在兩地三中心被激活多活后,通過集群技術起到負載均衡系統性能壓力的作用。”

技術實現的三大特點

建設一個穩定、高效、安全、靈活的多活數據中心,需要對包括業務連續性、高可用性、性能壓力、建設和運維成本以及傳統數據復制技術和應用多活設計優劣勢等因素的多方面考量和分析。

在技術實現上,“三地多活數據中心”主要具備如下三個特點:

1.全局負載均衡設計 全局負載均衡根據站點的健康狀況和用戶的就近將訪問請求智能地解析到不同的數據中心和線路,用戶根據解析的IP地址訪問業務,將業務均衡地分攤給多個數據中心,同時還根據實際業務承載能力按比例劃分各中心分配權重。如在位于同城的北京亦莊數據中心、空港數據中心的互聯網出口處分別部署全局負載均衡。通過互聯網線路對亦莊數據中心、空港數據中心的業務地址進行檢測,根據一定的負載均衡策略,將互聯網用戶的訪問請求解析到健康狀態良好的站點。同時,各站點之間實時探測對方健康狀態,如發生某一側站點喪失服務能力時存活的站點需要把業務自動全部接管過來。

2.操作單元封裝 操作單元封裝是指針對需要在三地數據中心進行的業務操作,封裝成獨立的業務操作單元,這些業務操作單元在三地數據中心之間是一致的。如果要把用戶操作封閉在一個單元內完成,最關鍵的是數據。為實現操作單元封裝,必須確定數據的維度。銀行除了用戶本身的信息外,還有相關業務產品的數據、賬戶信息等數據。操作單元化時,走向異地的就是業務的核心鏈路,所以選擇個人儲蓄這個維度。但是這樣會帶來一個問題,當操作其他單元數據時,就無法封閉了,因為這時一定會出現需要集中到一個點去寫的現象,所以操作單元封裝必須要在路由一致以及業務數據維度都已完全具備的條件下開展。

3.數據一致性 數據一致性依靠數據庫、存儲和網絡技術等要素來支撐,其中基于盤陣技術的UR復制和基于數據庫技術的MAA復制,解決了數據中心之間進行遠程數據同步的問題。鑒于北京農商銀行目前營業網點及客戶主要分布在北京市城郊,在三地多活的存儲應用中,目前使用建立“一主兩從”的存儲機制,即三地共同使用同一數據庫,確保同步復制的正確性和唯一性。當一地數據庫故障或發生災難性事件時可切換其他可用數據庫保障業務持續運行。

推廣應用經驗

在互聯網時代云計算發展的大趨勢下,北京農商銀行對全行應用系統進行全面梳理和服務水平分級管理,在應用系統兩地三中心多活系統的推廣中,以柜面系統為切入點,目前已實現了“三中心多活”大集群架構。“亦莊數據中心、空港數據中心和上海異地災備中心的柜面服務器之間通過軟負載均衡的方式形成集群,各中心之間實現操作單元封裝,各應用服務器之間互相進行服務偵聽探測。網點柜員通過柜面終端隨機訪問集群中任一臺柜面應用服務器進行連接,發起存取款、轉賬、繳費等交易后,與核心系統、網銀系統、第二代支付系統和中間業務等其他信息系統進行通訊。各柜面服務器實現了完全集群化的遠程授權任務互相分發、前后臺任務互相分發。同時針對集群化后服務器增多的情況,為提升運維管理操作和服務保障水平,提高工作效率,采用三中心一體化運維管理,實現常見運維操作如獲取各服務器系統信息、應用巡檢、停啟服務、版本投產、版本回退、程序備份等的菜單化和腳本化。”田野補充道。

在田野看來,未來銀行數據中心需要簡單可靠的多活解決方案。北京農商銀行“三地多活數據中心”后續將分業務逐步實施,為各項業務開展提供穩定、靈活、高效的技術支撐,助力全行經營轉型發展。(李慶莉 馮薇)

上一篇:

下一篇: 

中彩网双色球 中科匯聯承辦,easysite內容管理系統,portal門戶,輿情監測,搜索引擎,政府門戶,信息公開,電子政務