從傳統(tǒng)容災到云容災方案的演變想到的
2021-12-22閱讀 519

曾幾何時,由國有五大行為代表的兩地三中心的容災架構是業(yè)界的高配和主流容災架構方案。國內有些證券或保險公司即使做不到生產(chǎn)中心和災備中心的1:1配置,也會基本保有其核心業(yè)務應用容災切換的能力,公司治理層面要求定期做災備演練。按照銀監(jiān)會和保監(jiān)會的治理要求,金融公司要確保一年做一次整體或局部系統(tǒng)的容災切換,這是銷售金融及衍生產(chǎn)品的公司持續(xù)持有金融牌照所必須要履行的責任和義務,這也是必要的國家對金融類公司的合規(guī)性要求。

 

      目前很多銀行或券商正在嘗試如阿里云等云平臺的容災方案。在云環(huán)境的容災如何做,這將成為很多公司或組織的IT部門所需考慮的全新課題。我們都知道容災一般可以分為同城容災和異地(城市)容災。傳統(tǒng)容災方案是在同城或異地各建立一個與生產(chǎn)中心同等規(guī)模的災備中心,并且生產(chǎn)中中心至少有兩套一模一樣的IT系統(tǒng)架構,保證在生產(chǎn)中心的一套IT系統(tǒng)全癱瘓的情況下,在同一個生產(chǎn)中心還可以有另一套同樣規(guī)模的IT系統(tǒng)架構可以支撐業(yè)務的持續(xù)運行。在生產(chǎn)中心乃至不同災備中心之間都部署了相同的應用和IT基礎設施支撐能力,并通過在不同數(shù)據(jù)中心的高端存儲之間的同步或異步復制的能力來確??鐢?shù)據(jù)中心的相同業(yè)務應用的數(shù)據(jù)一致性。

 

  那么如果業(yè)務應用上云后,云上的容災方案會有何種改變呢?我們且從如下兩種典型的方案來分別論述:

 

     1、云一般可以支持同城多可用區(qū)(AZ)的容災方案,這里的可用區(qū)是指物理上有獨立網(wǎng)絡接入、電源、空調和機架的數(shù)據(jù)中心。如果在同一朵云上的兩個可用區(qū)分別承載著基于負載均衡(F5(硬負載)或SLB(軟負載))訪問的具備分布式架構的應用,并且數(shù)據(jù)庫采取如OceanDB或RDS這樣支持分布式架構的云數(shù)據(jù)庫。云上應用的同城容災將變得非常簡單,只要依靠單個云本身的分布式存儲能力以及存儲、中間件和數(shù)據(jù)庫級別的同步復制能力就可以輕松實現(xiàn)同城的容災。云上容災的架構圖如下圖所示:

   2、云上的異地容災相對來說就比較復雜,一般分為同云多Region(城市)和不同云多Region的方案。在同云多Region的方案中,一般建議的是不同Region(城市)?的距離最好小于200公里,這更多的是對應用所需數(shù)據(jù)的一致性和應用自身訪問性能考慮的。異地數(shù)據(jù)中心如果相距小于200公里,這對很多銀行類客戶來說是不可以接受的,因為銀行的生產(chǎn)中心和災備中心的距離要求一般要達到500公里以上并且不同數(shù)據(jù)中心應在不同的地震帶上,以保證業(yè)務的連續(xù)性和用戶訪問流量的就近接入等實際業(yè)務訴求。例如,中國銀行的生產(chǎn)中心在北京,異地的災備中心在上海,北京和上海相距500公里以上。如果客戶上云,可能在異地災備中心部署的云與生產(chǎn)中心不是同一個廠家的云。例如,生產(chǎn)中心選取的是阿里云,災備中心選取的是華為云。這樣就需要考慮更多復雜的實際問題以及方案落地實現(xiàn)的可能性。

       

總之,云平臺廠商都在致力于異地容災的白屏化能力,比如可以通過容災項目的實施步驟,利用云廠商提供白屏化的管理界面,選擇指定業(yè)務應用級、可用區(qū)(獨立的數(shù)據(jù)中心或機房)級和Region(城市)級的切換,使災備演練和容災切換變成一種可灰度、可監(jiān)控和可回滾的低風險的操作。由于業(yè)務連續(xù)性的訴求,城市或數(shù)據(jù)中心級的容災技術需要持續(xù)的改進和提到,大家都在持續(xù)努力的路上。

頭像
劉通
464
文章總數(shù)
1219359
總閱讀數(shù)