轉載大話(huà)存儲冬瓜哥 CDM是什么,和CDP的區別?
發(fā)布人:scutech 發(fā)布日期:2018-01-27 17:36:08 點(diǎn)擊數:21373
本文作者冬瓜頭,江湖人稱(chēng)冬瓜哥,本名張冬,資深系統工程師。多年來(lái)一直就職于存儲設備公司,一直對存儲技術(shù)孜孜不倦的研究探索并且樂(lè )于幫助存儲初學(xué)者提高。著(zhù)有暢銷(xiāo)書(shū)《大話(huà)存儲》,該書(shū)屢次獲獎,包括2008年十大IT暢銷(xiāo)書(shū)排名第一、2009年全國技術(shù)品種暢銷(xiāo)書(shū),版權被輸出至臺灣地區。
本文組織:
CDM是什么
為什么會(huì )出現CDM
CDM具體能做什么
CDM哪家強
CDM任重道遠
什么是CDM
CDP(Continuous Data Protection,連續數據保護),其利用記錄基準數據和增量數據日志,然后對日志做索引處理的方式,能夠讓用戶(hù)在較短的時(shí)間內看到歷史時(shí)刻數據的任意副本。然而,CDP系統更加注重的是將數據拿到和保護起來(lái),至于這些數據如何被利用,長(cháng)期以來(lái)卻似乎并沒(méi)有受到重視。
CDM(Copy Data Management,數據副本管理),這個(gè)技術(shù)概念其出發(fā)點(diǎn)就在于它并不關(guān)心數據是怎么拿到的,比如是通過(guò)傳統備份亦或是CDP,也不關(guān)心數據放在哪里,比如本地硬盤(pán)、SAN、分布式存儲、云存儲等。它注重的是如何將獲取到的數據更好的管理和利用,以及更好的與應用相結合的利用。
CDP面向的場(chǎng)景就是數據的連續保護、備份和恢復,CDP雖然也可以提供數據的歷史時(shí)間點(diǎn)Image,但是無(wú)論是在設計初衷、配置過(guò)程、使用過(guò)程中都會(huì )透著(zhù)濃濃的為數據恢復而服務(wù)的色彩,而不是為了數據使用。相反CDM面向的就是如何使用好對應的數據。
傳統存儲系統中的快照也面臨這個(gè)問(wèn)題,做了一堆快照,更多是被用來(lái)數據存根以備不時(shí)之需,雖然廠(chǎng)商也都宣稱(chēng)可將快照用于平時(shí)的數據業(yè)務(wù)中,但只是“可以”用,真正用起來(lái)會(huì )發(fā)現還欠缺太多的易用性。
為什么會(huì )出現CDM
隨著(zhù)大數據時(shí)代的來(lái)臨,企業(yè)面對市場(chǎng)的競爭,開(kāi)始考慮如何提高數據的使用價(jià)值,挖掘出數據中隱藏的有效信息,從而快速提升企業(yè)的核心競爭力。企業(yè)的生產(chǎn)數據,已不僅僅用于業(yè)務(wù)生產(chǎn),還有很多非生產(chǎn)環(huán)境中也需要這些數據支持。開(kāi)發(fā)新系統時(shí),需要Copy生產(chǎn)數據到研發(fā)環(huán)境中用于開(kāi)發(fā);測試系統時(shí),需要Copy生產(chǎn)數據到測試環(huán)境中用于調試;數據統計和分析,需要Copy生產(chǎn)數據到統計分析系統中進(jìn)行處理。
CDM具體能做什么
CDM可以做到在不中斷業(yè)務(wù)訪(fǎng)問(wèn)的前提下分離出在線(xiàn)數據,將查詢(xún)、測試、分析等流量轉移到非生產(chǎn)系統。所獲得的數據副本即時(shí)可用,分離出的數據通過(guò)數據重組和應用模式匹配以及數據清洗,快速為業(yè)務(wù)提供數據支撐。CDM可以做到流程化管理,通過(guò)自動(dòng)化的流程管理,簡(jiǎn)化副本數據的管理復雜度。CDM還可以提升數據管理效率,結合日志處理技術(shù),提升數據的實(shí)時(shí)性,可以快速處理量更大、更多樣化的數據。
CDM哪家強
成立于2009年的鼎甲科技,在去年發(fā)布了產(chǎn)品重新定義備份:鼎甲科技發(fā)布DBackup6.0備份容災管理系統。鼎甲科技這兩年在市場(chǎng)上頻繁亮相,這是一家純國產(chǎn)化掌握每一行代碼自主產(chǎn)權的國產(chǎn)數據保護容災廠(chǎng)商。其領(lǐng)軍人物王子駿博士,曾就職于CA、希捷,曾擔任Veritas軟件系統架構師。他在汶川地震時(shí)感受到了數據保護的重要性,決定回國研發(fā)自主的數據保護產(chǎn)品,于是誕生了鼎甲科技,并于2014年獲得中國電子(CEC)的戰略投資,借助CEC以及信息產(chǎn)業(yè)國產(chǎn)化浪潮,鼎甲在近幾年迅速崛起,銷(xiāo)售額不斷增長(cháng)。
2017年底,鼎甲科技發(fā)布了其CDM一體機:InfoSemper。這款產(chǎn)品特點(diǎn)可以歸納為以下幾個(gè)方面:
數據精準捕獲。在初始化全量數據復制后,持續監測客戶(hù)端資源的數據變化,準確地捕獲增量數據,并采用多通道技術(shù)達到數據的高速傳輸,極大降低數據捕獲時(shí)間窗口,減少對業(yè)務(wù)資源的占用。
虛擬合并。采用數據索引重定向技術(shù)實(shí)現了全量數據和增量數據的虛擬合并,解決了傳統數據合成中采用的數據物理復制技術(shù),產(chǎn)生大量數據塊的磁盤(pán)移動(dòng),引起存儲空間 I/O 負載增加的問(wèn)題。
多副本管理?;诔跏既繑祿傻摹包S金副本”,在每次獲取增量數據后合成為新的副本。并可通過(guò)快照、克隆等方式,在同一時(shí)間點(diǎn)上創(chuàng )建出該副本的多個(gè)副本數據,從而滿(mǎn)足多種業(yè)務(wù)環(huán)境中使用同樣一份數據。
鼎甲的InfoSemper CDM產(chǎn)品的幾個(gè)典型應用場(chǎng)景如下:
數據/數據庫的閃速恢復。首次全量拷貝,后續通過(guò)增量合成全備,大幅度縮短備份窗口;通過(guò)即時(shí)掛載恢復技術(shù),可在5-30分鐘內快速實(shí)現數據庫的掛載恢復;結合數據庫的連續日志,可以在虛擬全備的基礎上進(jìn)一步降低RPO。
為開(kāi)發(fā)測試環(huán)境提供數據副本支撐:針對海量的數據資源,分鐘級產(chǎn)生測試需要的數據,快速部署到測試環(huán)境中;測試數據基于虛擬快照技術(shù),大幅減少測試數據占用的數據存儲空間;采用鏈接克隆和完全克隆的技術(shù),保證測試數據可讀寫(xiě),以及數據源不被改變。
數據跨平臺共享:定時(shí)或周期性產(chǎn)生定制化的副本數據,用于其他部門(mén)的數據查詢(xún);副本數據與生產(chǎn)系統分離,避免對主存的性能和安全性的影響,進(jìn)一步提升系統的可靠性;提供數據副本管理的REST API,用戶(hù)可根據自己業(yè)務(wù)應用的特點(diǎn),打造自己的數據管理云平臺。
CDM任重道遠
如今IT產(chǎn)業(yè)變化飛快,一個(gè)大趨勢是底層的技術(shù)、產(chǎn)品越來(lái)越趨向成熟,發(fā)展越來(lái)越緩慢,而上層的,與用戶(hù)相關(guān)度更強的技術(shù)和產(chǎn)品成為人們關(guān)注的重點(diǎn)。這個(gè)規律在存儲領(lǐng)域也適用,存儲系統對數據的存取這種基本功能已經(jīng)太過(guò)基本,甚至對數據的保護也成為了基本無(wú)新意的訴求,目前,存儲系統如何在數據的高層價(jià)值發(fā)揮上,仍然任重道遠。
隨著(zhù)國產(chǎn)化浪潮的到來(lái),數據保護、備份、容災領(lǐng)域的國產(chǎn)化是重中之重,而鼎甲科技作為一個(gè)純國產(chǎn)數據保護廠(chǎng)商,勢必會(huì )在這股浪潮中獨占鰲頭。