選存儲(chǔ),就選原生塊存儲(chǔ)!

存儲(chǔ)產(chǎn)業(yè)正在發(fā)生顛覆性的變化,主要有兩大推手:一個(gè)是新一代存儲(chǔ)介質(zhì)SSD;另一個(gè)是分布式存儲(chǔ)的演進(jìn),以SDS(軟件定義存儲(chǔ))為代表。

根據(jù)IDC預(yù)計(jì),2017年~2021年期間,全球軟件定義存儲(chǔ)市場(chǎng)的復(fù)合年增長(zhǎng)率將達(dá)到13.5%,到2021年市場(chǎng)規(guī)??山咏?62億美元。在SDS市場(chǎng)中,主要細(xì)分市場(chǎng)為塊、文件、對(duì)象和超融合基礎(chǔ)設(shè)施(HCI)。IDC預(yù)計(jì),SDS市場(chǎng)未來(lái)五年復(fù)合增長(zhǎng)率為28.8%,超融合市場(chǎng)為24.7%。

應(yīng)用如何過(guò)渡、遷移?

分布式存儲(chǔ)技術(shù)首先成功應(yīng)用在互聯(lián)網(wǎng)企業(yè)的應(yīng)用場(chǎng)景。

鑒于無(wú)法預(yù)計(jì)的互聯(lián)網(wǎng)訪問(wèn)流量,互聯(lián)網(wǎng)迫切需要一種彈性十足的IT基礎(chǔ)架構(gòu),傳統(tǒng)磁盤(pán)陣列以Scale Up為主,且價(jià)格昂貴,難以滿(mǎn)足需求。對(duì)此,互聯(lián)網(wǎng)企業(yè)不得不尋求更加具有成本競(jìng)爭(zhēng)力的方案。

以成本優(yōu)異的x86工業(yè)標(biāo)準(zhǔn)服務(wù)器為基礎(chǔ),通過(guò)強(qiáng)大的軟件調(diào)度管理能力,互聯(lián)網(wǎng)企業(yè)成功踐行了分布式軟件定義存儲(chǔ),從而開(kāi)辟了以Scale Out為特征的分布式存儲(chǔ)應(yīng)用。

但是與互聯(lián)網(wǎng)企業(yè)不同,傳統(tǒng)企業(yè)以往多采用集中部署模式,例如存儲(chǔ)以磁盤(pán)陣列為主,屬于Scale Up模式,上層應(yīng)用也是建立在這個(gè)模式基礎(chǔ)上的。

換句話(huà)說(shuō),與互聯(lián)網(wǎng)企業(yè)相比,傳統(tǒng)行業(yè)企業(yè)有歷史的包袱,存在兼容性的問(wèn)題。此外,行業(yè)性質(zhì)以及監(jiān)管不同,較之互聯(lián)網(wǎng)企業(yè),傳統(tǒng)行業(yè)企業(yè)用戶(hù)對(duì)于可靠性、穩(wěn)定性有更高的需求。

如今,云計(jì)算是產(chǎn)業(yè)發(fā)展的潮流和趨勢(shì),對(duì)于傳統(tǒng)企業(yè)來(lái)說(shuō),云環(huán)境部署更加復(fù)雜。如今,有一種觀點(diǎn)認(rèn)為:OpenStack作為私有云標(biāo)準(zhǔn)大局已定。與之相適應(yīng),有觀點(diǎn)認(rèn)為,較之Sheepdog、MooseFS等開(kāi)源系統(tǒng),以及眾多自主研發(fā)的系統(tǒng),作為OpenStack認(rèn)證對(duì)接的分布式存儲(chǔ),Ceph才是最為理想的選擇。

真的是這樣的嗎?

有關(guān)“塊”的問(wèn)題

所謂OpenStack認(rèn)證對(duì)接的分布式存儲(chǔ),并不意味Ceph就是最好的選擇,Ceph并不是OpenStack環(huán)境的標(biāo)配,Ceph只是適逢其會(huì)。如果了解Ceph就會(huì)知道,其絕大部分核心代碼都出自Inktank團(tuán)隊(duì),如今已經(jīng)被Redhat整體收購(gòu)。它只是一種分布式存儲(chǔ)的開(kāi)源架構(gòu),并沒(méi)有充分考慮企業(yè)級(jí)應(yīng)用的需求。而且Ceph設(shè)計(jì)之初就定位為“分布式文件系統(tǒng)”,并沒(méi)有關(guān)注“塊設(shè)備”應(yīng)用環(huán)境低延遲、高性能的特性。

換句話(huà)說(shuō):在“塊設(shè)備”應(yīng)用的場(chǎng)景,Ceph本身是不擅長(zhǎng)的。

選存儲(chǔ),就選原生塊存儲(chǔ)!

鵬云網(wǎng)絡(luò)創(chuàng)始人陳靚博士

原AWS核心架構(gòu)師、S3、Glacier存儲(chǔ)項(xiàng)目團(tuán)隊(duì)負(fù)責(zé)人,華裔科學(xué)家陳靚先生表示:傳統(tǒng)企業(yè)應(yīng)用上云,在存儲(chǔ)方面需要解決:

1)可用性與可靠性,這是用戶(hù)最為關(guān)心的問(wèn)題,當(dāng)節(jié)點(diǎn)或磁盤(pán)故障時(shí),業(yè)務(wù)不停,數(shù)據(jù)不丟是必須的。但限于crush機(jī)制,Ceph系統(tǒng)在節(jié)點(diǎn)當(dāng)機(jī)時(shí)會(huì)造成IO中斷,前端業(yè)務(wù)會(huì)受到一定影響。

2)性能。Ceph基于對(duì)象存儲(chǔ),IO延遲長(zhǎng),而傳統(tǒng)業(yè)務(wù)系統(tǒng)對(duì)IO延遲比較敏感。

3)應(yīng)提供豐富的企業(yè)級(jí)存儲(chǔ)服務(wù)功能,例如,快照/克隆技術(shù)提供快速數(shù)據(jù)恢復(fù)、以及多用途數(shù)據(jù)副本等能力;在線(xiàn)遷移能夠根據(jù)實(shí)際需求為業(yè)務(wù)系統(tǒng)調(diào)整存儲(chǔ)資源配置;QoS功能在多業(yè)務(wù)系統(tǒng)復(fù)雜環(huán)境下充分保證關(guān)鍵業(yè)務(wù)系統(tǒng)的存儲(chǔ)性能供給。

以上這些問(wèn)題,用戶(hù)都可以在產(chǎn)品測(cè)試過(guò)程中進(jìn)行實(shí)際的驗(yàn)證和考察,眼見(jiàn)為實(shí)。

選存儲(chǔ),就選原生塊存儲(chǔ)!

ZettaStor和原生塊存儲(chǔ)

作為原AWS核心架構(gòu)師、S3、Glacier存儲(chǔ)項(xiàng)目團(tuán)隊(duì)負(fù)責(zé)人,陳靚先生非常了解對(duì)象存儲(chǔ)應(yīng)對(duì)塊數(shù)據(jù)需求的不足。

機(jī)緣巧合,2012年,陳靚應(yīng)南京市政府的感召歸國(guó)創(chuàng)業(yè),創(chuàng)辦了南京鵬云網(wǎng)絡(luò)科技有限公司,并推出了從最底層開(kāi)始研發(fā)的ZettaStor DBS軟件定義分布式存儲(chǔ)系統(tǒng),提出了原生塊存儲(chǔ)的概念。

它是以裸設(shè)備方式直接管理底層硬盤(pán),并整合成為塊存儲(chǔ)資源供上層應(yīng)用來(lái)訪問(wèn)使用,由于并不存在對(duì)象存儲(chǔ)的中間轉(zhuǎn)換過(guò)程,因此能夠?qū)崿F(xiàn)低延遲的高I/O訪問(wèn)效率。

考慮到傳統(tǒng)企業(yè)級(jí)應(yīng)用對(duì)于功能的需求,ZettaStor DBS還提供了自動(dòng)精簡(jiǎn)配置、快照/克隆、分級(jí)存儲(chǔ)、數(shù)據(jù)復(fù)制和遷移、SSD緩存加速、QoS管理、訪問(wèn)控制、多路徑冗余等完整的功能。ZettaStor DBS所具有的機(jī)房多級(jí)容災(zāi)、故障域隔離、雙活容災(zāi)解決方案可以很好滿(mǎn)足企業(yè)級(jí)用戶(hù)業(yè)務(wù)的需求。

ZettaStor DBS以標(biāo)準(zhǔn)的iSCSI/SCSI協(xié)議和私有的LBD協(xié)議對(duì)外提供存儲(chǔ)服務(wù),并可以通過(guò)對(duì)接Cinder API、標(biāo)準(zhǔn)REST接口,可以為OpenStack等云計(jì)算管理平臺(tái)的統(tǒng)一管理提供技術(shù)支持!

選存儲(chǔ),就選原生塊存儲(chǔ)!

ZettaStor DBS產(chǎn)品架構(gòu)圖

測(cè)試中的 “貓膩”

談到原生塊存儲(chǔ),陳靚表示:其實(shí)概念并不重要。在擔(dān)任AWS核心架構(gòu)師期間,其內(nèi)部很少談?wù)摳拍?,更多是?zhuān)注在要解決哪些技術(shù)問(wèn)題。用戶(hù)應(yīng)該更加專(zhuān)注需要解決的問(wèn)題,而不應(yīng)該盲從于概念、標(biāo)準(zhǔn)或者趨勢(shì)。其實(shí),關(guān)注問(wèn)題不同,著眼點(diǎn)也不同。

對(duì)于原生塊存儲(chǔ)、非原生塊存儲(chǔ),測(cè)試和驗(yàn)證將是一個(gè)非常重要的方法。但是在測(cè)試過(guò)程中,也應(yīng)該結(jié)合實(shí)際,謹(jǐn)防被一些“貓膩”手段所蒙蔽。

以可靠性測(cè)試為例,重點(diǎn)要考察的是:當(dāng)集群中磁盤(pán)或節(jié)點(diǎn)發(fā)生故障時(shí),數(shù)據(jù)會(huì)不會(huì)丟失?業(yè)務(wù)會(huì)不會(huì)中斷?中斷的時(shí)長(zhǎng)是多少?

很多SDS的容錯(cuò)域都是提前配置好的。以3副本9個(gè)節(jié)點(diǎn)為例,通常會(huì)配置3個(gè)容錯(cuò)域A\B\C、每個(gè)容錯(cuò)域各3個(gè)節(jié)點(diǎn),每個(gè)容錯(cuò)域保存獨(dú)立的副本數(shù)據(jù)。例如當(dāng)以一個(gè)容錯(cuò)域A的3臺(tái)機(jī)器都故障時(shí),還有兩2個(gè)副本存在,數(shù)據(jù)不會(huì)丟失,業(yè)務(wù)照常運(yùn)行,這就是通常所說(shuō)的能容忍1/3節(jié)點(diǎn)宕機(jī)。這樣的要求大多數(shù)廠家都能做到,但如果同時(shí)B域或者C域也有機(jī)器down機(jī)呢?

這就是測(cè)試中,用戶(hù)需要仔細(xì)考察和驗(yàn)證的。

再以性能測(cè)試為例,SSD緩存對(duì)性能測(cè)試有很大的影響,特別在小數(shù)據(jù)量時(shí),看不出來(lái)系統(tǒng)的差異,但在實(shí)際中,當(dāng)數(shù)據(jù)量、負(fù)載加大,SSD存在被穿透的可能,這時(shí)數(shù)據(jù)就需要落盤(pán)(寫(xiě)到硬盤(pán)),這個(gè)時(shí)候良莠不齊,高低立判。這就是為什么很多以ceph為基礎(chǔ)二次開(kāi)發(fā)的系統(tǒng)把SSD緩存做為標(biāo)配的原因,因?yàn)橐坏](méi)有SSD加速性能會(huì)變得很差。

當(dāng)系統(tǒng)發(fā)生磁盤(pán)/節(jié)點(diǎn)故障,恢復(fù)數(shù)據(jù)是否會(huì)影響系統(tǒng)性能表現(xiàn)。以Ceph為例,其元數(shù)據(jù)管理和尋址采用的是Crush算法,在節(jié)點(diǎn)動(dòng)蕩時(shí),元數(shù)據(jù)(其實(shí)是ceph內(nèi)部保存的資源列表)發(fā)生變化,會(huì)導(dǎo)致大量的沒(méi)有必要的數(shù)據(jù)遷移,不僅導(dǎo)致網(wǎng)絡(luò)帶寬擁擠,嚴(yán)重時(shí)會(huì)導(dǎo)致業(yè)務(wù)系統(tǒng)訪問(wèn)受影響。

小結(jié)

傳統(tǒng)企業(yè)沒(méi)有辦法和互聯(lián)網(wǎng)企業(yè)相比,無(wú)論IT管理模式,技術(shù)水平,還是發(fā)展階段,二者完全不同。所謂橘生淮南則為橘,生于淮北則為枳,無(wú)論對(duì)于互聯(lián)網(wǎng)企業(yè)、云計(jì)算服務(wù)商,還是對(duì)于傳統(tǒng)企業(yè)用戶(hù),服務(wù)的對(duì)象,面臨場(chǎng)景不同,其選擇也就不同,切不可為商業(yè)化的宣傳所誤導(dǎo)!

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-07-06
選存儲(chǔ),就選原生塊存儲(chǔ)!
存儲(chǔ)產(chǎn)業(yè)正在發(fā)生顛覆性的變化,主要有兩大推手:一個(gè)是新一代存儲(chǔ)介質(zhì)SSD;另一個(gè)是分布式存儲(chǔ)的演進(jìn),以SDS(軟件定義存儲(chǔ))為代表。

長(zhǎng)按掃碼 閱讀全文