分布式存儲(chǔ)能夠勝任PB以上的共享存儲(chǔ)。為什么分布式存儲(chǔ)這么重要分布式存儲(chǔ)的誕生有著很強(qiáng)的優(yōu)越性,主要體現(xiàn)在靈活性、速度、成本等方面,簡(jiǎn)要來(lái)在性能和價(jià)格方面,相對(duì)SAN存儲(chǔ),分布式存儲(chǔ)都存在優(yōu)勢(shì),分布式存儲(chǔ)組織將最大限度地降低基礎(chǔ)設(shè)施成本高達(dá)90%。
1、分布式存儲(chǔ)和SAN存儲(chǔ)有什么區(qū)別?
簡(jiǎn)要來(lái)說(shuō),在性能和價(jià)格方面,相對(duì)SAN存儲(chǔ),分布式存儲(chǔ)都存在優(yōu)勢(shì)。性能SAN存儲(chǔ):通常采用雙控制器架構(gòu)方式,為前端服務(wù)器配置兩臺(tái)交換機(jī)進(jìn)行連接,這種架構(gòu)方式具有一些明顯的弊端:前端服務(wù)器成為整個(gè)存儲(chǔ)性能的瓶頸。前端服務(wù)器的對(duì)外服務(wù)能力會(huì)制約存儲(chǔ)的橫向拓展性,并且當(dāng)控制器出現(xiàn)損壞時(shí),將直接影響存儲(chǔ)的正常使用,
由于不同廠商設(shè)備的管理和使用方式不同,當(dāng)管理接口不統(tǒng)一、軟硬件緊耦合時(shí),會(huì)影響存儲(chǔ)使用的利用率和便利性,帶來(lái)存儲(chǔ)利用率較低的現(xiàn)象。分布式存儲(chǔ):通常采用分布式系統(tǒng)結(jié)構(gòu),將數(shù)據(jù)分布存儲(chǔ)到多個(gè)數(shù)據(jù)存儲(chǔ)服務(wù)器上,系統(tǒng)的可靠性、存儲(chǔ)效率、擴(kuò)展性都得到提升,結(jié)合適當(dāng)?shù)臄?shù)據(jù)分布策略,當(dāng)分布式存儲(chǔ)達(dá)到一定規(guī)模時(shí),大量的磁盤和節(jié)點(diǎn)可以達(dá)到非常高的聚合帶寬,在性能上超越傳統(tǒng)的SAN存儲(chǔ)。
SAN一個(gè)機(jī)頭最多可帶幾百個(gè)磁盤,擴(kuò)展能力有限,而分布式存儲(chǔ)能夠勝任PB以上的共享存儲(chǔ)。價(jià)格光纖網(wǎng)絡(luò)成本以及拓展柜使得SAN存儲(chǔ)價(jià)格較高;而分布式存儲(chǔ)的初期成本較低,IP網(wǎng)絡(luò)、幾臺(tái)X86服務(wù)器及內(nèi)置硬盤就可以完成組建,后期通過加服務(wù)器就可以實(shí)現(xiàn)拓展,不過,相對(duì)于SAN存儲(chǔ),分布式存儲(chǔ)對(duì)技術(shù)和運(yùn)維能力的要求會(huì)更高,需要服務(wù)平臺(tái)維護(hù)好實(shí)際應(yīng)用場(chǎng)景中的數(shù)據(jù)一致性和穩(wěn)定性問題。
2、分布式存儲(chǔ)是什么?
簡(jiǎn)單來(lái)說(shuō),就是存儲(chǔ)設(shè)備分布在不同的地理位置,數(shù)據(jù)就近存儲(chǔ),將數(shù)據(jù)分散在多個(gè)存儲(chǔ)節(jié)點(diǎn)上,各個(gè)節(jié)點(diǎn)通過網(wǎng)絡(luò)相連,對(duì)這些節(jié)點(diǎn)的資源進(jìn)行統(tǒng)一的管理,從而大大緩解帶寬壓力,同時(shí)也解決了傳統(tǒng)的本地文件系統(tǒng)在文件大小、文件數(shù)量等方面的限制,為什么分布式存儲(chǔ)這么重要分布式存儲(chǔ)的誕生有著很強(qiáng)的優(yōu)越性,主要體現(xiàn)在靈活性、速度、成本等方面。
靈活性方面:分布式存儲(chǔ)系統(tǒng)使用強(qiáng)大的標(biāo)準(zhǔn)服務(wù)器(在CPU,RAM以及網(wǎng)絡(luò)連接/接口中),它不再需要專門的盒子來(lái)處理存儲(chǔ)功能,而且允許標(biāo)準(zhǔn)服務(wù)器運(yùn)行存儲(chǔ),這是一項(xiàng)重大突破,這意味著簡(jiǎn)化IT堆棧并為數(shù)據(jù)中心創(chuàng)建單個(gè)構(gòu)建塊。通過添加更多服務(wù)器進(jìn)行擴(kuò)展,從而線性地增加容量和性能,速度方面:如果你研究一個(gè)專門的存儲(chǔ)陣列,你會(huì)發(fā)現(xiàn)它本質(zhì)上是一個(gè)服務(wù)器,但是他只能用于存儲(chǔ),為了擁有快速存儲(chǔ)系統(tǒng),你要花費(fèi)的成本非常高。
即使在今天大多數(shù)系統(tǒng)中,當(dāng)你為存儲(chǔ)系統(tǒng)進(jìn)行擴(kuò)展時(shí),也不會(huì)提高整個(gè)系統(tǒng)的性能,因?yàn)樗辛髁慷急仨毻ㄟ^“頭節(jié)點(diǎn)”或主服務(wù)器(充當(dāng)管理節(jié)點(diǎn)),但是在分布式存儲(chǔ)系統(tǒng)中,任何服務(wù)器都有CPU,RAM,驅(qū)動(dòng)器和網(wǎng)絡(luò)接口,它們都表現(xiàn)為一個(gè)組。因此,每次添加服務(wù)器時(shí),都會(huì)增加總資源池,從而提高整個(gè)系統(tǒng)的速度,成本方面:分布式存儲(chǔ)組織將最大限度地降低基礎(chǔ)設(shè)施成本高達(dá)90%!沒錯(cuò),是90%,因?yàn)轵?qū)動(dòng)器和網(wǎng)絡(luò)所花費(fèi)的成本非常低,極大的提高了服務(wù)器的使用效率,同時(shí),數(shù)據(jù)中心所花費(fèi)的電力、空調(diào)費(fèi)、所占空間等費(fèi)用也減少了,管理起來(lái)更加方面,所需要的人也更少。
3、分布式存儲(chǔ)將來(lái)前景咋樣?
從計(jì)算機(jī)資源的發(fā)展來(lái)看,個(gè)人認(rèn)為可以分為三個(gè)階段:最為早期的共享式,后來(lái)的單體式,到現(xiàn)在的分布式,這個(gè)發(fā)展的原因,都是基于計(jì)算資源的需求。早期一臺(tái)服務(wù)unix服務(wù)器,連接多個(gè)終端,每個(gè)終端單獨(dú)獲取計(jì)算資源,其實(shí)跟現(xiàn)在的云計(jì)算感覺很類似,計(jì)算資源都放在服務(wù)器端,終端比較簡(jiǎn)單,這是早期對(duì)計(jì)算資源的需求和提供的計(jì)算能力之間的供需關(guān)系決定的。
后來(lái),隨著計(jì)算機(jī)的發(fā)展,對(duì)計(jì)算資源的需求的不斷增加,單體式的計(jì)算機(jī)就出現(xiàn)了,功能越來(lái)越強(qiáng)大,性能也越來(lái)越好。再后來(lái),隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,對(duì)計(jì)算資源的需求不斷的增加,而且性能越高的單體計(jì)算機(jī)越貴,為了在性能和計(jì)算資源之間尋找到最佳,于是分布式的就應(yīng)運(yùn)而生了,用普通的機(jī)器,實(shí)現(xiàn)高性能的計(jì)算,而且通過冗余技術(shù),實(shí)現(xiàn)高可用。