讓AI燃料加速 燃燒 IBM新一代軟件定義存儲來了
人工智能技術將極大地改變各行各業(yè)的面貌,企業(yè)級存儲領域也是這樣。
近幾年,存儲領域最火的軟件定義存儲、智能存儲等概念背后,都有一個關鍵詞——智能化。原因就在于,越來越多的企業(yè)已經(jīng)意識到,相比擁有數(shù)據(jù)而言,善于利用數(shù)據(jù)、從數(shù)據(jù)中獲取價值,才是真正的競爭優(yōu)勢。
2019年下半年,IBM發(fā)布了一系列面向AI與大數(shù)據(jù)、現(xiàn)代數(shù)據(jù)保護的新一代軟件定義存儲產(chǎn)品,致力于借助AI技術,跨越時空幫企業(yè)管好數(shù)據(jù)。
未來企業(yè)級存儲的挑戰(zhàn)是什么?什么是新一代軟件定義存儲?IBM存儲的優(yōu)勢和策略又是什么?帶著以上這些問題,趣味科技于近日采訪了IBM副總裁、大中華區(qū)系統(tǒng)部總經(jīng)理侯淼和IBM大中華區(qū)系統(tǒng)部存儲系統(tǒng)總經(jīng)理吳磊。
IBM副總裁、大中華區(qū)系統(tǒng)部總經(jīng)理侯淼
新挑戰(zhàn):當數(shù)據(jù)活得越來越久
“數(shù)據(jù)的發(fā)展有兩大趨勢:一個是數(shù)據(jù)越來越多,也就是大家都熟悉的數(shù)據(jù)大爆炸;還有一個維度,就是數(shù)據(jù)的生命周期正在變得越來越長!盜BM副總裁、大中華區(qū)系統(tǒng)部總經(jīng)理侯淼表示。
如果按使用頻率劃分,數(shù)據(jù)可以用一張冰山圖來表示。露出水面的冰山一角是一級存儲(Primary Storage),針對熱數(shù)據(jù)和溫數(shù)據(jù),比如需要高IOPs、低時延、高性能計算分析的實時數(shù)據(jù)。冰山的水下部分是二級存儲(Secondary Storage),針對冷數(shù)據(jù),比如用于歸檔、備份的數(shù)據(jù)、媒體與圖像資料庫、物聯(lián)網(wǎng)數(shù)據(jù)等。有數(shù)據(jù)統(tǒng)計,二級存儲約占企業(yè)存儲的70%。
隨著信息安全法規(guī)和金融、醫(yī)療等行業(yè)不斷加強數(shù)據(jù)監(jiān)管,企業(yè)對數(shù)據(jù)留存時間的要求越來越高,水面之下的冰山部分越來越大。2016年《反恐法》規(guī)定,重要場所視頻監(jiān)控圖像保持期限不得少于90天。銀監(jiān)會規(guī)定,理財產(chǎn)品的數(shù)據(jù)要在結束后的2年內進行保留歸檔。一些能源制造企業(yè),在生產(chǎn)環(huán)境下要求對數(shù)據(jù)有五年、十年,甚至數(shù)十年的保存。
數(shù)據(jù)爆炸與周期變長的疊加,以及AI和大數(shù)據(jù)進入生產(chǎn)環(huán)境,都在不斷推高企業(yè)對數(shù)據(jù)存儲的要求。IBM大中華區(qū)系統(tǒng)部存儲系統(tǒng)總經(jīng)理吳磊認為,企業(yè)級存儲面臨的新挑戰(zhàn)表現(xiàn)在多個方面:
首先,人工智能、大數(shù)據(jù)技術已經(jīng)從POC(概念驗證)環(huán)節(jié)進入生產(chǎn)環(huán)節(jié)。在全新的應用場景中,海量數(shù)據(jù)正源源不斷涌現(xiàn)。多元數(shù)據(jù)的攝取,準備的周期非常長。
其次,越來越多的企業(yè)選擇混合多云的環(huán)境部署業(yè)務,如何把傳統(tǒng)數(shù)據(jù)中心,傳統(tǒng)應用,不同云環(huán)境等不同IT環(huán)境的數(shù)據(jù)打通是個大挑戰(zhàn)。同時,面對不同架構多災備的數(shù)據(jù)副本,如何保證數(shù)據(jù)單一的真實性來源也是痛點。
第三,如何保護數(shù)據(jù)在更長久周期內的可用、可回溯性、可審計性。
IBM大中華區(qū)系統(tǒng)部存儲系統(tǒng)總經(jīng)理吳磊
如何解決這些新挑戰(zhàn)?IBM將存儲產(chǎn)品從功能上劃分為兩大維度,一個是數(shù)據(jù)存儲,一個是數(shù)據(jù)訪問。數(shù)據(jù)存儲方面,IBM追求跨越時空和性價比。即使數(shù)據(jù)容量漲得很快,也能保持企業(yè)的IT投資處在合理水平。在數(shù)據(jù)訪問方面,強調用AI技術打造從數(shù)據(jù)獲取價值的極速管道。
“IBM是全球存儲產(chǎn)品最豐富的公司。IBM存儲分為四大部分:第一,storage for multi hybrid cloud,面向混合多云環(huán)境的存儲構架;第二,Storage for AI and Big Data,針對人工智能和大數(shù)據(jù)的存儲;第三,Modern Data Protection,圍繞我們Spectrum Protection和Protection Plus軟件系統(tǒng)的現(xiàn)代數(shù)據(jù)保護;第四,Storage for Z,與主機結合的存儲!焙铐到榻B。
新管道:如何加速AI燃料充分“燃燒”?
在算法、算力、數(shù)據(jù)三要素中,數(shù)據(jù)是AI的燃料。反過來,“AI的關鍵是將數(shù)據(jù)轉變?yōu)樯a(chǎn)力!眳抢谥赋。
然而,在傳統(tǒng)存儲架構下,從數(shù)據(jù)到生產(chǎn)力的管道卻經(jīng)常堵塞。比如在不同介質、異構架構的元數(shù)據(jù)源攝取上,如果無法做到全球范圍、快速數(shù)據(jù)攝取和實時分析,有再好的CPU、GPU、FPGA也無法發(fā)揮數(shù)據(jù)價值。再比如,在數(shù)據(jù)分類與元數(shù)據(jù)標注上,數(shù)據(jù)的攝取、準備的周期非常長,極大影響了AI模型訓練的效率。也就是說,數(shù)據(jù)從入口進來的太慢,已經(jīng)成為AI技術落地的一個瓶頸。
IBM本次發(fā)布了端到端的NVMe解決方案IBM Elastic StorageSystem 3000(ESS 3000)以及元數(shù)據(jù)管理軟件IBM Spectrum Discover,專為人工智能和大數(shù)據(jù)工作負載打造。二者的組合打通了數(shù)據(jù)攝取、分類標注、數(shù)據(jù)分析、數(shù)據(jù)訓練在內的高速管道,打造了適用于任何高I/O吞吐的生產(chǎn)級人工智能大數(shù)據(jù)分析平臺。
ESS 3000被稱為“為AI和大數(shù)據(jù)實現(xiàn)快速、高度可擴展存儲部署的最簡單方法”。ESS 3000的核心優(yōu)勢可以用高性能、高擴展、簡單部署來概括。
首先,ESS 3000采用NVMe閃存存儲,每個2U構建塊可提供40GB/s的吞吐量。順序讀取性能最高可達42GB/s,順序寫入性能最高可達32GB/s。
其次,ESS 3000的核心技術是IBM Spectrum Scale。IBM Spectrum Scale是IBM經(jīng)歷多年企業(yè)級生產(chǎn)環(huán)境驗證的并行文件存儲系統(tǒng),其代碼迭代超過20年。從名字可以看出,IBM Spectrum Scale的無縫擴展功能可以應對海量非結構化數(shù)據(jù)的增長。
第三,ESS 3000透過容器化技術把IBM Spectrum Scale封裝在全閃存設備中,帶來開箱即用的簡單部署。企業(yè)部署時間可以從原來的數(shù)天降低到幾個小時。
元數(shù)據(jù)管理軟件IBM Spectrum Discover能夠對規(guī)模級數(shù)據(jù)快速識別、分類,可以快速攝入、合并數(shù)十億個文件和對象的元數(shù)據(jù)并對其進行索引處理。IBM Spectrum Discover的作用在于幫助數(shù)據(jù)科學家、數(shù)據(jù)管理者高效管理海量非結構化數(shù)據(jù),從數(shù)據(jù)中快速挖掘價值。
此外,在智能化存儲管理方面,IBM Spectrum Control可以借助AI技術自動化進行存儲性能、安全性的監(jiān)控和分析,并與IBM成熟的存儲管理經(jīng)驗公式進行比照,為客戶提供預測性故障分析。
老傳統(tǒng):跨越時空幫企業(yè)管好數(shù)據(jù)
提到能夠跨越時空的物質,很多人會想到石頭!耙活w恒久遠”的鉆石就是石頭。小說《三體》中,云天明把幾行字刻在石頭上,過了1800萬年之后還能被程心看到。
在時間維度上,當數(shù)據(jù)的壽命越來越長,企業(yè)必然希望數(shù)據(jù)能夠長久保存,磁帶這一種傳統(tǒng)的存儲方式煥發(fā)出了新的活力。很多人以為磁帶技術早已淘汰過時,吳磊舉了一個簡單的例子說明磁帶保存數(shù)據(jù)的長期性和可靠性。
一家全球的科研機構,在幾年前要把過去十年存儲在磁帶上的數(shù)據(jù)梳理一遍。這些帶子總共幾萬盤,總長度2200萬米。除了200多米長的數(shù)據(jù)讀不出來,其他數(shù)據(jù)都完好無缺。
相比只能保存2-3年的硬盤,保存十年卻只有大約十萬分之一的損壞率,足以說明磁帶存儲的經(jīng)久耐用。而且斷裂的磁帶可以重新接上進行修復,而硬盤類存儲一旦損壞數(shù)據(jù)就全部找不回來。在成本上,磁帶存儲比硬盤便宜80%-90%左右。對于海量歸檔、備份屬性的二級存儲數(shù)據(jù),磁帶存儲是更可靠、更便宜、壽命更長、更安全(隔離網(wǎng)絡,天然防止黑客攻擊)的解決方案。
吳磊介紹,作為全球僅有的幾家具備磁帶存儲解決方案的企業(yè),IBM也在不斷升級磁帶技術。IBM不但將磁帶密度越做越高,還通過磁帶文件系統(tǒng)IBM Spectrum Archive,實現(xiàn)了軟件定義的磁帶解決方案,可以對磁帶數(shù)據(jù)智能回溯,方便調取歷史數(shù)據(jù)。目前,IBM的磁帶存儲在電視臺、網(wǎng)絡音頻、視頻公司都有廣泛使用。
在空間維度上,IBM存儲針對混合多云的環(huán)境打造了跨數(shù)據(jù)中心和云的統(tǒng)一存儲管理。IBM Spectrum Scale可將閃存、磁盤、云和磁帶存儲合并到一個統(tǒng)一的系統(tǒng)之中,實現(xiàn)規(guī)模化的數(shù)據(jù)管理。IBM Spectrum Discover可輕松連接至內部環(huán)境和云環(huán)境中的多個文件與對象存儲系統(tǒng)。在數(shù)據(jù)保護方面,IBM Spectrum Protect Plus是專為混合多云環(huán)境而設計的一體化數(shù)據(jù)保護解決方案,可以快速恢復 VM、數(shù)據(jù)庫、應用和容器。
此外,SVC(SAN Volume Controller)可以利用IBM Spectrum Virtualize for Public Cloud的廣泛功能,簡化多云解決方案,實現(xiàn)異構存儲全面云化。IBM第二代對象存儲COS(Cloud Object Storage)采用標準的S3接口,可以無縫訪問本地和云端的對象存儲。
在交付方式上,IBM為企業(yè)提供一體機和純軟件交付靈活組合的方式。可以說,在新的存儲挑戰(zhàn)下,IBM用實力詮釋了新一代軟件定義存儲的概念。同時也體現(xiàn)了IBM存儲的三大優(yōu)勢:現(xiàn)代化,現(xiàn)代化基礎架構下,不斷迭代推出更新的閃存技術;敏捷,在混合多云環(huán)境下做到容器化的封裝,靈活可擴展,極簡部署;安全,更長周期的數(shù)據(jù)存儲和更可靠的數(shù)據(jù)保護。
“數(shù)據(jù)是客戶唯一的唯一,我們的工作就是跨越時空,把客戶針對數(shù)據(jù)所有的事情做好,做扎實。”吳磊強調。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市