MapR CEO: Hadoop將增強SQL 而不是取代 |
發布時間: 2012/7/27 15:10:59 |
上個月,老牌IDC分析師Dan Vesset曾預言,Hadoop將成為現代數據中心的一個標準組件。到2015年,Hadoop市場將步入成熟,而我們今天所熟知的主要參與廠商可能將不復存在。MapR是一家商業Hadoop的供應商,其名稱是受Hadoop的MapReduce軟件架構的啟發,并且是Vesset的收購目標清單上的公司之一。 所以你可以預料到MapR的CEO John Schroeder的預言并不包括他自己的公司。但是Schroeder至少發出了一個容易引起爭論的論調:相對于1992年的數據庫市場,2012年該市場的不同在于客戶的新發現能力導致了客戶傾向由賣方主導變成了抑制賣方。 可移植性 “多個廠商間的競爭可以產生更好的結果,”Schoeder表示,“如果你看看九十年代初,Oracle、 Sybase和Informix都在為建立世界級的關系型數據庫而鏖戰,他們都是基于ANSI標準的SQL。我認為Hadoop的接口相比于關系形數據庫更加標準和便攜。” 通過與EMC達成戰略合作伙伴,MapR已經迅速進入市場中的第一陣營。Schoeder暗示,這種伙伴關系就像為MapR上了份商業保險。 更重要的是,他認為,Hadoop的API的嚴格規范,開發相關組件比關系型數據庫更加容易。“客戶在分布式數據庫之間移植的轉換成本相當低”,他告訴我們。他確信,只要Cloudera、Hortonworks這些與MapR類似的公司一起保持合作,保持彼此間的可以移植性和兼容性,大數據市場將迎來更多創新。 “我在想,就好比航天技術需要大量的供應商一樣。”Schoeder表示,這樣,如果一些開發者用HBase的接口,其它人用Hive、Pig,或其它更多的選擇,只要堅持MapReduce的API,應用程序仍然可以在各個分布系統里移植。 beta或許已經結束 Schroeder預見,Hadoop經歷了實驗室階段,已經在企業中部署,最終將承擔關鍵性的任務。但事實并非如此?大量SQL數據庫引擎應用在關鍵業務中,并沒有成為Hadoop爆發的導火索。 “非結構化的數據系統并不適合傳統的數據倉庫,這種情況非常普遍。”Schroeder確信。“Hadoop在幾年前的狀態真的不是一個可靠的計算和數據存儲。僅僅在18個月前,如果你在Hadoop里存儲數據,那就意味著丟失;如果你正在運行的生產應用程序,你會遇到崩潰,那個時候Hadoop還沒有足夠成熟。這限制了Hadoop的商業化。” Schoeder表示,作為商業的Hadoop供應商,我們將提供用戶在SQL系統所提供的所有功能,保證商業的連續性和保護,這就是變化。 SaaS是兇是吉? 作為云供應我們努力商探索更多的客戶,中小型企業愿意采用云供應商(Amazon彈性MapReduce系統和DynamoDB)提供的遠程的數據存儲和管理,而不是自己部署。這會對像MapR這樣的企業構成商業威脅? 不會的。只要給MapR一個機會進入到這些品牌的核心就足夠了。John Schroeder舉例說,給五角大樓提供國防設備,將通過承包商銷售MapR的產品。也許這些客戶不認同Hadoop,但誰會在乎呢?也許IDC的Vesset說的不完全對,品牌的光環可以褪去,但其背后的技術公司至少有一個可以繼續生存。 增強,而不是被取代 早期,所謂的“NoSQL”運動的成功目標是如何盡快讓非結構化數據模型被企業采用。Schroeder認為,Hadoop和大數據系統能否成功的關鍵因素在于,像我一樣的開發者能否盡快充分利用超越SQL最大級別的擴展能力的應用程序。 “我在這個市場工作兩年半,起初我沒有看到客戶用Hadoop替換自己的數據倉庫。如今,市場正在被拉動。” Schroeder舉例說,一家信用卡公司需要建立欺詐檢測系統。傳統的SQL數據倉庫是現成的,也可以工作的足夠好。但是它沒有足夠的數據過濾系統,不能準確的捕捉和篩選可能會導致欺詐的序列。因此,作為更加明智的策略,他建議建立補充的原始交易數據流的數據庫,也許要記錄幾年的數據后才能通過Hadoop產生價值。開始,當一個潛在的欺詐事件在SQL中是孤立的,但是通過快速分析可以通過Hadoop發現。顯然,建立分析欺詐事件模型,對SQL和Hadoop雙方都有利。 本文出自:億恩科技【www.laynepeng.cn】 |