微軟SQL Server增加對Hadoop的支持 |
發布時間: 2012/7/28 13:48:28 |
在海量數據時代的大趨勢下,微軟增加了SQL Server大規模數據處理和并行數據倉庫平臺對開源Hadoop框架的支持。根據本周SQL Server團隊的官方博客消息,配合微軟數據倉庫和Hadoop連接器的社區技術預覽版也將會很快面世。 海量數據主要來源于企業中日益增長的數據,特別是Web流量等。微軟在其博客上表示“我們的客戶一直要求我們幫助其存儲、管理并分析結構化和非結構化數據,特別是在Hadoop環境中存儲的數據。” 微軟表示,隨著新連接工具的出現,客戶將能夠在Hadoop、SQL Server和并行數據倉換環境下相互交換數據。 Hadoop是一個分布式系統基礎架構,由Apache基金會開發。是原Yahoo員工Doug Cutting根據Google發布的學術論文研究而來,并以Google開發的MapReduce編程模型為基礎。 圍繞Hadoop的越來越多的商業生態系統漸漸出現,例如Cloudera公司就提供相關服務和專業的分布式框架。Forrester研究分析員James Kobielus表示鑒于數據倉庫商(如EMC和Teradata)已經可以開始采用Hadoop,所以說微軟此舉是明智的。他補充說“越來越多的企業正在運行Hadoop集群,他們希望能夠將這些系統中的數據發送到數據倉庫系統”。 但現在還沒有哪家廠商可以提供整套Hadoop服務。其中包括分布式、Hadoop相關項目的連接器(例如Cassandra數據庫)模塊化工具和其他組件等。 點擊查看大圖 毫無疑問,微軟像其他的廠商一樣,已經正式提出Hadoop的計劃,但還沒有將發展的路線圖公布于眾。同時微軟支持Hadoop并沒有影響他們自己的研究項目。上個月微軟發布了Daytona項目,微軟描述該項目是一個“運行在Windows Azure上的MapReduce”。主要是為了支持數據分析和人工智能算法。可支持擴展幾百服務器內核并分析分布式數據。 最近,微軟宣布他們已經發布了并行數據倉庫設備的第二次更新,此次功能的更新兼顧軟件組件和硬件組件。包括新的第三方BI(商業智能)連接器和SAP、Informatica以及Microstrategy提供的數據集成工具。此外,微軟表示基于戴爾硬件的并行數據倉庫的版本已經有售,每TB的最低價格為1.2萬美元。 本文出自:億恩科技【www.laynepeng.cn】 |