帶您了解大數據

 大數據     |線西      2018-03-12 10:34

 

第三次浪潮的華彩樂章

  1980年,著名未來學(xué嗎視)家阿爾文·托夫勒便在《件工第三次浪潮》一書中,將(jiāng)大數據熱情地贊頌爲“第三次月城浪潮的華彩樂章”。大約從2009年開(kāi)始,“站山大數據”成(chéng)爲互聯網信息技術行業的流行詞彙。

  什麼(me)是大數據

  1980年,著名未來學(xué)家阿爾文&mid懂黃dot;托夫勒便在《第三次浪潮》一書中劇微,將(jiāng)大數據熱情地贊頌爲“第三次浪潮的華彩樂購又章”。大約從2009年開(kāi)始,“大數據”成(chéng)爲門書互聯網信息技術行業的流行詞彙。

  大數據,或稱巨量數據、海量數據;是由數量巨大、都師結構複雜、類型衆多數據構成(chéng)低舞的數據集合,是基于雲計算的數據處理與應用模式,通過(gu花鐵ò)數據的集成(chéng)共享,交叉複用形成(chéng)的智力資源和人山知識服務能(néng)力。

  有研究機構如此定義“大數據”:“大數據”是需要新處理模作離式才能(néng)具有更強的決策力、洞察發(fā)現力和流程優化能(n湖鐘éng)力的海量、高增長(cháng)率和多樣(yàng)化的信息資産。從某種見火(zhǒng)程度上說(shuō),大數據是數據分析的前沿秒制技術。簡言之,從各種(zhǒng)各樣(yàng)類型的數據中,快速獲得呢城有價值信息的能(néng)力,就(jiù)是大器藍數據技術。

  大數據從何而來

  美國(guó)互聯網數據中心指出,互聯網上的數據每年將(j務務iāng)增長(cháng)50%,每兩(liǎng)年便鄉校將(jiāng)翻一番,目前世界上9月舊0%以上的數據是最近幾年才産生的。此外做跳,全世界的工業設備、汽車、電表上有著(zhe)無數的數碼傳感器,随時木見(shí)測量和傳遞著(zhe)有關位置、運動、震動、溫校討度、濕度乃至空氣中化學(xué男師)物質的變化,也産生了海量的數據信息。

  物聯網、雲計算、移動互聯網、車聯網、手機、平闆電腦、PC以及各聽懂種(zhǒng)各樣(yàng)的傳感作國器,無一不是數據來源或者承載的方式。

  大數據有多大

  僅以互聯網爲例,一天之中,互聯網産生的全部内容可以刻滿1.68億張D文黑VD;發(fā)出的郵件有294朋市0億封之多;發(fā)出的社區帖子達200萬個,相當于《時(shí)坐老代》雜志770年的文字量……

  截止到2012年,數據量已經(jīng)從TB(1024GB=1TB得中)級别躍升到PB(1024TB=1PB)、EB(102亮習4PB=1EB)乃至ZB(1024EB=時費1ZB)級别。國(guó)際數據公司(IDC)的研議一究結果表明,2008年全球産生的數據量高達1.82ZB,相些廠當于全球每人産生200GB以上的數據。而到明廠2012年爲止,人類生産的所有印刷材料的數據量是200PB,全人作些類曆史上說(shuō)過(guò)的所有話的數據腦我量大約是5EB。IBM的研究稱,整個人類文明所好輛獲得的全部數據中,有90%是過(guò)去兩(liǎng)年内産生這他的。而到了2020年,全世界所産生的數據規模將(jiāng)達到今些話天的44倍。

  大數據的“4個V”

  大數據的4個“V”指的是大數據的4個特點:第一,森下數據體量巨大。從TB級别,躍升到PB級别;第二,數據類型繁多,數據就不來源于各種(zhǒng)各樣(yàng)的渠道(dào)。第三場笑,價值密度低,商業價值高。以視頻爲例,連續花火不間斷監控過(guò)程中,可能(néng)有用的數據僅影校僅有一兩(liǎng)秒。第四,處理速度快。一般要在秒級時(shí)間範放跳圍内給出分析結果,時(shí)間太長(cháng)就(ji樹內ù)失去價值了。這(zhè)個速度要求是大數據處理個新技術和傳統的數據挖掘技術最大的區别。

  由此,業界將(jiāng)大數據的特點歸納爲4個“V”——秒他Volume(大量)、Velocity(高速)、Var街車iety(多樣(yàng))、Veracity(精紙理确)。

  什麼(me)是雲計算?

  雲計算(cloud computing)物月是通過(guò)互聯網把多個成(綠拍chéng)本較低的計算實體整合成(chén吧可g)一個具有強大計算能(néng自空)力的完美系統。簡單理解就(jiù)是,運營公司提供服務器、應用程序、存拍吃儲空間,用戶通過(guò)網絡遠程登錄服務器,并按照需要使用這(zhè)些影新存儲空間和應用程序。狹義雲計算是指I站可T基礎設施的交付和使用模式,指大兵通過(guò)網絡以按需、易擴展的方式獲得所需資源;樹票廣義雲計算指服務的交付和使用模式,指通過(guò)網絡以說聽按需、易擴展的方式獲得所需服務。它意味著(zhe)計算能(né北靜ng)力也可作爲一種(zhǒng)商品通過(g裡樂uò)互聯網進(jìn)行流通和交易。

  大數據與雲計算

 

 

 

 

 

  從技術上看,大數據與雲計算的關系就(jiù)像一枚硬币的正反面(姐大miàn)一樣(yàng)密不可分。大數據必然無法用著湖單台的計算機進(jìn)行處理,司電必須采用分布式計算架構。它的特色在于對(duì)海如舞量數據的挖掘,但它必須依托雲計算的分布式處水影理、分布式數據庫、雲存儲和虛拟化技術。

  數字時(shí)代的石油與黃金

  一分鍾内,微博推特上新發(還見fā)的數據量超過(guò)10萬;社交網絡“日志臉譜”的浏覽量超過(guò)600萬……

  巨大的數據量,意味著(zhe)什麼(me)?

  大數據對(duì)社會(huì)經(jīng)濟生活産生的影響絕不限是火于技術層面(miàn),它爲我們看待世界提供了一種(zhǒ上用ng)全新的方法,即決策行爲將(jiāng)日益基于數據分析做出,而不是像過費能(guò)去更多憑借經(jīng)驗司媽和直覺做出。

  “這(zhè)是一場革命,龐大的數據資源使得費外各個領域開(kāi)始了量化進(jìn)程,無論學(xué)術界、商界還(há工綠i)是政府,所有領域都(dōu)將(ji又睡āng)開(kāi)始這(zhè)種(zh月城ǒng)進(jìn)程。”哈佛大學(xué)社會(huì)子事學(xué)教授加裡(lǐ)&mid舞事dot;金指出。

  業内人士指出,大數據是一種(zhǒng)全新的緻富手段,它的價值堪比石油船信和黃金。

  雖然大數據在國(guó)内還(hái)處于河呢初級階段,但是商業價值已經(jīng)顯現出票錢來。首先,手中握有數據的公司站在金礦上,基于數據交易即可産生很好(h謝風ǎo)的效益;其次,基于數據挖掘說可會(huì)有很多商業模式誕生,定位角度不同,或側重數據分析。比如幫企業做内山市部數據挖掘,或側重優化,幫企業更精準找到用戶,降低營銷成(c那很héng)本,提高企業銷售率,增加利潤。

  數據——

  未來最大的交易商品

  未來,數據可能(néng)成(chéng)爲最大的交易商靜風品。

  IBM執行總裁羅睿蘭認爲,“數據將(jiāng)成(ch技物éng)爲一切行業當中決定勝負的根本因素,最終數據將(jiāng)成話來(chéng)爲人類至關重要的自然資源。”

  大數據的價值是通過(guò)數據共享頻村、交叉複用後(hòu)獲取最大的數據價值討物。麥肯錫則預測未來大數據産品在三大行業的應用就(jiù)將(jiān見路g)産生7千億美元的潛在市場,中聽地國(guó)大數據産品的潛在市場規模有望達日人到1.57萬億元,給IT行業開(kāi)拓了新的黃金時(shí)代的很。

  大數據正在重構很多傳統行業。通過(g民開uò)收集、整理生活中方方面(miàn)面(海員miàn)的數據,并對(duì)其進(jìn)行分析挖掘,進(下短jìn)而從中獲得有價值信息,最終衍化出新的商業模式。麥當勞、肯德綠山基以及蘋果公司等旗艦專賣店的位置都女市(dōu)是建立在數據分析基礎之上的精準選址。在零明呢售業中,數據分析的技術與手段更得到廣水微泛的應用,卓越亞馬遜、淘寶等通過(guò)對(duì)海量數據的掌握和分析,好坐爲用戶提供更加專業化和個性化的說國服務。

  與此同時(shí),大數據在社會(huì)管理等方面(mià笑車n),也具有不可替代的重大價值。