所謂大數(shù)據(jù),它是信息化到一定階段之后,必然出現(xiàn)的一個現(xiàn)象,主要是由于信息技術的不斷廉價化,以及互聯(lián)網及其延伸所帶來的無處不在的信息技術應用所帶來的自然現(xiàn)象;旧希髷(shù)據(jù)有四個驅動力,即摩爾定律所驅動的指數(shù)增長模式;技術低成本化驅動的萬物的數(shù)字化;寬帶移動泛在互聯(lián)驅動的人機物廣聯(lián)連接;云計算模式驅動的數(shù)據(jù)大規(guī)模的匯聚。
當前,大數(shù)據(jù)開啟了信息化的第三波浪潮。如果我們回顧來看,大體上能夠看到兩個明顯的階段的劃分,一個是從PC機開始進入市場以來,帶來了信息化的第一撥浪潮,這個浪潮差不多到90年代中期,這個時候的主要特征是單機應用為特征的數(shù)字化。過去的20年來,從90年代中期到現(xiàn)在,是以聯(lián)網應用為特征的網絡化,F(xiàn)在我們正在進入新的階段,即以數(shù)據(jù)的深度挖掘和融合應用為特征的智慧化。
那么,到底什么才是大數(shù)據(jù)呢?這個定義可以從兩個角度來談。從技術能力的視角來說,大數(shù)據(jù)指的是規(guī)模超過現(xiàn)有數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集,并同時強調并不是超過某個特定數(shù)量級的數(shù)據(jù)集才是大數(shù)據(jù)。
從數(shù)據(jù)內涵的視角來說,大數(shù)據(jù)是具備海量、高速、多樣、可變等特征的多維數(shù)據(jù)集,需要通過可伸縮的體系結構實現(xiàn)高度的存儲、處理和分析。
那么,大數(shù)據(jù)給我們帶來什么樣的挑戰(zhàn)呢?我覺得最重要的東西,可能帶來的是思維模式的變化。通過大數(shù)據(jù),我們能夠認識復雜系統(tǒng)的新思維,促進經濟轉型,提升國家綜合能力保障國家安全,提升政府的治理能力以及服務民生服務社會的能力。
就我個人覺得,目前來講,大數(shù)據(jù)開始還處在炒作的階段,至少在我國炒作的熱潮還沒有過去,真正的大數(shù)據(jù)應用應該體現(xiàn)在數(shù)據(jù)挖掘的深度。
這是為什么呢?原因有三點:首先有我們當前對數(shù)據(jù)認識不到位的原因,還有在當今的情況下一宣傳大家都對大數(shù)據(jù)很熱衷,使其成為獲取資源的一個途徑。第二個,是大數(shù)據(jù)投入過熱,資源的浪費比較明顯,這方面的投入特別是數(shù)據(jù)中心的投入為典。
第三個,就是我們認為大數(shù)據(jù)的理論和技術都還處于發(fā)展的早期,盡管對大數(shù)據(jù)的定義已經有了共識,但是對它的核心觀點和命題還是有很多爭議的,比如說大和小到底怎么來定義等等。此外,從我們做計算領域研究的人來講,總是希望能夠為數(shù)據(jù)的處理方式提供一種手段,但當前數(shù)據(jù)科學的理論基礎還沒有,很多數(shù)據(jù)分析的結論基本上缺少因果,缺少理論知識,都是靠關聯(lián)關系建立起來的。此外,大數(shù)據(jù)這個現(xiàn)象可能會長期的存在,對我們計算能力的挑戰(zhàn)也是永恒的。(本報記者彭科峰整理)
中國-博士人才網發(fā)布
聲明提示:凡本網注明“來源:XXX”的文/圖等稿件,本網轉載出于傳遞更多信息及方便產業(yè)探討之目的,并不意味著本站贊同其觀點或證實其內容的真實性,文章內容僅供參考。