網站首頁 個人文檔 個人總結 工作總結 述職報告 心得體會 演講稿 講話致辭 實用文 教學資源 企業文化 公文 論文

《大數據時代》讀書報告

欄目: 讀後感 / 發佈於: / 人氣:1.66W

《大數據時代》是英國維克托·邁爾-舍恩伯格教授的著作,被公認為是國內外大數據研究的先河之作。作者通過枚舉了上百個例子,對大數據的方方面面進行了系統、詳細解説,讓每一名讀者,即使是外行也能很容易理解,直觀感受到大數據給社會和生活帶來的改變。

《大數據時代》讀書報告

在本書中,對於大數據時代,作者主要提出了三個核心觀點: 1、要全體不要抽樣。分析與某事物相關的所有數據,而不是依靠分析少量的數據樣本。2、要效率不要絕對精確。我們樂於接受數據的紛繁複雜,而不再追求精確性。3、要相關不要因果。我們不再探求難以捉摸的因果關係,轉而關注事物的相關關係。

這三個觀點在某種程度上顛覆了我們的傳統思想。

要全體不要抽樣

傳統的統計學方法是解決如何通過選取少量樣本,通過對樣本的分析,然後推斷整體的趨勢和規律。而大數據時代告訴我們“樣本=全體”,在很多時候,我們不再需要費心去考慮樣本抽樣、數據過濾等問題。我們利用大量數據,甚至是所有數據,然後用算法去計算分析,從而更精準的找到各個因素之間的相關關係(不是因果關係),以發現數據之間的規律。

要效率不要絕對精確:

在傳統的統計學中,由於抽樣的限制,研究往往會對精確度做很嚴格的要求,譬如置信區間的概念。而大數據時代會把這些條件放的更寬鬆。我們要學會在精度和效率之前做取捨,要能夠容忍錯誤,學會在瞬息萬變的信息中掌握趨勢,為下一刻的決策提供依據,這就夠了。正如作者所説:“接受數據的不精確和不完美,我們反而能夠更好地進行預測,也能夠更好地理解這個世界。”

要相關不要因果:

這個觀點也區別於我們傳統的教育理念。我們習慣於“打破砂鍋問到底”、“舉一反三”式的教育方式。當我們找到了自以為是的答案時,其實可能只是冰山一角,探索事物背後本質的動機不能停止。但大數據時代告訴我們要放棄對因果關係的渴求,取而代之關注相關關係。也就是説只要知道“是什麼”,而不需要知道“為什麼”。

上述作者提出的三個觀點對於大數據的發展具有深遠的指導意義。我也深信這三個觀點在未來也將長久地改變着我們的社會和生活。對於大數據,接下來我也想談一談個人的理解和認識。

大數據時代,統計學依然是數據分析的靈魂。大數據時代提出的觀點是“樣本=全體”,因此,有一部分人甚至拋出了大數據時代統計無用的觀點。他們認為數據中包含了所有的意義,只要計算能力足夠強大,就不需要什麼理論。但是他們似乎忘了,數據≠信息。一方面,大數據採集的數據是原油而非汽油,不能夠直接拿來使用,另一方面,大數據中“全”的概念本身就難以界定。“全”在某種意義上也是一種邊界。但如何確定這種邊界進而進行數據的全面收集,本身就是一件困難的事情。因此,在大數據時代,數據分析的很多根本性問題和小數據時代並沒有本質區別。它在某種程度上是樣本的無限放大。

 大數據的根基是“數據”。數據是大數據發展的前提。如果沒有有效的數據,大數據技術也只是空中樓閣。因此,一方面,如何積累豐富的數據資源,是我們急需解決的問題,另一方面,對於已有的數據資源,如何有效地利用,提高數據標準化、準確性、完整性水平,也需要我們思考。就目前來看,大數據的未來更加關注的是“社會化大數據”,即人和人的關係、人和數據之間的關係。通過對社會化數據分析,使得我們能夠對人、社會和商業有更加深入的理解。這也解釋了為什麼在美國,很多人認為Facebook的價值在某種程度上要大於谷歌。因此,企業在日常運行中,要注重積累這方面的數據資源,同時要配套相應的數據採集標準和方法,最大程度提高數據利用價值。

大數據的關鍵是處理。大數據的核心價值是預測。但大數據的特點對數據分析的確提出了全新挑戰。面對海量的數據,如何尋找快速有效的方法進行分析挖掘,為我們的決策提供依據也是擺在我們面前的一個難題。對此問題,一方面我們可以結合傳統統計方法,對結構複雜、來源多樣的數據建立有效統計模型,先行對數據進行加工處理。另一方面,需要開發先進的軟件平台和算法,例如目前已有的Hadoop、MapReduce等,儘可能用低成本和擴拓展的方式處理大數據。

    總而言之,大數據很精彩。對於企業來講,一方面需要挖掘更多創造數據的渠道,另一方面要提升數據處理挖掘的能力,最為關鍵的是找到數據和應用的結合點,這樣才能乘着大數據東風,讓企業發展更上一個台階。

Tags:讀書 報告