大數據時代讀書心得體會8篇
大數據時代讀書心得體會8篇
如果讓你來寫大數據時代讀書心得體會,你知道怎么下筆嗎?我們從一些事情上得到感悟后,寫心得體會是一個不錯的選擇,這樣有利于培養(yǎng)我們思考的習慣。那么好的心得體會是什么樣的呢?下面是小編收集整理的大數據時代讀書心得體會,歡迎閱讀,希望大家能夠喜歡。
大數據時代讀書心得體會(精選篇1)
讀完《大數據時代》這本書后,我意識到:我們即將或正在迎接由書面到電子的跳躍之后的又一重大變革。
這本書介紹了大數據時代來臨后,接踵而至的三項變革——商業(yè)變革、管理變革和思維變革。
其實,這場變革已經打響。商業(yè)領域由于大數據時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優(yōu)惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢?,F(xiàn)在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
大家應該都知道2009年出現(xiàn)的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數據統(tǒng)計,而病人一般都是難以忍受病痛的折磨才會去醫(yī)院就診,因此也導致了信息的滯后。然而,對于飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發(fā)的地點,這便是基于龐大的數據資源,可見大數據時代對公共衛(wèi)生也產生了重大的影響!
在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是臺風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。于是,商家作了大膽的推測,出現(xiàn)這樣的結果源于兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬于世界頭號零售商的大數據頭腦!
大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪里是自己的家,哪里是工作單位。我們的隱私就這樣被不為人知地收集著。
大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好準備,迎接新時代的到來!
大數據時代讀書心得體會(精選篇2)
去年的“云計算”炒得熱火朝天的,今年的“大數據”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數據”來了。于是乎,各企業(yè)的CIO也將熱度紛紛轉向關注“大數據”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現(xiàn)實中小企業(yè)云計算,大數據的現(xiàn)狀。
不過話又還得說回來,《大數據時代》是本好書。
當然,很多IT知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現(xiàn)在也比較火熱的BI,覺得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘。看過此書后,感覺到之前的想法,只能算是中了一小半吧—。巨量的數據,而另一前:著眼于數據關聯(lián)性,而非數據精確性,或許才是大數據與現(xiàn)時BI的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數據的關聯(lián)性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現(xiàn)在的數據分析方法來論,更多的傾向于數據的精確性。
看完此書,我心中的一些問題:
1、什么是大數據?
查了查百度百科,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業(yè)經營決策更積極目的的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity這個好像是IBM的定義吧。
以個人的觀點來看:數據海量,存儲海量都是大數據的基本原型吧。
2、大數據適合什么樣的企業(yè)?
誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關聯(lián)性,才可以讓通過專業(yè)化的處理,讓其為企業(yè)產生價值。針對電信運營,互聯(lián)網應用這樣海量用戶的數據的大企業(yè),也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業(yè)呢?銷售訂單數據?若非百年老店,估計數據也是少得可憐,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行為分析為最多。
同樣,在公共事業(yè)類的政府機構,大數據的作用也許也能很好的發(fā)揮。反而感覺在大多數中小型企業(yè)應用大數據,似乎有點大題小作。書中說:大數據是企業(yè)競爭力。誠然,數據是一個企業(yè)的核心無形資源(利用得好的話),但是否所有的數據,或都換則方式說:所有的企業(yè)都以大數據為競爭力,是否真的合適么?是否在中小企業(yè)中,會顯示得小題大做呢?
3、大數據帶來的影響
當一波又一波的IT技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好準備,你都要開始迎接它所給你帶來的影響了。經過物聯(lián)網,云計算的推波助瀾下,大數據開始登場了。但它到底給我們帶來了什么呢?
1)預測未來書中以Google成功預測了未來可能發(fā)生流感的案例來開篇,表明通過大數據的應用,可以為我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。
2)變革商業(yè)大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業(yè)機遇與商業(yè)模式,數據的潛在價值會源源不斷地發(fā)揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業(yè)鏈產生。影響的,當然是IT公司
3)變革思維書中所說:因為有海量的數據作基礎,未來,我們可能更關注數據的相關,而非精細度。對這條,本人還是持保留意見的。
大數據時代讀書心得體會(精選篇3)
如今說起新媒體和互聯(lián)網,必提大數據,似乎不這樣說就OUT了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾舍恩伯格何許人也?他現(xiàn)任牛津大學網絡學院互聯(lián)網研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學肯尼迪學院信息監(jiān)管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數據時代的。預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業(yè)變革和管理變革。
在第一部分”大數據時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。對于第一個觀點,我不敢茍同。
一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數據分析難道也要采集全體數據嗎?
我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統(tǒng)計方法來進行分析,并不一定需要全部數據。聯(lián)系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限于目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思?!贝髷祿暮唵嗡惴ū刃祿膹碗s算法更有效?!案哂泻暧^視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同?!辈皇且蚬P系,而是相關關系?!安恍枰馈睘槭裁础?,只需要知道”是什么“。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因后果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出”不是因果關系,而是相關關系?!斑@一論斷時,他在書中還說道:”在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續(xù)向更深層次研究的因果關系,找出背后的‘為什么’?!癧i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業(yè)變革。舍恩伯格認為數據化就是一切皆可”量化“,大數據的定量分析有力地回答”是什么“這一問題,但仍然無法完全回答”為什么“。因此,我認為并不能排除定性分析和質化研究。數據創(chuàng)新可以創(chuàng)造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置于數據應用的商業(yè)系統(tǒng)中,而沒有把它置于整個社會系統(tǒng)里,但他在第二部分大數據時代的管理變革中討論了這個問題。
在風險社會中信息安全問題日趨凸顯。如何擺脫大數據的困境?舍恩伯格在最后一節(jié)”掌控“中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:”大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考的答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!爸x謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標準答案,只是參考的答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什么叫數據?什么叫大數據?數據分析與數據挖掘的區(qū)別,數字化與數據化有什么不同?讀前做些功課讀起來就比較好懂了。
大數據時代讀書心得體會(精選篇4)
信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變我們這樣評論著的信息時代已經變?yōu)樵?。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什么信息時代轉變?yōu)榱舜髷祿r代?大數據時代帶給了我們什么?
信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發(fā)展中的動態(tài)范疇,是進行互相交換的內容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動態(tài)、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發(fā),只是當數據爆發(fā)到無法駕馭的狀態(tài),大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區(qū)別:
1、思維慣例。大數據時代區(qū)別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區(qū)別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉。
2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。
3、結構。大數據更多的體現(xiàn)在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立處理非結構化數據的方法,處理結果與未來進行驗證。
4、分析基礎。大數據是在互聯(lián)網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
數據未來的故事。數據的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數據的潛質??蛻魯祿?、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應變革,適者生存。我們可以有更廣闊的業(yè)務發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經營管理能力可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設“數據倉庫”,培養(yǎng)“數據思維”,養(yǎng)成“數據治理”,創(chuàng)造“數據融合”,實現(xiàn)“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
大數據時代讀書心得體會(精選篇5)
這本書里主要介紹的是大數據在現(xiàn)代商業(yè)運作上的應用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20__年美國的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區(qū)間為3%,這個數字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯(lián)網終端與計算機的出現(xiàn)使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的`測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現(xiàn)過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數據時代催生的重要職業(yè)——數據科學家,這是一群數學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網站發(fā)表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
大數據時代讀書心得體會(精選篇6)
讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數據時代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想?!薄半S著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們人類的數據收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事??纱髷祿摹安皇且蚬P系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷祿r代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數據時代的邏輯思維。
大數據時代讀書心得體會(精選篇7)
《大數據時代》是英國維克托·邁爾—舍恩伯格教授的著作,這本書也被尊為國外大數據研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數據的方方面面做了詳細解說,讓外行也很容易理解。結構上,作者通過大數據時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。
所謂"大數據",按作者的說法,就是"所有數據"。隨著計算機運算速度和存儲能力的發(fā)展,收集數據變得越來越簡單,儲存數據的成本越來越低。在過去,由于技術限制,人們做統(tǒng)計時只能收集有限的數據做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結果往往不能重復使用,造成數據利用率低。而現(xiàn)在則可以做到"樣本=總體"。數據的增多帶來不可避免的精確性問題。"小數據"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數據"時代對精確性不再那么要求苛刻——也無法要求太嚴格——數據的數量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數據時代,我們應該從追求"因果關系"的舊思維方式向追求"相關關系"轉變。
在我看來,這實際上是通過大數據來透視一種事物的發(fā)展趨勢,而很多精確學科領域依然需要探尋"因果關系"解決更有針對性的問題,所以,這局限了這一轉變只能在特定的領域發(fā)生。作者自己也說,"大數據的相關性將人們指向了比探討因果關系更有前景的領域。"
大數據時代的數據獲取方式是多種多樣,數據形式也是千變萬化,任何文字、行為、萬物都可以被數據化后用來分析。對這些數據的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數據的利用率。當然數據并不是無限使用,時效、環(huán)境的變化肯定會對數據提出新的要求,所以數據的折舊也是應當考慮的。這又引出了對數據這一無形資產的估值可能性。對于這樣的公司來說,數據就是他們的核心,如何在資產負債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。
大數據時代的價值鏈由三部分構成,我把它們簡化為"生產—分析—使用"三個環(huán)節(jié),這對應書中的三種類型公司:第一種是基于數據本身的公司,第二種是基于技能,第三種則是基于思維。在大數據早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數據本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數據的用途。
對于普通人來說,大數據時代最關心的`還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流于形式的使用授權。大數據甚至能預測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。
大數據時代的風險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數據的準確度或有效性進行鑒定。這能在一定程度上防止數據濫用的發(fā)生和數據獨裁。當今的法律亦需對大數據監(jiān)管進行修訂補充。
當代大數據發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領域會意識到大數據的重要性。但我們也應該保持清醒,大數據并不是萬能藥,對某些領域或環(huán)節(jié),使用大數據是一種簡單且實用的選擇;但對某些領域,盲目使用大數據只會適得其反。
大數據時代讀書心得體會(精選篇8)
4月13日下午,在湖南大學東樓205參加了關于《大數據時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數據時代的利與弊,機遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關于大數據的歷史沿革和現(xiàn)實意義。
首先,最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來?!薄按髷祿痹谖锢韺W、生物學、環(huán)境生態(tài)學等領域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網和信息行業(yè)的發(fā)展而引起人們關注。大數據作為云計算、物聯(lián)網之后又IT行業(yè)又一大顛覆性的技術革命。云計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業(yè)內部的經營交易信息、物聯(lián)網世界中的商品物流信息,互聯(lián)網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現(xiàn)有企業(yè)IT架構和基礎設施的承載能力,實時性要求也將大大超越現(xiàn)有的計算能力。如何盤活這些數據資產,使其為國家治理、企業(yè)決策乃至個人生活服務,是大數據的核心議題,也是云計算內在的靈魂和必然的升級方向。
其次,進入2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發(fā)展與創(chuàng)新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮的新聞,現(xiàn)身在國內一些互聯(lián)網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數據正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業(yè)的重要性。正如《紐約時報》2012年2月的一篇專欄中所稱,“大數據”時代已經降臨,在商業(yè)、經濟及其他領域中,決策將日益基于數據和分析而作出,而并非基于經驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程?!?/p>
最后,隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注。著云臺的分析師團隊認為,大數據(Big data)通常用來形容一個公司創(chuàng)造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯(lián)系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作?!按髷祿痹诨ヂ?lián)網行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網公司在日常運營中生成、累積的用戶網絡行為數據。這些數據的規(guī)模是如此龐大,以至于不能用G或T來衡量。大數據到底有多大?一組名為“互聯(lián)網上一天”的數據告訴我們,一天之中,互聯(lián)網產生的全部內容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當于美國兩年的紙質信件數量);發(fā)出的社區(qū)帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬……,截止到__年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,__年全球產生的數據量為0.49ZB,__年的數據量為0.8ZB,__年增長為1.2ZB,__年的數量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而到__年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB.IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了__年,全世界所產生的數據規(guī)模將達到今天的44倍。
首先,談談大數據帶給生活的轉變。大數據已經是信息產業(yè)發(fā)展的必然趨勢,可以說,大數據現(xiàn)在已經開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產銷售的行業(yè)利用大數據來優(yōu)化規(guī)模和實現(xiàn)利益最大化。而我們很多人對大數據還很陌生,只是被動的適應著大數據給生活帶來的改變。大數據時代是以云計算為基礎的,所以,要實現(xiàn)大數據,相關的很多的硬件設備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關產業(yè)都要重新調整產業(yè)結構,在那時,可以夸張的說,信息就是黃金,信息就是石油。大數據時代的到來會解放更多的勞動生產力,勢必將會更加加劇生產力過剩的現(xiàn)狀,社會兩極分化現(xiàn)象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數據時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時,就像現(xiàn)在的日本,可能想找個人聽你說說話,真的是一件很難的事。
第二,關于數據管理的看法。大數據時代,數據管理是一件很重要的工作,如何才能避免自己的數據被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟件來管理和處理數據,經常檢查更新數據庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數據一定要備份保留,而且應當做到備份與原始文件是物理隔離,無關的信息應當及時刪除,減輕硬盤的壓力。
三、怎么保護自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數據時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網絡,不要再公開的社交網絡儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機碼來保護自己真實IP地址,提高網絡安全的可靠性,加強對聯(lián)網信息的管理和保護。