大數據學習心得
大數據學習心得
大數據中的“大”不是絕對意義上的大,雖然在大多數情況下是這個意思。大數據是指不用隨機分析法這樣的捷徑,而采用所有數據的方法。 下面是學習啦小編為大家收集整理的大數據學習心得,歡迎大家閱讀。
大數據學習心得篇1
大數據時代已經悄然到來,如何應對大數據時代帶來的挑戰(zhàn)與機遇,是我們當代大學生特別是我們計算機類專業(yè)的大學生的一個必須面對的嚴峻課題。大數據時代是我們的一個黃金時代,對我們的意義可以說就像是另一個“80年代”。 在講座中秦永彬博士由一個電視劇《大太監(jiān)》中情節(jié)來深入淺出的簡單介紹了“大數據”的基本概念,并由“塔吉特”與“犯罪預測”兩個案例讓我們深切的體會到了“大數據”的對現今這樣一個信息時代的不可替代的巨大作用。
在前幾年本世紀初的時候,世界都稱本世紀為“信息世紀”。確實在計算機技術與互聯(lián)網技術的飛速發(fā)展過后,我們面臨了一個每天都可以“信息爆炸”的時代。打開電視,打開電腦,甚至是在街上打開手機、PDA、平板電腦等等,你都可以接收到來自互聯(lián)網從世界各地上傳的各類信息:數據、視頻、圖片、音頻……這樣各類大量的數據累積之后達到了引起量變的臨界值,數據本身有潛在的價值,但價值比較分散;數據高速產生,需高速處理。大數據意味著包括交易和交互數據集在內的所有數據集,其規(guī)?;驈碗s程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數據集的能力。遂有了“大數據”技術的應運而生。
現在,當數據的積累量足夠大的時候到來時,量變引起了質變。“大數據”通過對海量數據有針對性的分析,賦予了互聯(lián)網“智商”,這使得互聯(lián)網的作用,從簡單的數據交流和信息傳遞,上升到基于海量數據的分析,一句話“他開始思考了”。簡言之,大數據就是將碎片化的海量數據在一定的時間內完成篩選、分析,并整理成為有用的資訊,幫助用戶完成決策。借助大數據企業(yè)的決策者可以迅速感知市場需求變化,從而促使他們作出對企業(yè)更有利的決策,使得這些企業(yè)擁有更強的創(chuàng)新力和競爭力。這是繼云計算、物聯(lián)網之后IT產業(yè)又一次顛覆性的技術變革,對國家治理模式、對企業(yè)的決策、組織和業(yè)務流程、對個人生活方式都將產生巨大的影響。后工業(yè)社會時代,隨著新興技術的發(fā)展與互聯(lián)網底層技術的革新,數據正在呈指數級增長,所有數據的產生形式,都是數字化。如何收集、管理和分析海量數據對于企業(yè)從事的一切商業(yè)活動都顯得尤為重要。
大數據時代是信息化社會發(fā)展必然趨勢,我們只有緊緊跟隨時代發(fā)展的潮流,在技術上、制度上、價值觀念上做出迅速調整并牢牢跟進,才能在接下來新一輪的競爭中擺脫受制于人的弱勢境地,才能把握發(fā)展的方向。
首先,“大數據”究竟是什么?它有什么用?這是當下每個人初接觸“大數據”都會有的疑問,而這些疑問在秦博士的講座中我們都了解到了。“大數據”的“大”不僅是單單純純指數量上的“大”,而是在諸多方面上闡釋了“大”的含義,是體現在數據信息是海量信息,且在動態(tài)變化和不斷增長之上。同時“大數據”在:速度(Velocity)、多樣性(Variety)、價值密度(Value)、體量(Volume)這四方面(4v)都有體現。其實“大數據”歸根結底還是數據,其是一種泛化的數據描述形式,有別于以往對于數據信息的表達,大數據更多地傾向于表達網絡用戶信息、新聞信息、銀行數據信息、社交媒體上的數據信息、購物網站上的用戶數據信息、規(guī)模超過TB級的數據信息等。
了解了“大數據”的“大”之后我們也該了解它所具有的巨大價值。就目前來說“大數據”的來源主要還是互聯(lián)網,來自互聯(lián)網上的大多數不被重視信息都是具有巨大開發(fā)價值的,
其具有巨“大”的商業(yè)價值,我們所缺少的只是一些數據分析等手段。例如:在如今,網購已經成為了一種風潮,網上也涌現了以淘寶、京東、亞馬遜等一系列的購物網站。而在這些網站之中,顧客的瀏覽記錄,購買記錄等等都是一些巨大商業(yè)價值的信息。借鑒“塔吉特”的先例,我們可以利用“大數據”技術收集分析,就可預測需求、供給和顧客習慣等,做到精準采購、精準投放,達到利益放大的效果。 從全球范圍來看,很多人都把2012年看做是大數據時代的元年。在這一年里,很多行業(yè)在大數據方面的管理、規(guī)劃和應用已經覺醒。電商、金融、電信等行業(yè)數據有著長期的數據積累。事實上,很多互聯(lián)網公司,例如亞馬遜、Google、騰訊,更愿意將自己定位為數據企業(yè)。因為信息時代,數據成為經營決策的強有力依據,給企業(yè)帶來了發(fā)展和引領行業(yè)的機遇。銀行也同樣擁有豐富的數據礦藏,不僅存儲處理了大量結構化的賬務數據,而且隨著銀行渠道快速滲透到社交網絡、移動端等媒介,海量的非結構化數據也在等待被收集和分析。未來的金融業(yè)將更多地受到科技創(chuàng)新力的驅動,也越來越傾向于零售營銷:對于金融業(yè)來說,大數據意味著巨大的商機,可強化客戶體驗,提高客戶忠誠度。大數據技術的發(fā)展帶來企業(yè)經營決策模式的轉變,驅動著行業(yè)變革,衍生出新的商機和發(fā)展契機。駕馭大數據的能力已被證實為領軍企業(yè)的核心競爭力,這種能力能夠幫助企業(yè)打破數據邊界,繪制企業(yè)運營全景視圖,做出最優(yōu)的商業(yè)決策和發(fā)展戰(zhàn)略。金融行業(yè)在大數據浪潮中,要以大數據平臺建設為基礎,夯實大數據的收集、存儲、處理能力;重點推進大數據人才的梯隊建設,打造專業(yè)、高效、靈活的大數據分析團隊;不斷提升企業(yè)智商,挖掘海量數據的商業(yè)價值,從而在數據新浪潮的變革中拔得頭籌,贏得先機
在如此快速的到來的大數據革命時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。職業(yè)規(guī)劃中,也需充分考慮到大數據對于自身職業(yè)的未來發(fā)展所帶來的機遇和挑戰(zhàn)。當我們掌握大量數據,需要考慮有多少數字化的數據,又有哪些可以通過大數據的分析處理而帶來有價值的用途?在大數據時代制勝的良藥也許是創(chuàng)新的點子,也許可以利用外部的數據,通過多維化、多層面的分析給我們日后創(chuàng)業(yè)帶來價值。借力,順勢,合作共贏。把自己的心門打開,像海綿般吸取積極、正能量的東西。
大數據學習心得篇2
4月13日下午,在湖南大學東樓205參加了關于《大數據時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數據時代的利與弊,機遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關于大數據的歷史沿革和現實意義。
一、大數據的歷史沿革及現實意義
首先,最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素。人們對于海量數 據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”“大數據”在物理學、生物學、環(huán)境生態(tài)學等領域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網和信息行業(yè)的發(fā)展而引起人們關注。大數據作為云計算、物聯(lián)網之后又IT行業(yè)又一大顛覆性的技術革命。云計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業(yè)內部的經營交易信息、物聯(lián)網世界中的商品物流信息,互聯(lián)網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現有企業(yè)IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。如何盤活這些數據資產,使其為國家治理、企業(yè)決策乃至個人生活服務,是大數據的核心議題,也是云計算內在的靈魂和必然的升級方向。
其次,進入2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發(fā)展與創(chuàng)新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網的新聞,現身在國內一些互聯(lián)網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數據正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業(yè)的重要性。正如《紐約時報》2012年2月的一篇專欄中所稱,“大數據”時代已經降臨,在商業(yè)、經濟及其他領域中,決策將日益基于數據和分析而作出,而并非基于經驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。”
最后,隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注。著云臺的分析師團隊認為,大數據(Big data)通常用來形容一個公司創(chuàng)造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯(lián)系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。“大數據”在互聯(lián)網行業(yè)指的是這樣一種現象:互聯(lián)網公司在日常運營中生成、累積的用戶網絡行為數據。這些數據的規(guī)模是如此龐大,以至于不能用G或T來衡量。大數據到底有多大?一組名為“互聯(lián)網上一天”的數據告訴我們,一天之中,互聯(lián)網產生的全部內容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當于美國兩年的紙質信件數量);發(fā)出的社區(qū)帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬……,截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規(guī)模將達到今天的44倍。
二、讀書心得體會
首先,談談大數據帶給生活的轉變。大數據已經是信息產業(yè)發(fā)展的必然趨勢,可以說,大數據現在已經開始慢慢滲透入我們的生活,如:現在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產銷售的行業(yè)利用大數據來優(yōu)化規(guī)模和實現利益最大化。而我們很多人對大數據還很陌生,只是被動的適應著大數據給生活帶來的改變。大數據時代是以云計算為基礎的,所以,要實現大數據,相關的很多的硬件設備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關產業(yè)都要重新調整產業(yè)結構,在那時,可以夸張的說,信息就是黃金,信息就是石油。大數據時代的到來會解放更多的勞動生產力,勢必將會更加加劇生產力過剩的現狀,社會兩極分化現象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數據時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時,就像現在的日本,可能想找個人聽你說說話,真的是一件很難的事。
第二,關于數據管理的看法。大數據時代,數據管理是一件很重要的工作,如何才能避免自己的數據被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟件來管理和處理數據,經常檢查更新數據庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數據一定要備份保留,而且應當做到備份與原始文件是物理隔離,無關的信息應當及時刪除,減輕硬盤的壓力。
三、怎么保護自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數據時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網絡,不要再公開的社交網絡儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機碼來保護自己真實IP地址,提高網絡安全的可靠性,加強對聯(lián)網信息的管理和保護。
三、結論
不論我們情不情愿,大數據時代都會到來,現實社會是我們高喊著走向大數據時代,其實大數據時代已經向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成為大數據時代的建設者和受益者。
大數據學習心得篇3
奧倫·艾奇奧倫(Oren Etzioni)創(chuàng)立的從文本中挖掘信息的公司ClearForest,已經被路透社收購。
美國股市每天成交量高達70億股,而其中三分二的交易都是由建產在數學模型和算法之上的計算機程序自動完成的。
farecast經過了2003年立項,到2008年被收購。經歷了5年的時間,數據從最早了12000條到2000億條。
大數據的平臺有:谷歌的MAPREDUCE 和開源HADOOP平臺(最初源于雅虎)。NOSQL更優(yōu)先于MYSQL.
大數據所用的數據記錄單位:拍字節(jié)PB(2的50次方)和艾字節(jié)EB(2的60次方),澤字節(jié)ZB (2的70次方),太字節(jié)TB。1EB=10億GB。1ZB=1024EB
20xx年,所有數據中只有7%是存儲在報紙、書籍、圖片等媒價上的模擬數據,其余全部是數字數據。
20xx年世界上存儲的數據預計能達到約1.2澤字節(jié),其中非數字數據只占不到2%。
人類存儲信息量的增長速度比世界經濟的增長速度快4倍。而計算機數據處理能力的增長速度則比世界經濟的增長速度快9倍。
大數據告訴我們“是什么”而不是“為什么”。在大數據時代,我們不必知道現象背后的原因。
大數據的算法從因果關系向相關關紗轉化。這也是思維方式的轉變。
推薦電影《點球成金》MONEYBALL
大數據的三個思維方式:
1、不要依靠分析少量的數據樣本,不要抽樣調查。要分析與某事物相關的所有數據。
2、不要追求精確性,要樂于接受紛繁復雜的數據。
3、不要探求難以捉摸的因果關系,轉而關注事物的相關關系。
大數據中的“大”不是絕對意義上的大,雖然在大多數情況下是這個意思。大數據是指不用隨機分析法這樣的捷徑,而采用所有數據的方法。
LYTOR相機(光場相機)就是對拍照場景的應用。將傳統(tǒng)相機的拍攝照片的樣本進行全收集,成為樣本=總體的應用代表。
意外的案例:
如果把一個在社區(qū)內有很多連接關系的人從社區(qū)關系網中剔除掉,這個關系網會變得沒那么高效,但卻不會解體。但是如果把一個與所在社區(qū)之外的很多人有著連接關系的人從這個關系網中剔除,整個關系網奶快就會破碎成很多的小塊。節(jié)點的做用。
社交網絡的多樣性是有額外價值的。這是一個人在社會關系網中的存在價值。
互聯(lián)網可以使數據達到精確嗎?只有5%的數據是結構化且能適用于傳統(tǒng)數據庫的。如果不接受混亂,剩下的95%的非結構化數據都無法被利用。只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。
數據與算法那個更重要呢?簡單的算法+大數據,還是復雜的算法+小數據。結論就是大數據比算法智能系統(tǒng)更重要。
大數據學習心得相關文章: