大資料時代心得體會範文
《大資料時代》這本書的結構框架遵從了學術性書籍的普遍方式,也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋,然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。下面是小編為大家收集整理的,歡迎大家閱讀。
篇1
讀了《大資料時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎麼明瞭到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰慄起來。
“在小資料時代,我們會假象世界是怎樣運作的,然後通過收集和分析資料來驗證這種假想。”“隨著由假想時代到資料時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜誌主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大資料是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域裡隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們人類的資料收集和處理能力達到拍位元組甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大資料時代》第16頁“大資料的核心就是預測”。邏輯是——描述時空資訊“類”與“類”之間長時間有效不變的先後變化關係規則。兩者似乎是做同一件事。可大資料要的“不是因果關係,而是相關關係”,“知道是什麼就夠了,沒必要知道為什麼”,而邏輯學四大基本定律同一律、矛盾律、排中律和充足理由律中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關係。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關係,因為爸爸就是爸爸,兒子就是兒子。那麼大資料會不會通過正視混雜性,放棄因果關係最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大資料時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
還好我知道自己對什麼統計學、量子力學、邏輯學和大資料來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大資料時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大資料時代的邏輯思維。
篇2
資訊時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論著的資訊時代已經變為曾經。如今,大資料時代成為炙手可熱的話題。筆者在這說明資訊和資料,只是試圖首先說明資訊、資料的關係和不同,也試圖說明,為什麼資訊時代轉變為了大資料時代?大資料時代帶給了我們什麼?
資訊和資料的定義。維基百科解釋:資訊,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態範疇,是進行互相交換的內容和名稱,資訊的界定沒有統一的定義,但是資訊具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。資料:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成資訊和知識的原始材料。資料可分為模擬資料和數字資料兩大類。資料指計算機加工的“原料”,如圖形、聲音、文字、數、字元和符號等。從定義看來,資料是原始的處女地,需要耕耘。資訊則是已經處理過的可以傳播的資訊。資訊時代依賴於資料的爆發,只是當資料爆發到無法駕馭的狀態,大資料時代應運而生。這是否是《大資料時代》一書所未曾闡述的背景材料?
在《大資料時代》一書中,大資料時代與小資料時代的區別:1、思維慣例。大資料時代區別與轉變就是,放棄對因果關係的渴求,而取而代之關注相關關係。也就是說只要知道“是什麼”,而不需要知道“為什麼”。作者語言絕對,卻反思其本質區別。資料的更多、更雜,導致應用主意只能儘量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小資料停留在說明過去,大資料用驅動過去來預測未來。筆者認為資料的用途意在何為,與資料本身無關,而與資料的解讀者有關,而相關關係更有利於預測未來。3、結構。大資料更多的體現在海量非結構化資料本身與處理方法的整合。大資料更像是理論與現實齊頭並進,理論來創立處理非結構化資料的方法,處理結果與未來進行驗證。4、分析基礎。大資料是在網際網路背景下資料從量變到質變的過程。筆者認為,小資料時代也即是資訊時代,是大資料時代的前提,大資料時代是昇華和進化,本質是相輔相成,而並非相離互斥。
資料未來的故事。資料的發展,給我們帶來什麼預期和啟示?銀行業天然有大資料的潛質。客戶資料、交易資料、管理資料等海量資料不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於資料的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“資料倉庫”,培養“資料思維”,養成“資料治理”,創造“資料融合”,實現“資料應用”才能擁抱“大資料”時代,從資料中攫取價值,笑看風雲變換,穩健贏取未來。
篇3
這本書裡主要介紹的是大資料在現代商業運作上的應用,以及它對現代商業運作的影響。
《大資料時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大資料時代》這本書的主要內容。
《大資料時代》開篇就講了Google通過人們在搜尋引擎上搜索關鍵字留下的資料提前成功的預測了20XX年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後才可以弄到相關的資料。同時Google的預測與政府資料的相關性高達97%,這也就意味著Google預測資料的置信區間為3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大資料時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大資料時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性資料將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代資料的獲取與儲存處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而網際網路終端與計算機的出現使資料的獲取、儲存與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大資料時代的主流,同時大資料時代本身也是建立在大批量資料的儲存與處理的基礎之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯絡Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大資料時代對準確性的追求並不是特別明顯,但是相反大資料時代是建立在大資料的基礎住上的,所以大資料時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的資料會湮埋少數有問題的資料所帶來的影響。同時大量的資料也會無限的逼近事物的原貌。
之後,維克托又預測了一個在大資料時代催生的重要職業——資料科學家,這是一群數學家、統計學與程式設計家的綜合體,這一群人將能夠從獲取的資料中得到任何他們想要的結果。換言之,只要資料充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群傢伙的面前展現得淋漓盡致。所以為了避免個人隱私在大資料時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用資料為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用資料,是否侵犯了個人隱私。
無論如何,大資料時代將會到來,不管我們接受還是不接受!
我覺得《大資料時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“資料科學家”們利用,從而再將相關資料賣給各大網店。不過,事實就是我們將會成為被預測被引誘的物件。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
團隊打造心得_團隊打造心得體會