大資料能夠改變什麼
大資料***big data,mega data***,或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的資訊資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中大資料指不用隨機分析法***抽樣調查***這樣的捷徑,而採用所有資料進行分析處理。大資料的4V特點:Volume***大量***、Velocity***高速***、Variety***多樣***、Value***價值***。一起來看看吧!
1、大資料時代來了
隨著社交網路的逐漸成熟,移動頻寬迅速提升,雲端計算、物聯網應用更加豐富。更多的感測裝置、移動終端接入到網路,由此產生的資料及增長速度將比歷史上的任何時期都要多,都要快。未來的十年將是一個“大資料”引領的智慧科技的時代。
時過年中,方凡對“幸福的煩惱”體會逾深。他是北京水晶石數字科技有限公司的CIO,重要的職責就是為這個龐大的“視覺展示製造器”提供源源不斷的計算支援。公司自2008年北京奧運會一舉成名後,包括上海世博會、深圳大運會和倫敦奧運會在內的大型訂單相繼而至,“生意最近好的不得了”,他也成為了公司最忙碌的人之一。
此時的水晶石正站在一個臨界點上,營業額將由8億元繼續攀升,員工近3300人,經常要承接其他公司所無法拿下的大型訂單。同時,一些新的業務模式也正被創造出來。比如,水晶石為萬科、SOHO中國等房地產企業打造線上房產服務,顧客在網上瀏覽時,可以從各個角度考察房源,甚至可以自己動手進行DIY模擬裝修。
在方凡看來,水晶石能夠成為行業翹楚,多年來在大資料上積累的雄厚實力十分關鍵。視覺展示行業極度依賴資料,水晶石每年的資料量都要增長上百個PB,背後需要龐大的計算、儲存和網路能力的支撐。簡單一點來說,渲染一個大型的高清影象,別人需要100個小時,水晶石卻可以調動3倍以上的計算資源和人員儲備,在10個小時內完成。
“大資料融入企業越深,就越考驗企業的投資和儲備能力,企業的級別將立判高下。”方凡甚至表示,視覺展示行業已經進入一個為大資料不斷燒錢的階段。
麥肯錫全球研究院對這樣的趨勢做了專門研究,其釋出的《大資料:創新、競爭和生產率提高的前沿領域》報告稱,大資料將大幅提升傳統行業的運營效率,並催生更多的新型業務應用和商業模式,而有效投資和利用大資料,已經成為了行業領軍者的制勝法寶。
2、企業與大資料結緣
多年來,有關海量資料的討論已讓人審美疲勞,現在又提出大資料,究竟有何不同?是否有炒作的嫌疑?一個有趣的現象是,包括IBM、HP、Oracle、SAP等跨國IT巨頭,諮詢公司以及歐美企業對大資料的討論趨於熱烈,剔除其中的炒作成分,不乏有價值的技術解決方案和最佳實踐,而多位國內CIO坦稱也正在關注大資料。
有不少人正在嘗試勾勒大資料的面貌,讓其由模糊走向清晰。IDC全球儲存及大資料研究專案副總裁一直在研究大資料,簡單一點說,大資料不僅僅是海量資料,它更為複雜,更追求資料處理的速度,企業也更注重挖掘其中的價值。
華爾街老兵,投資公司創始人羅傑?依倫伯格最近也撰文暢談所看到的大資料投資前景:“我們還處在這場由資料驅動的革命的初始階段。現今,這些機遇已讓人興奮不已,未來,這些機遇所能帶來的變革必將超乎我的想象。”
這些判斷似乎都能自圓其說,但對於講求實際效益的商業世界而言,大資料究竟能帶來多大的改變?
作為中信銀行信用卡中心資料倉庫室專案總監,顧小波明顯感覺到新的挑戰正在來臨。隨著中信銀行信用卡使用者突破1100萬,需要挖掘的資料量正在膨脹,傳統利用SPSS統計分析軟體建模的方式已經有些力不從心,而如果採用抽樣統計分析的方式,有些新的使用者行為特徵或業務趨勢就會被忽略。
更重要的是,隨著銀行信用卡競爭已經從初期“跑馬圈地”進入精細化耕作的新階段,使用者使用行為的資料量增長已經快過新增使用者的增速,原先寬鬆和粗獷的大筆投資已不可能,銀行需要將更多的精力放在維護客戶和挖掘客戶價值上面,以獲得更多的收益。
多年前,中信銀行率先將信用卡使用者分析資料應用於電話銷售業務中,坐席人員不再是大海撈針式的忙碌,中信銀行的電話保險業務購買率一年內就實現了30%的增長。現在,顧小波正推動信用卡資料倉庫部門與更多的業務部門進行對接。
比如,現在中信銀行的使用者只需刷卡三筆,立刻就能享受到9元購買電影票的優惠。在以前,中信銀行的核心業務系統在處理完當天的交易資訊後,再過幾天,才能被識別出滿足促銷條件的使用者。
同時,顧小波還在對中信信用卡網站的使用者使用行為進行分析,這些非結構化資料以前是被忽略的,現在中信已可以及時瞭解使用者在哪一步放棄了哪項業務,從而改正網站業務設計中的不足。
中信銀行信用卡部門在大資料中面臨的挑戰與機遇,幾乎大部分的企業都會遇到,這也是大資料與以往所提的資料探勘與商業智慧的不同之處:一是資料量快速攀升,傳統的資料探勘工具已經無法應對全量分析的需求;二是對於資料處理速度的要求越來越高,更快的速度意味著更好的使用者體驗和更迅即的商業決策;三是非結構化資料的挑戰日增,有效的收集和處理將帶來更多的業務價值。
在支付寶,大資料正影響著公司從上到下的決策和業務運作。目前,通過利用“PC伺服器叢集+開源軟體”、採用資料庫軟體等手段,支付寶每天可以對僅300億條使用者交易資料進行查詢,結果可以在20毫秒內返回。
這帶來了兩大好處:一是可以有效控制風險,一旦使用者在超乎常規的地點登陸,或者進行超過2000元以上的大額轉賬,支付寶會根據對使用者使用行為的歷史分析,進行主動的風險攔截;二是可以進行實時的營銷業務推送,比如使用者一旦購買了珠寶等高價商品,支付寶會立刻向其推送一個消費紅包,馬上就可以進行二次消費,以增強使用者粘性。
蔣傑認為,做到這一切的祕訣在於支付寶正實現online與offline資料探勘的融合,這使得商業智慧已不僅僅是針對歷史資料的分析和報表呈現,而是可以做一些針對大資料的實時處理結果,實現對業務應用的可伸縮性調整。例如,廣告營銷業務部門可以通過利用支付寶資料庫的分析資料,監控營銷活動的效果,一旦不為使用者接受,就立刻做出調整,而網站UI設計師也可以從使用者訪問軌跡中,探尋到導致使用者放棄購買行為的設計缺陷,從而進行設計優化。
“支付寶已經成為資料化運營的公司,從CEO到業務人員以及資料探勘分析師,都有利用資料探勘的場所,可以說是全員資料化,大資料已經成為支付寶最大的財富。”目前,支付寶的使用者已超6億,預計今年年底資料量會增至1.8PB,蔣傑總結出一個定律:支付寶的交易量每年會翻倍,而資料量增長則會增長四倍左右。對於支付寶而言,這將是企業資料化生存的重要機遇。
某種程度上說,大資料也強調商業智慧的重要性,但它呈現出來的新特性,正試圖超越商業智慧的範疇,從而開闢企業進行商業優化的新疆界。
3、大資料引領行業變革
去年10月,北京海淀區稻香湖金融服務區的200畝地被“圈走”,這裡將籌建證券行業的行業資料中心,屆時,各大券商將把自家資料共享至此,一方面省去了自建災備中心的投入,另一方面這個資料中心將為整個行業提供全新的增值服務。
民族證券總工程師馬光悌參與了該專案的認證和籌劃,並將其視為“影響整個行業的大事件”。在他看來,行業資料中心是證券行業應對大資料的有益嘗試,憑藉其計算能力,證券公司可以對當天的交易資料進行更為迅速的分析,響應速度將獲得提升。同時,共享的行業資料可以使得券商拿到更為全面和準確的行業分析結果,這是券商自建資料中心所不能獲得的增值服務。
在不久的將來,大資料或許能呈現出改變整個行業的力量。
國家電網公司去年建成了電力雲模擬實驗室,其中一個重要課題就是如何解決海量資料儲存與運算的難題。國網信通公司雲端計算與資訊資源中心主任吳凱峰表示,大資料是國網實現智慧電網必須要面臨的挑戰,一方面,國網在輸電線路上佈設了大量的監控點,每秒都要傳回海量資料,同時,智慧電錶實現規模推廣後,電網公司需要縮短用電資料的收集時間,資料量也將激增。
“這就出現一個難題,就是如何在下一個資料採集高峰期來臨之前,將上一次取樣結果計算出來。而準確分析使用者的用電行為,將為制定階梯電價,以及達到輸電與用電的平衡,提供重要的決策支援。”吳凱峰稱,相關解決方案還在測試當中,但有效應對大資料的挑戰,將是實現電網互動的關鍵之一。
不過,國網公司的智慧互動嘗試並不僅限在電力行業,它正試圖推動相關行業的產業變革。在國網對於未來智慧電網的藍圖中,已經將版圖擴張至電動汽車與充電設施、家庭新能源利用、智慧家居和電力光線到戶等領域。
為此,國網今年將大力建設67座智慧變電站,推廣應用5000萬具智慧電錶,並新建173座充換電站和9211個充電樁,完成25個智慧小區/樓宇建設。
據業內人士分析,智慧電網相關產業要從試點走向快速發展,它們與電網公司的智慧對接將是關鍵,需要實現無縫和實時的資料傳輸,而這無疑將考驗著國網應對大資料的能力。
而在麥肯錫的報告中,仔細分析了美國醫療行業、歐洲政府公共服務、美國零售業、全球製造業以及個人位置資訊行業——它們在2010年佔據了全球GDP約40%的份額,據稱,它們均可藉助大資料實現新的行業增值轉型。例如,麥肯錫預計,美國醫療健康行業每年可以從海量資料中實現超過3000億美元的價值,而善於利用大資料的零售商可以提升約60%的利潤空間。
不過,在水晶石CIO方凡看來,擺在大資料面前的依然有很多難題。比如在技術層面,企業需要提升計算、儲存和網路交換等方面的能力,三者不可偏廢。此外,一旦針對大資料的業務需求呈現波峰波谷的巨大落差,企業將面臨兩難的選擇——不投資IT基礎設施,將無法應對挑戰,而如果做了投資,業務量一旦下滑,前期的投資會打了水漂,這是一個需要仔細拿捏權衡的難題。
“大資料不是一夜之間產生的,CIO的最大任務就是貼近業務的發展需求,用最少的投資滿足企業最大限度的發展需求。”方凡稱。
雲端計算能帶來什麼