聽起來,我們似乎對于“大數(shù)據(jù)”都不陌生,但是真要問起什么是大數(shù)據(jù),大數(shù)據(jù)該如何運用,也許很多人就不清楚了。事實上,大數(shù)據(jù)就是從看似雜亂、重復、無趣的數(shù)據(jù)中,根據(jù)需要理出一條線索,為解決問題提供靠譜的依據(jù)。近日,由山東省社科聯(lián)主辦的大數(shù)據(jù)與社會科學理論茶座邀請到了中國工程院院士、中國互聯(lián)網(wǎng)協(xié)會理事長鄔賀銓, 信息中心專家委員會主任寧家駿專程來濟講授了大數(shù)據(jù)建設的利與弊。下面,華全動力小編就帶您瀏覽一下。

分析大數(shù)據(jù)概念圖
大數(shù)據(jù)的應用對于大數(shù)據(jù)的定義,或許用以下的例子就可以讓人有個大致了解。
2013年“十一”黃金周之前,百度的數(shù)據(jù)分析師忽然發(fā)現(xiàn)網(wǎng)民點擊搜索“九寨溝”的流量大,到九寨溝“怎么玩”“住在哪”“怎么去”成了熱點詞,點擊量突然有一個爆發(fā)性的增長。百度的數(shù)據(jù)分析師不敢怠慢,把數(shù)據(jù)給 旅游局、四川旅游局、九寨溝景區(qū)等做了通報,提醒對方,“十一”期間到九寨溝的游客可能有一個爆發(fā)性增長,希望相關部門做好預案,可是有關部門卻并沒有把這當回事。結果,當年的黃金周,去九寨溝旅游的人數(shù)真的暴增,而去九寨溝景點的車輛有限,大量的游客滯留在景區(qū)外,憤怒的人群制造了許多不愉快的事。
而2015年元旦,上海外灘的陳毅廣場上,慶祝新年的人群發(fā)生了慘烈的踩踏事故。這個事件本來可以避免。實際上,早在新年之前,也就是2014年12月31日晚上,大量的人群開始在外灘聚集,而每個人身上攜帶的手機等設備產(chǎn)生的信號其實早已經(jīng)作為人群密度的直接數(shù)據(jù)通過電信部門告知了上海市公安部門。但由于當局沒有采取相應的措施疏導人群, 終導致了慘劇的發(fā)生。
從以上例子可以看出,基于網(wǎng)絡產(chǎn)生的大量數(shù)據(jù),經(jīng)過分析之后,使得看似毫無關聯(lián)的事情變得有了關系,之后進行干預并引導其向有利的方向發(fā)展。這些有價值的數(shù)據(jù),就是大數(shù)據(jù)的一種體現(xiàn)。
隨著科技的發(fā)展,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)與人們的日常生活越來越緊密,城市人群每天都會通過手機、公交卡、電腦等方式產(chǎn)生各種各樣的互動,在網(wǎng)絡上留下痕跡,這些數(shù)據(jù)匯總之后,可以經(jīng)過分析產(chǎn)生許多有價值的信息。例如韓國首爾有一條酒吧街,年輕人都喜歡在那里玩到很晚。之前的時候,這條街沒有深夜運營的公交車,出行只能自駕或者出租車,但是進酒吧都是喝酒的,這就沒法自駕,而出租車又很貴,于是市民就要求開通一條夜間運營的線路。可是線路該如何設計才能效率化呢?當?shù)叵嚓P部門通過分析此前市民從酒吧街離開后打車、網(wǎng)絡叫車等的主要目的地, 終得出了一條熱點線路,開通了公交,極大地方便了市民出行。對此,寧家駿表示,北京以及國內(nèi)不少城市在這一點上做得并不好,經(jīng)常是熱點線路擠不上人,有的線路則經(jīng)常空車,資源利用效率不合理。
再比如,美國的NBA很早就引入了數(shù)據(jù)化管理,從上世紀80年代開始,NBA就將球員在賽場的表現(xiàn)數(shù)據(jù)化,經(jīng)過30多年的積極改進已達到了可辨別每一個球員在場上的弱點,方便教練進行針對性戰(zhàn)術安排。“如果把這樣的大數(shù)據(jù)分析應用到中國足球隊身上,成績應該會提高不少。”鄔賀銓說。
不要盲目建設
從某種程度上來說,中國是數(shù)據(jù)資源的大國,因為人口以及網(wǎng)民的數(shù)量龐大,每天產(chǎn)生海量的數(shù)據(jù),將這些數(shù)據(jù)加以匯總、分析,可以更加行之有效地治國理政。以醫(yī)療數(shù)據(jù)為例,2008年僅3D 核磁產(chǎn)生的數(shù)據(jù)就達到100G,這些數(shù)據(jù)還要被保存50年,如果把所有的醫(yī)療數(shù)據(jù)都加起來的話,肯定也是大數(shù)字。不僅如此,中國的醫(yī)生職業(yè)生涯中會看幾千個病人,這是美國醫(yī)生遠遠不能比的,由此產(chǎn)生的經(jīng)驗和數(shù)據(jù)也是相當豐富的,一旦利用起來,可以有效地提高醫(yī)療水平。但在鄔賀銓、寧家駿看來,現(xiàn)在的問題是,數(shù)據(jù)共享存在不少障礙,數(shù)據(jù)都存在部門化、利益化的傾向,想要真正無障礙高效利用,任重而道遠。
盡管大數(shù)據(jù)有不少好處,我國也是一個數(shù)據(jù)資源大國,但是專家并不建議各地盲目上馬建設大數(shù)據(jù)項目。“大數(shù)據(jù)不等于傳統(tǒng)的數(shù)據(jù)庫存建設,大數(shù)據(jù)需要云計算但大數(shù)據(jù)建設也不等于云計算中心建設。”寧家駿表示,在將大數(shù)據(jù)上升為 戰(zhàn)略的過程中,依然要避免出現(xiàn)產(chǎn)能過剩的問題。
寧家駿說:“河北省有三個地方同時報大數(shù)據(jù)中心建設的項目,分別是廊坊、張北、承德。這其中張北還好說,是因為冬奧會要在那里開,但承德要搞大數(shù)據(jù)中心就沒有必要了。”從之前的相關高科技項目來看,部分地區(qū)存在建設項目就是為了圈地、蓋房,但真正建設好之后,廠房里可能什么都沒有,或者花高價買來了設備卻因為缺乏應用而將設備閑置。“這些高科技設備跟手機一樣,放上兩三年就一分錢不值了。部分地方花錢建設了,什么效益都產(chǎn)生不了,純粹浪費納稅人的錢。”寧家駿說。
對于山東社科聯(lián)將要建設大數(shù)據(jù)中心,寧家駿表示,這個中心不一定真正自己去建設。可以租用山東大學、浪潮等科研、企業(yè)的設施,使用自己的數(shù)據(jù),將大數(shù)據(jù)中心的建設實現(xiàn)社會化。但關鍵還是需要人才的儲備。
與國外的差距
2012年奧巴馬發(fā)布美國的大數(shù)據(jù)行動計劃,中國國務院是以國字頭發(fā)文件在2015年發(fā)布中國的大數(shù)據(jù)行動計劃,兩者差三年。這個三年的差距應該放到互聯(lián)網(wǎng)的發(fā)展歷史中來看:美國是1969年開始使用互聯(lián)網(wǎng),中國則是1994年才進入互聯(lián)網(wǎng),從互聯(lián)網(wǎng)的起步到大數(shù)據(jù)的行動,中國和美國的差距縮小了很多。從這個意義上說,中國在大數(shù)據(jù)的問題上有一個好的起步階段。但是從另一個角度看,美國在大數(shù)據(jù)方面是有很強大的基礎的,大數(shù)據(jù)涉及到存儲、分析、應用等各個方面,甚至包括大數(shù)據(jù)的硬件產(chǎn)品基本都是美國遙遙 。就連提供大數(shù)據(jù)服務的軟件也是谷歌、亞馬遜、IBM等美國公司。在這里的差距就不是三年了。

華全動力生產(chǎn)的沃爾沃系列大功率柴油發(fā)電機組
在鄔賀銓看來,盡管有的中國公司稱從谷歌挖了國外 的人才或者團隊,但大數(shù)據(jù)是一個系統(tǒng)技術,僅僅是一兩個人或者團隊,沒法根本改變國內(nèi)大數(shù)據(jù)建設的不足。除此之外,大數(shù)據(jù)的應用還涉及到網(wǎng)絡安全。民航、高鐵、銀行等如今都在大數(shù)據(jù)的控制之下,而大數(shù)據(jù)常采用云計算,其云存儲容易成為被攻擊目標,用戶面臨數(shù)據(jù)泄露和篡改的風險。在這方面,美國的網(wǎng)絡安全排世界 ,中國僅排到四十位。同時,大數(shù)據(jù)由于在全球范圍內(nèi)都處于起步和摸索階段,需要創(chuàng)新的環(huán)境作為其發(fā)展的支撐,從這一點來說,美國也排在前面,他們從教育開始,小孩的創(chuàng)新就比中國強,我們現(xiàn)在雖然呼吁“萬眾創(chuàng)新”,但是總體上還是創(chuàng)新不如美國。
不僅如此,美國有很好的法律來保障大數(shù)據(jù),中國現(xiàn)在在這一方面欠缺很多。沒有法律支撐,連政府部門都不敢開放數(shù)據(jù)——萬一開放了某些金融類數(shù)據(jù),搞不好還會被說成存在利益輸送。也因為沒有相關法律,大數(shù)據(jù)中涉及到個人的,什么是隱私什么是公開,沒有相應的界定,也沒有機制來保證利益。“我們跟世界發(fā)達 比起來,在大數(shù)據(jù)問題差距較大,還需要從多方面發(fā)展。”鄔賀銓說。
本文的 后,大數(shù)據(jù)建設一個基本的和必要的條件就是需要有穩(wěn)定可靠的電源供應,除了市電之外,以柴油發(fā)電機組為代表,其簡便靈活、快速便捷、簡單易控等優(yōu)勢和特點,成為了機房及其他設備備用電源的 。這未嘗不是發(fā)電機組生產(chǎn)企業(yè)的一個機會呢?