讀《大數(shù)據(jù)時(shí)代》

2007
2019-7-7 09:24 原創(chuàng)

作者:維克托.邁爾-舍恩伯格,肯尼斯.庫克耶

1.為什么說大數(shù)據(jù)時(shí)代?

“就像望遠(yuǎn)鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測(cè)微生物,這種 能夠收集和分析海量數(shù)據(jù)的新技術(shù)將幫助我們更好地理解世界——這種理解 世界的新方法我們現(xiàn)在才意識(shí)到?!?/p>

“大數(shù)據(jù)標(biāo)志著人類在尋求量化和認(rèn)識(shí)世界的道路上前進(jìn)了一大步。過去不可計(jì)量、存儲(chǔ)、分析和共享的很多東西都被數(shù)據(jù)化了。擁有更多不那么精確的數(shù)據(jù)為我們理解世界打開了一扇新的大門。社會(huì)因此放棄了尋找因果關(guān)系的偏好,開始挖掘想關(guān)系的好處?!?/p>

本書旨在如實(shí)表達(dá)出大數(shù)據(jù)的內(nèi)涵,而不會(huì)過分熱捧它。當(dāng)然,真正的革命并不在于分析數(shù)據(jù)的機(jī)器,而在于數(shù)據(jù)本 身和我們?nèi)绾芜\(yùn)用數(shù)據(jù)。
 

2、大數(shù)據(jù)給我們理解和組建社會(huì)的方法帶來什么轉(zhuǎn)變?

第一,可以分析更多的數(shù)據(jù),甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。

第二,數(shù)據(jù)如此之多,不再熱衷于追求精確度。

第三,不再熱衷于尋找因果關(guān)系。

3、大數(shù)據(jù)時(shí)代會(huì)給我們帶來什么問題?

“大數(shù)據(jù)為監(jiān)測(cè)我們的生活提供了便利,同時(shí)也讓保護(hù)隱私的法律手段失效。面對(duì)大數(shù)據(jù),保護(hù)隱私的核心技術(shù)不再適用了。同樣,通過大數(shù)據(jù)預(yù)測(cè),對(duì)我們的未來想法而非實(shí)際行為采取懲罰措施,也讓我們煌恐不安,因?yàn)檫@否認(rèn)了自由意志并傷害了人類尊嚴(yán)。

那些嘗到大數(shù)據(jù)益處的人,可能會(huì)把大數(shù)據(jù)運(yùn)用到它不適用的領(lǐng)域,而且可能會(huì)過分膨脹對(duì)大數(shù)據(jù)分析結(jié)果的信賴。隨著大數(shù)據(jù)預(yù)測(cè)的改進(jìn),我們會(huì)越來越想從大數(shù)據(jù)中掘金,最終導(dǎo)致一種盲目崇拜,畢竟它是如此的無所不能。這就是我們必須從麥克納馬拉的故事中引以為戒的。

必須杜絕對(duì)數(shù)據(jù)的過分依賴,以防我們重蹈伊卡洛斯的覆轍。他就是因?yàn)檫^分相信自己的飛行技術(shù),最終誤用了數(shù)據(jù)而落入了海中。

4、如何用好大數(shù)據(jù)技術(shù)?

讓數(shù)據(jù)為人類所用,不讓人類成為數(shù)據(jù)的奴隸。

大數(shù)據(jù)讓我們?cè)囼?yàn)的速度更快,發(fā)現(xiàn)的線索更多。這理應(yīng)能夠產(chǎn)生更多的創(chuàng)新成果,但發(fā)明的火花卻往往存在于數(shù)據(jù)未顯示出的信息之中,因?yàn)樗⒎钦鎸?shí)存在,是多大量的數(shù)據(jù)都永遠(yuǎn)無法確定或證實(shí)的。在大數(shù)據(jù)的世界中,包括創(chuàng)意、直覺、冒險(xiǎn)精神和知識(shí)野心在內(nèi)的人類特性的培養(yǎng)顯得尤為重要,因?yàn)檫M(jìn)步正是源自我們的獨(dú)創(chuàng)性。

大數(shù)據(jù)是一種資源,也是一種工具。它告知信息但不解釋信息。它指導(dǎo)人們?nèi)ダ斫?,但有時(shí)也會(huì)引起誤解,這取決于是否被正確使用。大數(shù)據(jù)的力量是那么耀眼,我們必須避免被它的光芒誘惑,并善于發(fā)現(xiàn)它固有的瑕疵??萍荚傧冗M(jìn)也無法將世界上數(shù)據(jù)的總量(即最終的樣本=總體)盡數(shù)收集、儲(chǔ)存和加工。例如,歐洲粒子物理研究所(CERN)位于日內(nèi)瓦的粒子物理實(shí)驗(yàn)室在試驗(yàn)中只能收集到不到0.1%的反饋信息,其余信息將同潛在的知識(shí)一起消失在乙酬中。這種情況司空見慣。從羅盤和六分儀,到望遠(yuǎn)鏡和雷達(dá),再到今天的全球定位系統(tǒng),人們總是受到現(xiàn)有測(cè)量和認(rèn)知工具的局限。我們明天使用的工具很可能比今天的強(qiáng)大數(shù)倍甚至上千倍,我們現(xiàn)在所擁有的知識(shí)較之明天可能就顯得微不足道了。要不了多久,當(dāng)我們回看當(dāng)今的大數(shù)據(jù)世界時(shí),就像在看阿波羅11號(hào)上僅4Kb內(nèi)存的導(dǎo)航控制計(jì)算機(jī)一樣,會(huì)覺得十分奇特。我們能收集和處理的數(shù)據(jù)只是世界上極其微小的一部分。這些信息不過是現(xiàn)實(shí)的投影——柏拉圖洞穴上的陰影罷了。因?yàn)槲覀儫o法獲得完美的信息,所以做出的預(yù)測(cè)本身就不可靠。但這也不代表預(yù)測(cè)就一定是錯(cuò)的,只是永遠(yuǎn)不能做到完善。這也并未否定大數(shù)據(jù)的判斷,而只是讓大數(shù)據(jù)發(fā)揮出了應(yīng)有的作用。

       大數(shù)據(jù)提供的不是最終答案,只是參考答案,為我們提供暫時(shí)的幫助,以便等待更好的方法和答案出現(xiàn)。這也提醒我們?cè)谑褂眠@個(gè)工具的時(shí)候,應(yīng)當(dāng)懷有謙恭之心,銘記人性之本。大數(shù)據(jù)時(shí)代亦應(yīng)當(dāng)銘記。


回應(yīng) 舉報(bào)
收藏

推薦閱讀

韓曉杰
韓曉杰
2007