|
中國(guó)網(wǎng)/中國(guó)發(fā)展門(mén)戶(hù)網(wǎng)訊 計(jì)算技術(shù)和能力已經(jīng)完全普適化,對(duì)數(shù)據(jù)的觀察和整合、分析和解釋?zhuān)诓粩鄤?chuàng)造新的知識(shí),推動(dòng)著科學(xué)技術(shù)的進(jìn)步和社會(huì)的發(fā)展。嵌入式和可穿戴設(shè)備正普及大眾,各類(lèi)便攜傳感器已可對(duì)用戶(hù)敏感數(shù)據(jù)進(jìn)行采集,如智能手機(jī)包含了?GPS、加速度計(jì)、距離及光線(xiàn)傳感器、攝像頭、陀螺儀、指紋傳感器,甚至還包含心率監(jiān)測(cè)器等數(shù)據(jù)采集和感知設(shè)備。無(wú)處不在的互聯(lián)網(wǎng)和普及的云計(jì)算、存儲(chǔ)設(shè)施,也使得傳輸和管理這些所采集數(shù)據(jù)變得越來(lái)越容易。對(duì)這些所采集數(shù)據(jù)可從兩個(gè)方面進(jìn)行利用:①建立數(shù)據(jù)的統(tǒng)計(jì)模型以幫助公共和私人部門(mén)了解社會(huì)運(yùn)行各方面的整體情況,如流行病的早期檢測(cè);②從微觀層面提供個(gè)性化服務(wù),如對(duì)每個(gè)居民提供產(chǎn)品和服務(wù)推薦。
在深度網(wǎng)絡(luò)出現(xiàn)之前,機(jī)器學(xué)習(xí)模型無(wú)需大量訓(xùn)練數(shù)據(jù),就算有更多數(shù)據(jù),模型也不能訓(xùn)練得更好(模型進(jìn)入?saturation?狀態(tài));而對(duì)深度網(wǎng)絡(luò)來(lái)說(shuō),因?yàn)槠渥銐蛏睿枰?xùn)練的參數(shù)足夠多,所以它對(duì)數(shù)據(jù)是饑餓的——當(dāng)數(shù)據(jù)越多的時(shí)候,能構(gòu)建的網(wǎng)絡(luò)就越深,其性能就越好,這是大數(shù)據(jù)的作用。如今,這種以大數(shù)據(jù)+深度神經(jīng)網(wǎng)絡(luò)為代表的人工智能技術(shù),正在深遠(yuǎn)地影響著社會(huì)生活的各個(gè)方面。而數(shù)據(jù)作為一種原材料,通過(guò)數(shù)據(jù)分析建模的加工挖掘,能產(chǎn)生新的價(jià)值,已成為新的生產(chǎn)力來(lái)源和資產(chǎn)。
眾多案例已展示了數(shù)據(jù)的應(yīng)用價(jià)值,然而一個(gè)技術(shù)要深刻地推進(jìn)社會(huì)發(fā)展,它需要從具有應(yīng)用價(jià)值發(fā)展為具有應(yīng)用+經(jīng)濟(jì)的雙重價(jià)值。從經(jīng)濟(jì)價(jià)值的眼光來(lái)看大數(shù)據(jù),我們可以看到所謂的“數(shù)據(jù)”在整條價(jià)值鏈上處在起點(diǎn)的位置。數(shù)據(jù)從一開(kāi)始作為原材料,到最后成為產(chǎn)品提供給用戶(hù),其中經(jīng)歷了一系列的加工和增值過(guò)程,包括清理、語(yǔ)義化、融合、分析、建模、知識(shí)提取、應(yīng)用、分發(fā)等關(guān)鍵步驟,如同一個(gè)工業(yè)產(chǎn)品,從原材料到最終產(chǎn)品形態(tài)再到市場(chǎng),是一個(gè)復(fù)雜的價(jià)值鏈,需要精巧的協(xié)同工作。而在目前大部分的大數(shù)據(jù)研究中,關(guān)注點(diǎn)還僅停留于這些具體過(guò)程的技術(shù)基礎(chǔ),我們相信隨著整個(gè)生態(tài)環(huán)境的建立,每個(gè)步驟背后的經(jīng)濟(jì)因素將成為最大的推動(dòng)力量。