區塊鏈與大數據怎么融合創新?

作者:中財金融EDP教學中心  時間:2019-11-13  分類:區塊鏈Blockchain新聞  
中央政治局第十八次集體學習時強調,要“加快區塊鏈和人工智能、大數據、物聯網等前沿信息技術的深度融合,推動集成創新和融合應用。”看似簡單的一句話,實際上包含著巨大的信息量。很多人都在問,區塊鏈與大數據到底什么關系?它們究竟如何融合?

我們都知道,在以上幾種前沿技術中,物聯網在獲取海量數據,以及這些海量數據的存儲、傳輸和處理中扮演著重要的角色。這些海量數據,無疑是大數據的重要內容來源。人工智能作用的發揮,更大程度上依靠數據的訓練。沒有足夠的數據為基礎,人工智能也不可能發揮作用。大數據從其概念的誕生開始,就是以通過數據充分分享實現數據互聯互通,發揮數據綜合效用為宗旨的(參見維克托·邁爾-舍恩伯格《大數據時代》,以及涂子沛《數據之巔》)。但各種大數據系統的建設,卻背離了這一目標。以至于目前數據孤島到處存在,數據成為石油之后的又一世界性的壟斷資源。數據孤島的存在,則主要是各種部門和機構利益作祟的結果。數據不能互聯互通,不僅影響著數據作用的進一步發揮,而且由于各個部門和機構壟斷著數據,還存在著利用數據優勢進一步獲取壟斷性競爭地位的可能,甚至還時時發生著大的部門和機構利用數據占有優勢侵犯用戶隱私和用戶利益的事情。數據作為未來的生產資料,在社會的發展中起著非常重要的作用,打破數據壟斷勢在必行。究竟怎么破?區塊鏈的出現,為打破數據壟斷提供了技術架構上的可能。一、區塊鏈有利于通過數據確權打破數據孤島,實現共贏作為一種相對特殊的數據傳輸和數據存儲架構,區塊鏈這種特殊架構及其自身的發展,將從根本上改寫大數據發展格局,校正大數據的發展方向,并豐富物聯網的體系架構形式。區塊鏈的本質意義,在于通過對數據進行全網一致性分發和冗余存儲,降低所有節點在數據占有方面的不對等,進而使所有節點在平等占有數據的基礎上,有了業務自組織權力和業務自組織能力。區塊鏈系統中的所有節點在數據全網一致性基礎上實現了業務流程的自組織,也就是實現了業務流程的去中心化和去中介化。去中心化和去中介化的系統,較之前建立在數據中心化基礎上的業務流程中心化和他組織結構,帶來了更高的業務生產效率和更大的容錯空間,同時,又節省了原來中心環節和中介環節占有的利潤。但區塊鏈系統建立的前提,一定是數據的對等分享,而不可能是數據的單方面分享。因此,在區塊鏈系統和業務體系內,數據必須來自于所有節點,才有可能實現數據對等占有、效率對等提升、利益對等享有。因此,區塊鏈系統對數據的所有權進行確權就成為必需。大數據系統基本不考慮數據從哪里來,到哪里去,數據的所有權屬于誰,數據產生的收益又應該由誰分享。區塊鏈系統要求鏈上數據對所有人開放,因此就必須保證鏈上數據真實可信。由此,在區塊鏈系統中,就需要所有人都負責各自數據的寫入,同時所有人要負責對其他人寫入數據的真實性進行確認。在這些真實數據的基礎上,才能夠實現業務流程的優化和重構,才能進一步實現效率的提升和利益的重新分配。二、區塊鏈技術架構有望提高數據質量大數據是一種低價值數據。通過大量數據的聚合,尋找到數據之間的相關關系,發揮數據的作用,是大數據系統建設和開發的核心訴求。大數據系統中大部分數據的質量并不高,這種質量,包括數據本身的真實性,數據自身蘊含的內在價值,數據價值與其自身占用空間的比例等不同維度。區塊鏈數據是一種高價值數據,是稀缺數據。低價值數據或無價值數據沒有在全網范圍內進行一致性分發和冗余存儲的必要,只有高價值數據和稀缺數據才有這種需要,并經過全網范圍內的一致性分發和冗余存儲,確保數據不可篡改不可偽造,且來源可追溯。因此,可以通過區塊鏈系統,對大數據系統中的數據去偽存真,保留必要的數據上鏈,而不是一股腦將所有數據上鏈。將所有數據上鏈既沒有必要,現有的區塊鏈系統也無法承載,更無法承受。因此,區塊鏈系統的應用,就必須對大數據系統中的數據進行篩選,提高數據的可用性和數據質量。三、區塊鏈與大數據的未來融合創新之路數據從古至今都是稀缺資源。讓數據發揮更大作用,是建設美好社會的前提和基礎。區塊鏈更大意義上是一種體系架構和新的業務邏輯結構。相對于中心化架構,區塊鏈更加強調節點在數據共享基礎上的自治。大數據與區塊鏈既有必須結合以提高效率和性能之處,也存在由于技術架構的局限而不能或不易結合之處。麥肯錫全球研究所給出的大數據定義是,一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。而目前的區塊鏈系統存儲的數據,從體量上是小數據,從流轉上是靜態數據,從類型上是單一類型數據,從價值密度上是高價值數據。按照麥肯錫全球研究所給出的定義所定義的大數據,是無法通過區塊鏈系統在全網范圍內進行分發和存儲的。因此,必須對區塊鏈系統的數據組織方式和數據存儲方式重新進行結構,否則,區塊鏈系統與大數據無法融合。區塊鏈系統與大數據的融合,可以針對不同的業務場景,實現不同層級的數據共享。針對小體量的數據,可以直接將數據上鏈,實現全部數據的共享。針對體量略大一些的數據,則可以抽取出數據處理結果上鏈,而將原始數據存在鏈下,并通過區塊鏈中的時間戳和哈希函數,保證原始數據不被篡改不被偽造。如果是極大體量數據,則可以將數據所在存儲區塊的時間戳和哈希值上鏈,通過不同層次的云計算和邊緣計算,實現不同層級的數據本地化或云化處理,從而發揮數據的作用。同時,還必須將快速流轉的數據靜態化處理,或者直接靜態化,或者將數據處理結果靜態化。也必須將多樣數據類型數據進行類型單一化處理,以便于區塊鏈系統可以分發和存儲。此外,還必須從大量的低價值密度數據中抽取出數據的內在價值,否則,低價值密度數據也沒有必要用區塊鏈進行處理。區塊鏈與大數據的融合,在具體應用中會遇到各種各樣的問題。但隨著各種設施設備在存儲容量、運算速度和傳輸效率方面的進一步提升,隨著各種技術的發展,尤其是緊密結合各種應用場景所能開展的優化,區塊鏈與大數據相互融合并共同服務于人類生產生活效率提升,共同創造人類社會美好未來的前景,是值得期待,也值得努力付出,并一定會實現的。

  

  

版權信息
作者:中財金融EDP教學中心
來源:中財金融EDP教學中心

關于我們

聯系我們

作者進駐

公眾號

Copyright ? 2013 比特巴 www.qdwpjd.tw
只為您提供客觀公正有用的比特幣 區塊鏈 加密數字貨幣新聞、技術教程、行情分析、行業人物資訊
手機版
六和网站曾道人