|
中國網/中國發展門戶網訊 信息基礎設施(cyberinfrastructure),是指承載各種信息應用的系統平臺,包括由終端設備、網絡、服務器等基礎軟硬件構成的網絡計算系統。中國科學院?2009?年發表了《中國至?2050?年信息科技發展路線圖》戰略研究報告。在?12?年后,該報告提出的信息基礎設施發展趨勢變得更加清晰,即從現在至?2050?年,世界將興起一種新型信息基礎設施——高通量低熵算力網(high-goodput, low-entropy computing network),被形象地簡稱為“信息高鐵”(Information Superbahn)。
現有的互聯網、云計算、大數據、物聯網等網絡計算系統有?1?個共同點:系統平臺提供盡力而為的基礎設施,由應用開發者降低各種無序波動,保障用戶體驗。區別于現有網絡計算系統,信息高鐵有?2?個顯著特征:在基礎設施層提供對低熵有序性質的支持,降低各種無序混亂對用戶體驗的負面影響,從而顯著提升應用品質、系統通量、系統效率;原生支持“人機物”三元融合,適應智能萬物互聯時代的各種應用。然而,這?2?個新特征難以通過現有系統的延續式增量優化實現,需要研究新的系統結構、抽象與方法。
萬物智能互聯時代對新型信息基礎設施的需求
萬物智能互聯時代對信息基礎設施提出了新需求。信息高鐵在計算模式、計算性能、用戶體驗、應用效率?4?個方面的新需求較為鮮明突出,即信息高鐵應支持“人機物”模式、高通量性能、高品質體驗,以及全生命周期效率。
“人機物”三元融合的計算模式
不同于圖靈機等理論計算模型,計算模式是指貫穿從理論到應用的全棧使用模型與執行模型,如交互式計算、云計算、圖計算等。計算模式在歷史上出現了?4?個時代與?3?次大的變遷:手工計算時代(數千年前至今),如人使用算盤求兩數之和;計算機一元計算時代(1946?年至今),如超級計算機求解方程組;“人機”二元計算時代(2000?年至今),如構建視覺數據集?ImageNet;“人機物”三元計算時代(正在開始),尚無鮮明完整實例。
在跨度數千年的時間里,人類(人)使用算籌、算盤、紙和筆等原始計算工具(機)實現計算過程。這種手工模式每一微小步驟都需要人工操作,速度太慢,在?20?世紀被數字電子計算機自動執行整個計算過程的一元計算模式替代。“手工計算”向“計算機一元計算”的變遷引發了當代計算機革命。
21?世紀初發生了“計算機一元計算”向“人機二元計算”的模式變遷。一個例子是李飛飛和李凱團隊的?ImageNet?基準測試集構建項目。通過云計算工具,他們在全球雇傭了數千普通人來人工標注幾百萬張圖片,將預計?19?年才能完成的“構建?ImageNet?知識本體”的計算過程縮短至不到?3?年時間。
從現在到?2050?年期間,將產生以“人機物”三元計算為特征的計算模式變遷,即“計算機一元計算”與“‘人機’二元計算”向“‘人機物’三元計算”變革;出現各種“人機物”三元融合的計算系統;人、機、物將成為計算過程的執行主體和對象客體。簡而言之,人類社會、信息空間、物理世界都會成為計算系統的模塊集合。
高通量的計算性能
“人機物”三元融合的一個趨勢是信息基礎設施覆蓋的信息設備數量將大幅增加,進而出現萬億設備新世界。其中,絕大部分設備將是面向物理世界的物端設備,而不是桌面電腦和智能手機等人端設備。與包含數十億設備的現有互聯網相比,這些數以萬億計的信息設備將產生數量級增長的并發任務,需要信息基礎設施數量級提升任務吞吐率(throughput)。“李特爾定律”(Little’s Law)可能會取代“摩爾定律”(Moore’s Law),成為未來信息系統的重要指導原理。信息高鐵強調低熵有序,追求的是高通量計算(high-goodput computing);其性能指標是通量(goodput),即保質任務吞吐率,也就是單位時間完成的保質任務數。
借鑒半導體芯片制造業的良率(yield)概念,可定義信息高鐵的良率,即為:
良率=保質任務數/總任務數。
因此,信息高鐵的通量為:
通量=任務吞吐率×良率。
類比交通業,保質任務可看作高鐵中準時到達目的地的乘客,那么保質任務集合即為總任務集合中去除下列非保質任務,包括非載荷任務(司機和乘務員)、未完成任務(未到目的地就下車的乘客)、重復任務(上錯車乘客),以及不滿足用戶體驗的任務(高鐵延誤的乘客)。
高品質的用戶體驗
過去?20?年,中國互聯網應用取得了長足發展,一個重要經驗是業界實踐了一條基本原理:用戶體驗不佳的功能是不存在的功能。例如,微信應用系統實現了每條微信消息在數據中心多副本備份且讀寫延遲小于數十毫秒的指標,用以保障“微信消息瞬時可靠傳遞”的用戶體驗。信息高鐵需要繼承這條原理,并在基礎設施層提供支持,限制用戶體驗的無序波動和混亂行為。
特別需要發展有助于保障“受限尾行為”的平臺技術,因為信息高鐵中的計算任務并不需要?100%?的都是保質任務。受限尾行為涵蓋高品質的多類指標,如功能、性能、適應性、安全性等。典型需求例子包括:99.9?百分位的任務低成本完成;99.99?百分位的任務按時完成;99.999?百分位的任務產生正確結果;99.9999?百分位的任務滿足隱私保護法規……
全生命周期的應用效率
《中國至?2050?年信息科技發展路線圖》報告指出,中國將在?2035—2050?年期間進入中高級信息化社會。信息基礎設施必須支持中高級信息社會應用模式的各種新形態。傳統模式是安裝一套應用軟件,然后穩定使用數年,但這種模式的占比只會越來越小。未來的常態將是眾多網絡應用服務系統不斷涌現且快速迭代升級,以滿足不斷變化的價值創新與業務運維需求,及安全隱私保護與合規監管要求。
因此,信息高鐵的應用效率強調全生命周期效率,涵蓋設計研發效率、運行效率、部署運維效率、性能功耗比(能效)等。由于“摩爾定律”放緩,需要更大力度探索系統結構和軟件棧創新、從元器件到應用層的跨層協同設計、貫穿生命周期的敏捷過程與工具。美國國防部高級研究計劃局(DARPA)已經提出了能效為每瓦每秒?3?千萬億次運算的前瞻目標。
信息高鐵的關鍵科學技術問題
構建和使用信息高鐵這樣的新型信息基礎設施必須解決計算機科學技術領域的新問題。文章簡要討論了信息高鐵的?4?類關鍵科學技術問題及其相關研究(圖?1)。最基本的問題是研究信息高鐵的新型系統抽象,有效地支持各類信息高鐵應用。這些新抽象合起來在計算模式、體系結構、編程運維?3?個方面提供原生融合“人機物”、無縫銜接端邊云和敏捷開發業務體的新能力。
原生支持“人機物”三元融合的計算模式
計算機科學技術發展數十年來,主要的方法論是將人類社會和物理世界的各種特定問題在圖靈機或馮 ·諾依曼機之類通用數字計算機上建模,并通過編程和通用計算找到對該特定問題的解答。這是一種行之有效但繞了一圈的非自然方法論,有其一定的固有內生開銷。然而,每一個特定的“人機物”應用都有特定需求,并不總是需要使用通用圖靈機的最壞情況思維。Kelly?將傳統方法論的“特定→通用→特定”映射的固有開銷稱為“圖靈稅”。進一步,我們認為“圖靈稅”還包括了“人機物”→機→“人機物”映射的固有開銷。因此,降低“圖靈稅”是實現高通量計算的重要途徑。例如,圖靈計算模型要求在計算過程開始前將輸入數據和狀態轉移表放入通用圖靈機的輸入紙帶,圖靈機停機時計算結果則已放入輸出紙帶。若使輸入數據、狀態轉移表、輸出數據在“人機物”三元世界中更自然地原生變換,那么信息高鐵就成為“人機物”作為原生對象、“人機物”提供算力的計算網。這大不同于傳統計算機網絡,其本質上是通信網,并由計算機提供算力。
Kuppe等提出的行動時序邏輯(TLA)近年來在云計算和大數據系統中得到了越來越廣泛的應用,但?TLA?的更深刻本質是一種“人機物”狀態機。原生刻畫“人機物”三元計算過程還涉及一個本質的矛盾,其既需要刻畫人類社會和物理世界無所不在的原生模擬量現象,又需要繼承數字計算的優點。Platzer最近提出了微分動態邏輯(differential dynamic logic),能夠刻畫包含諾特環的微分方程的邏輯不變性,是對實現“人機物”三元計算的有益探索。
從應用角度看,“人機物”原生融合的一個表現是計算過程與人類生產生活的業務過程自然融合,產業界有時稱為信息技術與操作技術融合(IT+OT)。這方面的一個初步例子是中國正在實施的數字人民幣試點。貨幣從以前的銅錢、銀幣進化到紙鈔,變為現在區塊鏈技術支撐的數字,同時也并未破壞原有的貨幣屬性與業務過程。
無縫銜接端邊云子系統
信息高鐵不是替代信息高速公路,而是在現有網絡計算系統的巨人肩膀上創新;其更高效地無縫銜接人端設備、物端設備、邊緣計算和云計算子系統,包括遺產系統和新出現的業務形態、應用框架、基礎軟硬件、數據組織、知識結構、管理策略和治理法規。信息高鐵的系統結構需要有?2?個特征:高效協調信息高鐵的低熵有序性與現有系統的靈活性;前瞻支持未來信息社會的業務與技術多樣性。萬維網的表象狀態轉移(REST)體系結構十分值得借鑒,它站在因特網巨人肩膀上創新,應對了銜接新舊系統、前瞻支持多樣性的問題。
信息高鐵系統結構面臨的新挑戰包括?5?個方面:如何無縫銜接信息高鐵與信息高速公路;如何支持萬億級異構設備;如何在高載荷條件下保障用戶體驗;需要什么樣的系統抽象,讓用戶管控人工智能“不作惡”;如何支持軟件性能工程,挖掘現有軟件棧?5?個數量級的性能提升潛力。面對這些挑戰,其中一個研究方向是將領域特定體系結構升級為問題特定體系結構,并定制高效大構件。例如,為了降低不必要的依賴與協調開銷,可給業務問題添加合理的規矩,發展“少寫”執行模型,大幅度減少運行時可寫變量的影響范圍。這些相關工作的理論基礎包括支持“零協調”的邏輯單調性的一致性定理(CALM?定理)等。
敏捷開發高品質業務體
“人機物”三元融合的智能萬物互聯時代將產生眾多應用業務形態和執行模型,需要重新審視基本計算過程類別。在過去數千年的時間里,計算過程僅限于運算流,即每一步完成一個算術運算的計算步驟順序執行。例如,Ada Lovelace?在?1843?年發表的史上第一個計算機程序包含?36?行指令,每條指令僅是一個加減乘除運算。直到?1946?年數字電子計算機誕生之后,計算過程才增加了體現程序控制結構的控制流,如條件轉移、循環、函數調用(包括遞歸調用)等編程抽象。隨著計算機網絡及并行分布式系統的誕生,計算過程又增加了體現網絡思維的消息流。今后,萬物智能互聯時代將為計算過程添加智能流抽象。
智能流抽象的具體形態尚在研究中,但總體上應該繼承云計算系統敏捷開發的快速原型、快速試錯與快速升級優點,再進一步增加更加高級的抽象,實現智能基礎設施(intelligent infrastructure)。智能流抽象需要滿足?3?個設計原則。支持專業到行業的整合。大量業務問題是行業問題,其應用軟件需要整合多學科專業資源,實現特定的行業解答。強化部分規約(partial specification)。現有應用軟件主要是由人完全編寫的,往往會出現過度規約現象(over specification),還需由完全規約向部分規約的轉型,提升業務體的自適應性。強調規則和有序。智能流應將敏捷開發云計算應用的“開發運維一體”(DevOps)方法拓展到低熵有序的端邊云應用,從而進化為“開發運維安全一體”(DevOpS)方法。
信息高鐵的系統結構設想
信息高鐵的發展應借鑒互聯網和云計算的發展經驗,科研工作要結合現場試驗與社區建設,從而實現快速試錯與迭代發展。為此,我們提出一個初步的由?4?層抽象構成的信息高鐵系統結構(圖?2)。
賦名資源。包含各種“人機物”主體與客體資源,如用戶、硬件、軟件、數據、模型、知識、過程、物理世界資源。這些可以是池化與非池化資源,在開發運行時某些階段可為匿名。但是,資源本質上都在系統中有實名,以便調試與追責。
控域。資源來自信息高鐵或現有系統,包含無序的資源使用。控域規定一組資源及其使用策略,將該范圍內的資源時空變得有序。同時,控域的設計與部署應該提供足夠的應用靈活性。這就像交通高鐵中的“列車班次”“提前購票”“憑票上車”“按號入座”。
網程。網程將操作系統的進程概念拓展到“人機物”端邊云系統,是信息高鐵應用程序(業務體)的運行時抽象。信息高鐵系統通過網程實現對業務體的全生命周期管理。
業務體。業務體是高品質行業應用軟件的系統抽象。來自“人機物”的計算任務通過“請求—響應”等方式訪問業務體。業務體抽象應有?3?點益處:通過顯式或隱式接口整合多學科新舊資源;集中刻畫業務本質,盡量由“人機物”自動生成或補全執行代碼,以及相關數據和元數據;充分利用高級抽象轉換技術,如各種應用框架。現有編譯器將高級語言程序轉換為可執行代碼,未來的編譯器和解析器將轉換程序、數據、上下文、“人機物”環境等。
未來的信息基礎設施
未來的信息基礎設施既要延續和發展目前具有廣泛普及性和便利性的信息高速公路,又要滿足高品質用戶“可測、可調、可控、可信”的高吞吐率和高良率的新服務要求;既要通過衛星通信實現無論何時何地全覆蓋,又要借助人工智能技術實現網絡的自適應性和個性化。因此,未來的信息基礎設施一定是多種網絡形式的無縫鏈接和協同配合。信息高鐵是不可或缺的組成部分。“信息高鐵”這一別名為了繼承“信息高速公路”的說法以形象地稱謂“高通量低熵算力網”,但其并不能全面地表達高通量低熵算力網的特性。這種新的信息基礎設施不僅具有高鐵交通系統一樣準時可控的特點,還具有較強的自適應性,可滿足不同用戶的高品質服務需求;同時,與交通系統類似,通過“換乘站”等設施,信息高速公路和信息高鐵可以實現便捷的“換乘”。整體而言,信息高鐵是一個可以統一控制、靈活調度的整體。
過去的信息高速公路本質是數據網,而信息高鐵是一個通用網絡計算平臺,本質上是高效、可控、智能化的大規模分布式計算系統。每一個信息高鐵的應用系統,可以看成是業務專列,即一個領域專用、甚至個人專用的網絡計算系統。“網絡切片”是?5G?通信和未來網絡的重要技術,核心思想是將一個物理網絡切割成多個虛擬的端到端網絡,每個虛擬網絡都可獲得邏輯獨立(不是物理上獨立)的網絡資源,且各切片之間相互隔離。信息高鐵要實現虛擬網絡到物理網絡的映射,但不能將信息高鐵簡單地理解為把網絡劃分成千上萬個切片,供不同的用戶分別使用。如果走線路交換的老路,讓切片成為網絡中的一條線路,可能會導致平均延遲上升幾個數量級,這是完全不可接受的。信息高鐵需要采用最新的分布式計算技術,許多還在攻關突破階段。TLA?對發展分布式系統有重要的作用,谷歌、微軟、亞馬遜等大公司目前都在大力培養?TLA?方面的人才。
我國電信部門雖然尚未提出要建信息高鐵,但提出了基于軟件定義網絡/網絡功能虛擬化(SDN/NFV)的第?4?次網絡架構變革、跨越物理和虛擬兩個網絡的生命周期服務編排(LSO)、實現跨域高層智能聯網的隨愿網絡和云網融合等,這些與信息高鐵的目標基本上是一致的。電信運行商也在開發確定性網絡(DetNet),重點是盡力而為地提供更高水平的服務質量(QoS),主要關心最壞情況下端到端的延遲,但難以支持高通量應用的(百分位)實時性。確定性網絡的目標也是信息高鐵的重要應用場景。信息高鐵的基礎設施應能動態地感知負載與“人機物”環境的變化,以及軟硬件技術棧的運行時狀態,及時優化自身以適應負載和環境。目前的網管模式基本上是手工配置業務,導致業務開通流程復雜、耗時長,因此特別需要構建靈活、顆粒化和快速響應的網絡架構。我們提倡的信息高鐵也是商用網絡架構升級換代的主要方向之一。
(作者:徐志偉、李國杰、孫凝暉,中國科學院計算技術研究所、計算機體系結構國家重點實驗室、中國科學院大學 計算機科學與技術學院;《中國科學院院刊》供稿)