- 政策解讀
- 經濟發展
- 社會發展
- 減貧救災
- 法治中國
- 天下人物
- 發展報告
- 項目中心
中國發展門戶網8月11日電 日前,中國科學院編寫了《中國科學院信息化發展報告2011》,在其中介紹了國外科研信息化基礎設施發展現狀。具體內容如下:
從當前世界各國和地區的科研信息化基礎設施建設來看,其重點主要集中于高速網絡、分布式計算設施、高性能計算、科學數據管理等四大緊密相連的領域。
1.高速科研專用網絡建設如火如荼
寬帶網絡尤其是科研專用網絡,支撐著一切基于網絡的科研信息化活動。當前世界各國都在競相開展高端科研教育網絡建設。目前,全球大規模學術網基本可分為三大主體:歐盟的GéANT、北美的Internet2和亞太地區先進網絡APAN。
(1)GéANT:世界最大的多千兆教育科研專用計算機網絡由歐盟委員會和歐洲各國科研教育網(NRENs)聯合資助興建的高帶寬泛歐科研教育骨干網GéANT 是歐盟e-Infrastructure戰略的核心。它既是專門支持科研信息化的全球科研網絡的核心,也是未來互聯網各項核心技術研發的基礎。GéANT目前連接著全歐32個國家科研教育網(NRENs)和全球類似網絡,可為40個歐洲國家約8,000家科研院所的4,000萬科研教育用戶提供無縫連接的服務,是世界最大、最先進與多樣化的科研教育網絡體系 。
圖表 1. GéANT網絡全球連接示意圖
(2)Internet2
Internet2已成為最前沿研發和實驗的平臺,可滿足其成員對協作應用、分布式研究實驗、基于網格的數據分析和社會聯網等帶寬密集型處理的需求 。2010年夏,美國政府撥款6250多萬美元,資助Internet2和其他幾家國家科研教育網絡建造帶寬100G的美國統一社區錨點網(U.S.UCAN),以連接美國的學校、圖書館、社區大學、保健中心和公共安全組織等社區機構,實現當前典型互聯網服務尚未包括的先進應用 。2010年10月,NSF又為Internet2中間件計劃提供了為期3年約265萬美元的資助,旨在將Internet2開發的基本認證軟件組合為一個工具包,以促進虛擬組織的協作 。
(3)亞太地區先進網絡APAN
亞太地區先進網絡APAN 聯盟成立于1997年,旨在為亞太地區科研教育團體提供一個先進的網絡環境并協調其發展,推進網絡應用和服務。澳大利亞學術與研究網AARNet、日本學術信息網SINET3和我國的CERNET網絡是亞太地區科研教育網的主要組成部分。
與上述網絡相連構成全球科研教育龐大網絡體系的主要國際科研教育網還包括:美國能源科學網絡ESnet、荷蘭國家教育科研網絡SURFnet、法國國家科研教育網絡RENATER、加拿大的CA*net4、跨歐亞信息網絡TEIN3、東南歐的SEEREN,地中海地區的EUMEDCONNECT,拉丁美洲的ALICE,印度的ERNET,中亞與高加索地區的OCCASION,南非的TENET,連接我國和歐洲的ORIENT等。
2.科學數據及其應用管理備受矚目
現代科學與工程中,幾乎所有領域的數據量每年都在成倍增長,其分析應用也愈發復雜,不同形式的數據均需得到妥善的管理、存儲、維護,并通過用戶友好的信息化基礎設施服務提供給所有的科學團體使用,科學數據資源及應用環境已納入科研信息化環境的基礎設施范疇 。
(1)美國的DataNet計劃
美國政府歷來對科學數據工作極為重視,NSF于2007年9月正式發布了科學數據可持續保存與共享網絡伙伴計劃(Sustainable Digital Data Preservation and Access Network Partners, DataNet)項目指南 ,規劃創建面向科研信息化的科學數據保存與共享模式。在此項目支持下,NSF預計未來五年(2009年開始)投資1億美元,建立一批全景示范的新型數據保存與共享組織架構,為長期的科學研究提供可靠的數據保存、訪問、集成和分析能力,以及預測及不斷適應技術本身及用戶需求所帶來的變化等。
DataNet項目資助成立的虛擬組織“數據管理委員會”(The Data Conservancy)主要負責研發可支持科學數據保存、應用和安全的數據收藏基礎設施,其在靈活獲取數據、開展與開放數據相關的活動和拒絕使用來源不明的數據方面都取得了一定成效 。
(2)英國DISC-UK數據共享項目
由英國多家機構聯合開展的DISC-UK數據共享項目(2007.3-2009.3)的總體目標是在一個復雜和動態的信息環境中促進學術數據共享新模式、工作流程和工具的形成。其利用各方專業知識,推進數據存放服務,探索新途徑,協助研究人員在互聯網上分享數據。
2009年5月15日,DISC-UK數據共享項目最終報告發布 ,總結了近期英國科學數據共享研究的重要進展與特點并得出三個重要結論:①對研究人員而言,數據管理比數據共享更能成為使用知識庫的動機,但還不足以產生文化變革;②數據館員、數據管理人員和數據科學家可以幫助知識庫管理人員和研究人員開展交流;③機構知識庫可以提高在互聯網上共享數據的影響力。
(3)澳大利亞科研數據共享基礎設施(ARDC)澳大利亞政府從2008年啟動建設國家科學數據服務網絡(Australian National Data Service,ANDS) ,旨在全面整合全國數據資源,實現數據長期保存和共享利用。2009年,澳大利亞高等教育投資基金(EIF)撥款4800萬澳元,支持ANDS創建和發展“澳大利亞科研數據共享(Australian Research Data Commons,ARDC)”基礎設施 ,旨在使澳大利亞科研數據作為一個整體,成為一項國家性的戰略資源。其重點領域包括:數據采集基礎設施、元數據存儲基礎設施、自動數據發布公共基礎設施、ARDC核心基礎設施和ARDC軟件基礎設施。
?3.高性能計算成為評估國家創新能力的關鍵
高性能計算設施對現代科學研究而言是一種極為重要且不可或缺的戰略工具,世界各國都對超級計算能力建設和應用高度重視,紛紛提出國家級計劃。超級計算的能力和應用水平已經成為評價國家創新能力和國家競爭力的關鍵因素之一。
(1)歐洲的PRACE計劃與DEISA計劃
2010年6月9日,耗資4億歐元、有20個國家參與、聯接多臺超級計算機、每秒計算速度將達百萬兆次的歐洲先進計算合作伙伴(Partnership for Advanced Computing in Europe ,PRACE)計劃在西班牙巴塞羅那正式啟動。從2011年到2015年,德國、法國、意大利和西班牙的超級計算機將逐步聯接在一起,并計劃至2019年將運算速度提升到每秒百億億次。目前歐洲計算速度最快的德國Jugene超級計算機將成為新合作平臺的首臺Tier-0系統供歐洲科研人員使用 ,而采用了平衡模塊架構的第二臺Tier-0系統“居里(Curie)”也于近日確定在法國部署 。
與PARCE計劃緊密相連的歐洲超級計算應用分布式架構(Distributed European Infrastructure or Supercomputing Applications,DEISA)計劃 致力于促進世界水平的泛歐計算科學研究,為部署合作型歐洲超級計算機的高性能計算生態系統鋪平道路。DEISA是建立在歐洲各國現有國內服務之上的歐洲超級計算服務,可提供網絡管理和支持、Global文件系統數據管理、DEISA運轉、資源管理、應用及用戶支持、關鍵運用的實施、安全應用等服務。
(2)美國能源部先進科學計算研究(ASCR)計劃
ASCR計劃由美國能源部科學辦公室資助 ,主要任務是為能源安全、核安全、科學發現和創新、環境等科學領域的研究人員開發和部署計算與網絡工具,使其能對復雜現象進行分析、建模和預測,對原本因危險性和成本過高而無法進行的實驗進行驗證。ASCR主導的跨學科項目包括:基于先進計算的科學發現(SciDAC)項目、理論與實驗創新計算項目(INCITE)項目和多尺度數學行動計劃(MMI)。
2010年初,INCITE項目宣布為69項涉及鋰空氣電池、納米太陽能電池、核燃料循環、先進推進系統、DNA測序、納米結構超導材料的微尺度現象的尖端研究分配約160億CPU小時的超級計算時間,支持他們取得突破性進展 ,而能源、環境、氣候變化和生物學是其中重點。
(3)日本下一代超級計算機戰略領域
2009年7月22日,日本下一代超級計算機戰略委員會確定了五大下一代超級計算機戰略領域及其在未來五年內擬實現的目標和預期成果 。包括:①預測生命科學、醫療及制藥基礎領域;②新物質和新能源開發;③災害現象及全球變化情況預測;④設計下一代新產品,對產品進行優化組合,模擬評價產品性能和壽命等;⑤物質與宇宙的起源與構造研究。
4.分布式計算基礎設施開創全新科研合作模式
分布式計算基礎設施,或者說網格,被認為是繼傳統Internet、Web之后的第三次浪潮。它逐漸改變了人們使用計算機及其相連設備的方式,為全球合作研究提供了新的途徑。通過網格技術,人們可以將高速互聯網、高性能計算機、大型數據庫、傳感器、遠程設備等融為一體,將分散在不同地理位置的電腦組織成一臺“虛擬的超級計算機”,實現計算、存儲、數據、信息、軟件、知識和專家等資源的全面共享。
(1)歐洲網格基礎設施項目(EGI)
2010年,歐盟啟動了新的網格建設項目——歐洲網格基礎設施(European Grid Infrastructure,EGI) ,試圖在當前世界最大的多科學網格“歐洲科研信息化網格”(Enabling Grids for e-Science,EGEE)的基礎上,建立一個基于國家網格計劃(NGI)的協作型泛歐網格基礎設施,以滿足不同學科對計算資源的需求。
(2)美國的TeraGrid XD項目
TeraGrid項目 于2001年8月由美國國家科學基金會(NSF)投資4500萬美元啟動,旨在構建全球范圍最廣、功能最全面、支持開放式科學研究的分布式網格計算體系。TeraGrid項目于2010年結束,其后續項目XD項目將于2011年4月1日啟動,并持續至2016年5月30日。XD項目 旨在建設一個能提供高端數字服務的網絡基礎設施,通過為科研教育人員提供可用的、超越一般程度的超級數字資源以及相關界面、建議和培訓,使科學和工程研究、科研和教育的融合、科學與工程研究合作范圍擴展等領域的工作取得重大進展。
(3)開放科學網格項目
美國開放科學網格(Open Science Grid,OSG)是由來自全美各所大學、國家實驗室和計算中心的軟件、服務和資源供應商共同組成的聯盟,旨在滿足所有層次的科學虛擬組織當前和未來的需求。OSG項目截至日期為2011年,其功能包括 :
①利用一套通用的中間件,將大學和研究團體的計算與存儲資源集中放置到一個通用、共享的網格基礎設施之上;
②使參與的研究團體能以低成本的方式訪問更多的資源;
③OSG虛擬數據工具包可為參與的計算和存儲節點提供相應的、經測試的支持軟件包,并為終端科研用戶提供客戶端軟件包;
④與科研團體通力合作,幫助他們評估自身網絡基礎設施需求并針對本地、國家和國際需求規劃解決方案。
5.云計算日益成為科研信息化的一大支柱
云計算作為未來發展的重要趨勢,已經引起科學界的高度重視。隨著云計算的不斷進步與完善,有許多科研機構開始積極嘗試利用云計算從事科研工作,并且已誕生不少成功案例,有人將這類云計算稱為“科學云”(Science Cloud)。
(1)云計算大幅降低了生命科學和醫學的研究成本生命科學和醫學是云計算應用的兩大熱點領域。云計算可以解決生命科學和醫學研究成本過高的難題。例如,美國威斯康星醫學院生物技術與生物工程中心開發出一套名為ViPDAC(虛擬蛋白質組學數據分析集群)的免費軟件,與Amazon公司的云計算服務搭配使用,能夠讓全世界的科學家通過云計算分析蛋白質組學數據,并利用大量的計算資源提高數據分析速度,為那些目前沒有大量計算資源使用權限的研究人員提供了更多選擇,并極大降低了蛋白質研究成本。美國約翰霍普金斯大學彭博公共衛生學院開發的基于云計算的Myrna軟件,可在大幅提高RNA序列數據分析速度的同時降低成本 。此外,IBM公司也計劃與美國密蘇里大學聯合創建用于基因組學研究的云計算環境 。
在醫學研究方面,哈佛醫學院在美國Platform公司的幫助下建立了內部云計算平臺,動態滿足了各部門的計算需求,并最大限度地降低了成本。其下一步的計劃是使用戶能通過內部云使用到Amazon EC2等外部云計算平臺的資源。歐盟BEinGRID項目為癌癥放射療法開發了一套云計算解決方案,能以低成本提供更強大的軟硬件資源,方便醫院更好更快地獲取結果。這套云計算方案還可用于圖像引導放射治療、強子治療、近距離放射治療等。
(2)云計算有助于改善數據傳輸與科研模擬
美國伊利諾伊大學研制成功一套云計算系統,可以通過高性能網絡將散布在各地數據中心的數據快速匯聚到一起,比同類系統的速度快6倍。美國華盛頓大學于2009年建立的面向海洋學和天文學研究的云計算網絡平臺可以處理容量巨大的數據集,進行海洋氣候模擬和天文圖片分析。而美國阿貢國家實驗室完成一種新型動態分布式科學計算云資源集成系統,能幫助物理學家動態地獲取云計算資源,以開展重離子仿真工作。云計算有助于實現長期模擬,從中發現變化趨勢,并將相關信息展示在互聯網上。