人工智能驅動的科學研究新范式:從?AI4S到智能科學
中國網/中國發展門戶網訊 在全球迎來前所未有之大變局的時代背景之下, ChatGPT在2022年底一經推出便掀起新一輪人工智能(AI)浪潮。以?ChatGPT?為代表的大模型技術影響空前深遠,正推動?AI技術從特定應用和游戲等領域進入人們日常生活,成為切切實實的生產力工具,人類社會的智能化革命已經拉開帷幕。
圖靈獎得主?Jim Gary?認為科學研究經歷了經驗范式、理論范式、計算范式、數據驅動范式等?4種范式。當前,許多科學家認為科學研究正在迎來新的范式,即第五范式。第五范式以虛實交互、平行驅動的?AI技術為核心,以智聯網和區塊鏈構建基礎,考慮人的價值和知識的融入。在產業方面,第五范式也稱為工業?5.0。而?AI?驅動的科學研究(AI for Science,AI4S),更是新范式在基礎科研的深度體現。
近期,科學技術部會同國家自然科學基金委員會啟動“人工智能驅動的科學研究”(AI for Science)專項部署。本文通過概述?AI4S?發展現狀、分析典型?AI?應用范例,進一步探討?AI4S范式創新之路。
AI4S發展現狀簡述
近幾年來,在深度學習等?AI?技術的推動下,AI4S?在數學、物理學、生物醫學、材料科學等領域取得了許多令人矚目的成績。
數學領域。2017?年以來,科學家嘗試使用機器學習、ResNet、seq2seq?模型等技術求解偏微分方程,獲得了更快更準的結果。2021?年,DeepMind開發了啟發數學家直覺靈感的機器學習框架,幫助數學家和?AI?研究人員在?Knots?理論方面發現新定理,證明了已提出?40?年之久的?Kazhdan-Lusztig?多項式。2022?年?10?月,同樣是?DeepMind?在?Nature?發文,推出在?AlphaZero(前身是著名的?AlphaGo)基礎上開發的AlphaTensor,并通過強化學習找到了矩陣相乘的最快算法。DeepMind?的系列工作,為?AI?驅動的數學研究(AI for Math)提供了可供參考的新范式。
物理領域。AI?方法除了用于實驗數據處理和分析之外,還幫助科學家設計實驗、優化參數。20世紀?90?年代,高能與核物理學界就使用神經網絡和符號?AI?輔助研究。2014?年,人工神經網絡贏得了?ATLAS?實驗中識別希格斯玻色子的挑戰。2015?年,歐洲核子研究組織?CERN?成立了機器學習工作組來處理大型強子對撞機(LHC)產生的海量數據。2022?年2?月,DeepMind?在?Nature?上發表了其工作:通過深度強化學習對托卡馬克等離子體進行磁控。2022?年?8?月,物理學家使用人工神經網絡找到了質子中存在隱性內含粲夸克(intrinsic charm quarks)的證據,這一發現可能會改寫量子色動力學的教科書。
生物醫學領域。AlphaFold?是?AI4S?領域最成功的代表。從?2016?年開始,DeepMind?構建?AI?系統來挑戰蛋白質三維結構預測任務。AlphaFold?將預測誤差縮小到原子尺度,而計算時間從數年縮減到數分鐘,顯著提升了效率。DeepMind?宣布其?2?億個蛋白質結構預測向世界各地的科學家提供開放訪問,這對加速藥物研究具有重大意義。除?AlphaFold?外,華盛頓大學開發的?RoseTTAFold、中國科學技術大學研發的?SCUBA等模型,也在該領域不斷突破。
材料科學領域。2011?年,美國提出“材料基因組計劃”(MGI),旨在解碼材料的不同組成成分和性能的對應關系,借助高通量計算、大數據、AI等技術,有效縮短了材料研發周期、降低了研發成本。2016?年?Nature?發布了美國哈弗福德學院和普渡大學的研究成果,科研人員利用機器學習算法,用“失敗”的實驗數據預測了新材料合成,這啟示機器學習等?AI?技術成為材料科學的重要研究方式。
正如我們所見,AI?在科學研究中的角色隨著深度學習的繁榮而發生了變化。早期,AI?方法只是作為輔助工具,幫助分析實驗數據。如今,AI?方法已成為更復雜任務(如定理證明、結構設計和知識發現)實現過程中的關鍵技術。AI?還在不斷拓展學科領域,“人工智能驅動的科學研究”專項部署重點面向數學、物理學、化學、天文學等基礎學科,必將為這些學科快速發展帶來新契機。
熱點背后的AI范式分析
在算法、數據、算力三大引擎的驅動下,深度學習時代下的?AI?研究進展迅速,AlphaGo、AlphaFold、ChatGPT?等成為?AI?發展歷史上一座座里程碑。分析這些案例特點,總結成功經驗,對于?AI?后續的創新和應用具有十分重要的啟發意義。
AlphaFold?研究范式
DeepMind?推出的?AlphaFold?系列是?AI4S?的最成功的代表之一,尤其是第二代?AlphaFold2?在?2020?年全球蛋白質結構預測比賽(CASP14)中拔得頭籌,蛋白質三維結構預測準確性接近實驗結果。AlphaFold2?的目標是根據輸入的一維氨基酸序列預測蛋白質的三維結構,其成功可以歸因于領域知識與深度學習前沿技術的融合。
從深度學習的角度來看,AphaFold?2?有?3?個亮點。① AlphaFold?2?淘汰了第一代所采用的卷積神經網絡(CNN)特征提取結構,替換為基于注意力機制的性能更強的Evoformer。② AlphaFold?2?不是簡單的單向處理流程,而是采用了循環迭代優化。③ AlphaFold?2?同時使用帶標簽和未帶標簽的數據進行網絡訓練,并融入含噪自蒸餾處理。整體來看,AlphaFold?2?是一個包含多種算法和學習策略的系統化方法。
從知識融合的角度來看,相對于神經網絡模型層面的創新,多元知識的表示和融合在?AphaFold?2?中扮演著更為關鍵的角色。①蛋白質結構預測是一個專業方向,科學家通過數十年的研究積累了寶貴的知識和數據。ApphaFold?2?使用了?2?種類型的數據集:一種是序列數據集,如?UniRef?90、BFD、MGnify?等。基于“同一位置的氨基酸在物種間是不變的,2?個不同位置的氨基酸同步變化”這一領域知識,AlphaFold?2?從遺傳序列數據庫中搜索并構建多序列比對(MSAs),而?MSA?的質量決定了 ApphaFold?2?的預測準確性;另一種是結構數據集,如?PDB?和?PDB70?等。ApphaFold?2?從這些結構數據集中搜索并構建殘基之間關系的配對(pair)表示。通過這種方式,一維氨基酸序列通過領域知識和數據集進行擴充,形成?2?個二維關系表示。② Evoformer?接收?MSA?和?Pair?表示,在行、列?2?個維度進行注意力計算,完成?2?種表示的交叉融合。需要注意的是,在配對(pair)表示的注意力計算中引入了幾何知識,即氨基酸之間的距離要滿足三角不等式約束。③在結構預測模塊中,利用三維空間結構平移和旋轉等變的知識,ApphaFold?2?引入了不動點注意力(IPA)計算。根據?IPA?輸出的殘基相對位移和旋轉,AlphaFold?2?進一步預測原子的空間位置。④引入?OpenMM?中的?Amber?力場優化工具,以確保輸出的三維結構滿足立體化學約束。
從對?AphaFold?2?研究范式的分析可以看出,其特點是深度學習技術與各類知識的有機融合,涵蓋了知識、數據、算法、算力這?4?種第三代?AI?的核心要素。因此,圍繞深度學習,研究知識獲取、知識表示、知識集成、知識利用,即知識自動化方法,探索“知識-學習”協同組織形式,開發協助?AI4S?研究的系統化基礎框架,應當得到?AI?界和科學界的共同重視和大力投入。
ChatGPT?研發范式
自?2022?年?11?月起,ChatGPT?掀起新一輪?AI?全球浪潮。ChatGPT?因其能夠進行多輪對話、承認錯誤、反駁錯誤前提和拒絕回答不恰當的問題而享有盛譽。ChatGPT?在回答問題的準確性和邏輯完整性方面超越了現有的聊天機器人,在遵守道德、倫理、法律方面也有很好的表現。ChatGPT?是?OpenAI?近年來研發的一系列?GPT?模型在對話場景的實例,有?3?個技術特征。
ChatGPT?基于大規模預訓練語言模型,即著名的?GPT-3?系列(GPT-3.5)。在過去的幾年里,大規模的預訓練模型發展迅速。大規模預訓練模型通過學習大量的公開數據,將學習到的知識存儲在大規模參數之中,不斷刷新多個領域中多數任務的最高性能紀錄,是通向通用人工智能的可行路徑。
ChatGPT?使用人類反饋強化學習(RLHF)在?GPT-3.5?上進行微調。微調是包含?2?個數據集的過程,共有?3?步:第一步,由?2?個?AI?訓練師基于給定采樣提示(prompt)通過對話生成人類演示數據集,用于?GPT-3.5?微調訓練,結果稱為有監督微調模型(SFT)。第二步,通過?AI?培訓師和聊天機器人之間的對話收集比較數據集,對?SFT?模型輸出的多個結果,由?AI?培訓師給出從最好到最差的打分排序。之后,用這個排序數據集訓練強化學習的獎勵模型,此過程也是有監督的方式。第三步,使用近端策略優化(PPO)算法,由獎勵模型生成?reward,通過強化學習進一步微調?SFT?模型。第二步和第三步重復多次,最后得到?PPO?模型,即?ChatGPT。
GPT?模型按照“開發-部署”的理念迭代完善。將初步開發完成的模型部署上線,為用戶提供測試服務,由此收集用戶與模型的交互數據作為進一步優化模型的基礎。開發(學習)和部署(應用)形成閉環,這種迭代優化策略在降低語言模型誤用風險方面起著至關重要的作用。
ChatGPT?范式再次展示了預訓練大型模型的強大功能,凸顯了人類在引導大模型遵循人類規則方面的重要作用。由此可見,針對大模型的微調、上下文學習、指示學習、提示學習是?AI?的重要研究方向。
探索AI4S研究新范式
AI?本身的研究范式也在不斷轉變。自?AI?誕生之初,人們基于幾個基本假設(如獨立同分布、Markov屬性等),使用初級方法(如?Perceptron等)解決簡單的問題(如簡單的二元分類、回歸等),并由此產生了?3?種基本范式——監督學習、無監督學習和強化學習。但面對復雜問題時,這些基本范式存在局限性。因此,隨著新的算法(BP?算法、分層訓練等)和模型(CNN、長短期記憶人工神經網絡?LSTM?等)的出現,AI?逐漸發展出主動學習、遷移學習、終身學習等新范式。近年來,AlphaGo?和?ChatGPT?等前沿進展以其革命性的成就引領了新一輪的范式轉變。從范式轉變的角度看待人工智能的發展,對促進探索?AI4S?創新應用具有重要價值,為此,以下從算法、模型、數據、知識、人的角色等方面進行分析。
算法
算法是人工智能的基石。典型?AI?新范式中使用的算法不僅限于機器學習,還涉及整個人工智能領域,包括搜索和推理。例如,AlphaGo?的主干是蒙特卡洛樹搜索(MCTS)算法。近年來出現的新算法,例如受熱力學啟發的擴散模型(Diffusion Model),在AI生成內容(AIGC)領域顯示出巨大潛力。由此可以看出,Science for AI?對?AI?算法創新也具有重要意義,應得到同?AI4S?一樣的重視。
模型
機器學習模型的創新是推動人工智能發展的核心要素。尤其是神經網絡新架構:從?M-P?模型到?Perceptron,從?LeNet?到?ResNet,從?LSTM?到?Transformer。AlphaGo?以?CNN?為主干網絡,用于提取棋局特征、輔助走棋決策和棋局評估。AlphaFold?2?用Transformer(EvoFormer)替換?CNN?模型,這是其性能相比第一代有巨大提升的主要原因之一。ChatGPT?建立在基礎模型(GPT-3)之上,充分利用了大規模預訓練語言模型的力量。利用大模型的規模效應,研究利用?prompt?等方法引導大模型釋放內在能力,是?AI4S?重要方向之一。
數據
數據是深度學習的三大核心驅動力之一,但存在標簽數量少、標注成本高、分布不平衡、隱私保護等問題。主動學習、溯因學習、對比學習、平行學習和遷移學習等學習范式,能夠在一定程度上克服數據標注的不足;而多任務學習、遷移學習、元學習和終身學習,在一定程度上能克服不同任務之間存在數據不平衡問題;聯邦學習可用來解決數據安全和隱私問題。
新范式在數據的使用方面有更多亮點,Syn2Real和?Sim2Real?等數據生成方法得到越來越多的重視。例如,AlphaGo?首先在人類棋局上訓練策略,通過自我對弈產生更多的數據來訓練更強大的策略網絡,進而產生更多的數據來訓練強大的價值網絡。AlphaFold?充分利用遺傳數據和結構數據,還通過自蒸餾的方式使用未標注數據來彌補標注數據的不足。ChatGPT?使用人類的演示數據來微調?GPT-3.5,并通過?prompt?在聊天機器人和?AI?訓練師之間生成更多的數據,進一步訓練獎勵模型將數據生成過程自動化。這些范式具有一個共同特征,即它們在缺乏標記數據時嘗試生成數據以提高性能。
知識
AI?基本范式很少顯式引入知識,但在模型設計(如?CNN)時引入的偏差(bias)也可以看作是先驗知識。中級范式通常有?3?種引入知識的方式:①直接(如主動學習)或間接(如課程學習)通過學習策略的設計來提高學習性能;②使用從先前任務或其他任務(數據)中學到的知識來幫助新的學習任務。例如,多任務學習、遷移學習、元學習、平行學習等;③整合上述?2種方法,設計并維護一個專門的知識庫來輔助學習過程。例如,終身學習和溯因學習等。
目前,大多數機器學習范式都采用知識的嵌入表示,以便將知識融合到學習過程中;但其中有?2個例外,即終身學習和歸納學習,它們具有獨立的知識庫。我們還發現反饋對于學習中的知識獲取、整合和自動化至關重要。高級范式高度依賴知識,例如,AlphaGo?首先利用人類棋手的經驗(可看作一種知識)訓練策略網絡,然后利用圍棋規則(也是一種知識)通過強化學習改進策略,進一步通過自我對弈生成大量棋局。AlphaFold?整合了生物學家的發現,以及來自遺傳學、數學和化學領域的知識,這種高級范式是知識密集型的代表,為?AI4S?的進一步研究提供重要參考。ChatGPT?的基礎是大規模預訓練語言模型(GPT3),可以看作是從海量數據中提煉出來的隱性知識庫,而提示工程(prompt engineering)是引導大模型生成內容并對齊到人類會話風格、倫理和規范的過程。
運用知識的能力很大程度上決定了學習能力。然而,將知識整合到機器學習的過程中具有很大挑戰,知識的獲取、表示、集成、利用等環節通常需要人類的參與。“人工智能驅動的科學研究”專項部署強調圍繞藥物研發、基因研究、生物育種、新材料研發等需求,而知識融入這些專業性強的?AI4S?領域中尤為突出。為此,將大模型打造為知識工廠,研究服務于科學家的知識自動化方法,將是推動高效?AI4S?的重要保障。
人的因素
在深度學習之前,依賴于人類的特征工程在?AI?研究中起著決定性的作用。特征工程既費時又低效,而深度學習解決了這個問題。深度神經網絡能夠自動、準確、高效地提取特征,由此,端到端學習模型越來越受歡迎。然而,在某些應用中,人扮演著重要的角色,如提出要求、設定目標、提供知識、實施控制、執行評估等。因此,端到端學習不是最終目標,不能簡單地將人類從機器學習過程中移除。人類在環(human-in-loop)模式的價值在?ChatGPT?的成功中顯而易見,其中來自人類反饋的強化學習(RLHF)發揮了關鍵作用。
除以上因素之外,開展?AI4S?研究的組織方式也是不可回避的重要問題。當前,國際上多種針對產品開發的?DAO(分布式開放自主組織)和針對基礎研究的?DeSci(分布式開放科學運動)正蓬勃興起,特色就是利用智能科學與技術(IST),基于區塊鏈和智能合約的數字組織和數字治理。ChatGPT?的誕生本質上也是得益于這種模式,DeSci?和?DAO?也值得我們關注。
(作者:王飛躍,中國科學院自動化研究所;繆青海,中國科學院大學人工智能學院;編審:楊柳春,《中國科學院院刊》供稿)