中美兩國人工智能頭部企業研發和創新的比較分析與啟示
中國網/中國發展門戶網訊 在日益數字化的時代,人工智能作為下一代技術被認為有望徹底改變人類社會。圖像分類、語音識別、對話生成、自動駕駛等相關領域正在迎來爆發式增長。鑒于人工智能對未來社會秩序的深遠影響,美國和中國等世界主要國家都在投入大量資源來開發和利用這項技術。中國目前在人工智能領域的論文和專利產出數量上處于領先地位,而美國在該領域的技術突破、企業活躍度和風險投資規模等方面保持優勢。
2022年11月,美國OpenAI公司的聊天生成式預訓練變換模型ChatGPT上線后,一周內用戶數量突破100萬人,2個月內用戶數量突破1億人,引發行業震動。這同時也給中國人工智能產業的從業者敲響了警鐘,引發了關于為什么此類顛覆式創新沒有誕生在中國的討論,以及中美兩國人工智能產業差距的深入思考。一些國內專家認為,中國在人工智能大模型領域起碼落后美國2—3年。此外,中國人工智能產業的發展很大程度上依賴于美國的芯片和開發框架等基礎技術,例如,TensorFlow和PyTorch這兩大開源機器學習框架在中國的市場份額達到85%以上,而人工智能基礎算法的專利也主要掌握在美國企業手中。
為了比較中美兩國人工智能產業的差異,基于過去5年在中國和美國提交的124026件人工智能授權發明專利數據,筆者構建了一個綜合考慮專利數量和其他特征的多維度指標,并據此定義了中美兩國人工智能領域的前十大企業。對這2組企業的進一步比較分析表明,盡管中國和美國在人工智能這一關鍵技術領域都被認為是領先國家,但中美兩國的頭部企業在技術影響力、布局及研發合作方面存在顯著差異。這些差異為中國人工智能產業的進一步發展提供了有效啟示,并突顯了中美兩國在人工智能領域開展更多優勢互補型合作的重要性。
識別中美兩國人工智能頭部企業
為了比較中美兩國人工智能產業的差異,本文從企業專利和論文入手,分析了中美兩國人工智能頭部企業的研發和創新情況。專利和論文是衡量企業研發活動和創新能力的2個重要指標:專利反映了企業在技術創新和知識產權保護方面的成就,而論文體現了企業在學術研究和理論探索方面的深度;專利更側重于技術的應用和商業化潛力,而論文則側重于基礎研究和理論貢獻,這種互補性有助于揭示企業在不同層面的創新表現;專利和論文的國際數據庫較為完善,數據容易獲取和比較,這為進行跨國比較分析提供了便利。
指標構建
為了定義中美兩國人工智能領域的前十大企業,首先構建了一個基于企業過去5年內獲得授權的人工智能發明專利的多維度指標。與單一維度指標相比,多維度指標能夠涵蓋企業在不同方面的專利表現,并減少單一指標可能造成的偏差。鑒于本文的核心焦點在于評估人工智能企業的研發和創新實力,優先考慮了5個關鍵維度——企業研發產出的總量、研發成果的影響力、研發成果的轉化效率、研發產出的市場擴展能力和研發成果受法律保護的程度。基于專利數據信息,分別選取了5個細分指標來測量上述關鍵維度并構建綜合指標:專利總數、專利的被引證的總次數、專利的被轉化(包括轉讓、許可、質押)總次數、專利的海外同族專利總數和專利的權利要求總數。
人工智能專利的定義來自世界知識產權組織(WIPO)界定的62個國際專利分類(IPC)代碼和114個聯合專利分類(CPC)代碼。利用incoPat專利檢索分析平臺(https://www.incopat.com/)分別檢索中國、美國2019年1月1日—2023年4月4日期間獲得授權的包含人工智能相關IPC和CPC的發明專利,合并申請號后獲得了來自美國的62201件專利和來自中國的61825件專利。本文選擇分析過去5年專利數據的主要原因是人工智能技術的快速迭代性。隨著技術的迅猛發展,較早申請的專利可能已經過時,甚至失效。中美兩國2019年1月1日—2023年4月4日(本文的樣本時間)獲得授權的人工智能發明專利中,僅有3.3%的專利失效,而2014—2018年專利的失效率則顯著提高,達到了23.3%。專利失效一般是由于專利權人未繳納年費、專利權人提前終止或專利未通過審查。因此,失效的專利無法代表當前產業中的前沿技術,對企業和國家提升科技競爭力的作用也有限。相較于分析更長時間內的專利數據,分析過去5年的專利數據更能揭示當前中美兩國人工智能產業的差異。
在對企業進行排序時,合作性質的專利按合作主體比例分配。例如,2個單位合作的專利每個單位將各占0.5。5個專利維度首先被賦予了相同的權重;根據加權后的綜合指標,可以對樣本內中美兩國所有企業進行排序。作為穩健性檢驗,也考慮了對指標賦予不同權重的情況。由于在使用專利數據測度企業技術創新績效時,專利數量和引證情況是較常見的2個指標,對其賦予了更高的權重:這2個指標的權重從之前的0.2增加到0.25,其他3個指標的權重從0.2下降到0.167。但新的排序結果與相同權重下的排序結果幾乎一致。
中美前十大人工智能企業
基于上述方法并對不同維度賦予相同權重,辨識出中美前十大人工智能企業樣本。表1列出了中美兩國綜合排序最靠前的10家人工智能企業。中國的頭部企業包括騰訊、百度、螞蟻和華為等,美國的領先企業包括IBM、微軟、谷歌和英特爾等。其中,浪潮集團雖然在人工智能發明專利總數上位列中國企業第1位,但綜合考慮專利的其他特征后該公司的排名降為第10位。
此外,中國人工智能頭部企業在其他4個專利維度上的表現也落后于美國頭部企業,這體現出中國人工智能企業在國際專利布局、專利保護、專利技術影響力和技術轉化應用方面存在進步的空間。
中美前十大人工智能企業的專利技術與科研合作分析
企業專利技術共現分析
為了進一步探索中美兩國前十大人工智能企業在技術布局上的差異,利用VOSviewer對這2組企業的人工智能專利類別進行了共現分析(co-occurrence analysis)。共現分析被廣泛應用于發現文獻或專利文本數據之間的關聯關系。其涉及創建一個可視化網絡,由文本主題或關鍵詞構成網絡節點,節點之間的連線代表它們之間的共現關系,由連線的粗細表示共現關系的強度。在專利分析中,這一分析有助于發現專利樣本是否形成了某些特定領域的技術集群,以及技術網絡中特定技術領域的中心性。
從人工智能產業發展的角度,人工智能技術可以分為3個層面:底層——基礎層、中間——技術層和上層——應用層。基礎層是人工智能產業的基礎,主要為人工智能產業發展提供數據與算力支持,包括數據平臺、傳感系統、算力、芯片、存儲等方面;技術層是人工智能產業的核心,以模擬人的智能相關特征為出發點構建技術路徑,包括機器學習、自然語言處理、計算機視覺與圖像、模式識別等技術;應用層是人工智能產業的延伸,通過集成一類或多類人工智能技術,面向特定應用場景需求而形成軟硬件產品或解決方案,涉及的領域有零售、金融、電商服務、安保、教育和醫療等。
圖1展現了中國前十大人工智能企業專利中出現頻率最高的前100項技術的共現關系;可以看到中國前十大人工智能企業的相關專利較為松散地構成了8個技術集群。比較突出的技術集群主要圍繞識別模式的方法或裝置、冗余數據錯誤檢測或校正、故障硬件檢測或定位等技術。表2進一步匯總了出現頻率最高的15項技術的信息,包括它們的出現頻率、與之共現的技術總數、與其他技術共現的總頻率(總連接強度)。“識別模式的方法或裝置”“電子設備識別方法或裝置”和“冗余數據錯誤檢測或校正”是出現頻率最高的三項技術,其中“電子設備識別方法或裝置”技術的總連接強度最高,與其他技術共現了763次。
圖2展示了美國前十大人工智能企業專利中出現頻率最高的前100項技術的共現關系;這些企業的專利數量更多,并且形成了更為明顯的6個技術集群。除了中國企業大力布局的識別方法或裝置、語音識別和數據錯誤檢測等技術,美國企業還更多地在人工智能基礎層和技術層布局。例如,美國企業在處理器架構和配置、基帶系統零部件、機器學習等領域擁有大量專利。根據表3的匯總信息,與中國的情況類似,“識別模式的方法或裝置”和“冗余數據錯誤檢測或校正”也出現在頻率最高的3項技術中。另外,“機器學習”出現的頻率排在第3位,達到1072次。“識別模式的方法或裝置”技術的總連接強度最高,與其他技術共現了2121次。
以上專利技術的比較分析展現出中美兩國人工智能頭部企業的技術發展差異。美國的頭部企業更加注重推動技術創新,專利數量遠為更多,并且涵蓋了更廣泛的技術類別。美國的頭部企業在處理器架構和配置、基帶系統零部件、機器學習等人工智能基礎層和技術層領域處于領先地位。這表明美國企業更加側重于在人工智能的核心技術和底層設計方面取得領先優勢,通過不斷創新來推動整個行業的進步。
相比之下,中國在人工智能技術的發展中表現出更強的實用性。中國企業在圖像識別、語音識別、故障硬件檢測或定位等領域展現了顯著的技術實力,這與中國在面部識別、語音識別等領域公認的國際領先地位相符合。這表明中國企業在人工智能技術落地上具有一定優勢,但在人工智能產業的基礎層和技術層上需要布局更多的研發工作。
企業科研合作對象分析
當前人工智能技術正處于爆發式增長期,研發合作不僅可以加速創新,還能通過分享資源和降低成本來提高企業的科技競爭力。鑒于企業在專利申請上進行合作并不常見,特從論文合作的角度來分析中美前十大人工智能企業的科研合作模式,并特別關注中美之間的合作。首先從inCites數據庫中檢索了上文定義的中美前十大人工智能企業過去5年在“計算機科學和人工智能”(Computer Science, and Artificial Intelligence)領域的所有英文學術出版物,包括期刊論文(包括綜述)和會議論文。考慮到中國企業可能發表中文論文,同時在中國知網上檢索了中美前十大人工智能企業過去5年在“人工智能”領域發表的中文學術期刊論文。
表4列出了每個企業的中英文論文總數。中國企業中,螞蟻、字節跳動、北京三快(美團)和浪潮的中文論文發表數量超過了英文論文,而其他企業的英文論文發表數量則明顯多于中文。產出最多人工智能論文的3家企業是騰訊、華為和百度,它們在過去5年分別產出了1366、1284和865篇論文。在檢索范圍內,阿波羅智能技術公司并沒有人工智能相關論文的產出。在美國企業中,Emc Ip Holding同樣沒有論文產出,但谷歌、微軟、Meta和國際商業4家企業在過去5年都產出了超過1000篇人工智能領域論文。從總量上看,中國前十大人工智能企業在過去五年發表的人工智能論文總數約為美國前十大企業的一半。因此,盡管中國的人工智能論文總數已超過美國,但這些論文很可能更多地來自大學和科研院所而非產業界。
接下來,根據合作論文的頻率定義了中美人工智能頭部企業論文合作上的前十大伙伴,并特別關注中美機構之間的合作。因為美國企業較少發表中文論文,下面的分析基于企業的英文論文數據。其中,中國的螞蟻、字節跳動、北京三快(美團)和阿波羅智能技術4家企業沒有英文論文產出,而國家電網、浪潮和格力3家企業相關論文數量較少且沒有中美合作論文。因此,表5只匯總了騰訊、百度和華為這3家企業的情況。可以看到,這3家企業的前十大人工智能領域論文合作伙伴幾乎都是國內頂尖的大學或科研院所,其中中國科學院同時是這三家企業合作最多的機構。此外,除了百度與羅格斯大學新布朗斯維克分校有著較廣泛合作外,騰訊或華為都沒有與美國機構建立起緊密的合作關系。百度與悉尼科技大學,以及華為與悉尼大學建立了緊密的合作。另外值得注意的是,這幾家中國人工智能頭部企業的科研合作對象局限在大學或科研院所,并沒有與其他人工智能企業建立起廣泛的研究合作關系。
表6匯總了美國的微軟、英特爾、亞馬遜和蘋果4家企業的前十大人工智能領域論文合作伙伴。由于國際商業、谷歌、福特、高通和Meta這5家企業的前十大論文合作伙伴中沒有來自中國的機構,它們的情況并未在表6中列出。其中,微軟和英特爾展現出了極強的中美科研合作。它們的主要中國合作機構包括清華大學、北京大學、上海交通大學、中國科學院、中國科學技術大學和北京航空航天大學。對于微軟來說,它與中國機構在人工智能領域的科研合作甚至可能超過了與美國本土機構的合作。此外,表6還顯示出美國人工智能頭部企業間一定的科研合作。例如谷歌同時是亞馬遜和蘋果的前十大人工智能論文合作伙伴之一,而蘋果也與Meta也有著較廣泛的合作。
為了更好地展示中美兩國人工智能頭部企業的合作伙伴選擇之間的差異,在表5和6的基礎上繪制了圖3進行對比。從圖3可以看出,與美國人工智能頭部企業相比,中國企業的研發合作網絡更多局限在國內頂尖大學和科研院所,應當更積極尋求跨國界的合作關系。此外,中國企業與美國同行相比的另一個差異體現在缺乏企業間的合作。與科研機構相比,企業在人工智能的技術突破和創新中扮演著越來越重要的角色。中國的人工智能頭部企業可以通過探索企業間科研合作模式,更大程度地發揮規模優勢和比較優勢,實現互利共贏。
主要結論與政策啟示
主要結論
鑒于人工智能在塑造政治、經濟和社會秩序方面的巨大潛力,世界主要國家都在大力發展這一領域。自2015年以來,黨中央、國務院發布了多份涉及人工智能的政策文件,其中2017年發布的《新一代人工智能發展規劃》將人工智能提升到了國家級戰略層面進行部署。美國從2013年開始部署國家層面的人工智能發展戰略,近年來更是立法提出要維護美國在人工智能領域的領導力和世界領先地位。盡管中美兩國均將人工智能發展納入國家戰略的重點領域,但兩國在技術創新和發展方向上存在顯著差異。
通過對比中美兩國前十大人工智能企業,本文發現了這2個人工智能領先國家在企業技術和研究合作方面的結構性差異。與美國的人工智能頭部企業相比,中國的頭部企業尚未在人工智能產業的基礎層和技術層形成領先的技術集群,尤其在處理器架構和機器學習等領域與美國存在較大差距。這一發現與一個普遍存在的觀點一致,即由于人工智能的開放科學性質和快速應用優勢,中國企業更傾向于投資圖像識別、語音識別等應用場景更明確的技術以獲得較快商業回報,而非投資具有更持久影響的基礎性技術。展望未來,中國企業需要加強在人工智能產業基礎層和核心技術層的研發。
在科研合作方面,以微軟和英特爾為代表的美國人工智能頭部企業已經與中國科研機構建立起了非常緊密的合作,共同發表人工智能領域的科研論文。而以百度、騰訊、華為等公司為代表的中國頭部企業仍然主要是與國內的大學和科研院所進行合作。此外,像谷歌、亞馬遜、蘋果和Meta這樣的美國企業雖然直接競爭,但它們仍在科研合作網絡中建立了明顯聯系。相比之下,中國前十大人工智能企業中沒有一家與國內其他人工智能企業建立了明顯的科研合作。鑒于企業間知識轉移在推動人工智能技術進步中的關鍵作用,中國企業需要培養更開放的合作文化,以期提高創新能力和競爭力。
政策啟示
對中國政府
從政策牽引的角度出發,可以從3個方面入手提升我國人工智能產業的競爭力。
加快設立人工智能領域的企業專項基金或通過稅收政策激勵企業加大對基礎研發的投入,以支持長周期的基礎研發項目。通過資金支持,可以強化目前企業在人工智能產業基礎層和技術層的薄弱環節。此外,基礎研發專項基金也將成為促使企業與科研院所建立更緊密合作關系的催化劑,鼓勵雙方從實際產業場景和實踐問題中挖掘技術邏輯和解決方案。對于在人工智能特定基礎技術領域進行研發的企業,還可以提供稅收優惠以降低其研發成本,鼓勵企業在人工智能更基礎性的技術上取得突破。
從人才隊伍培養和建設入手,促進人工智能企業的開放與彼此合作。政府可以考慮在大學和科研院所設立工程類專業研究生學位。此舉不僅有助于培養人工智能領域的專業人才,還可以成為促進人工智能企業間合作的平臺。例如,美國加利福尼亞大學伯克利分校的“人工智能開放共享研究”項目就通過與Meta、微軟、谷歌、亞馬遜等企業合作研究,并將其校園內的相關數據、代碼、結果以非獨家形式公開,以促進人工智能領域的開放式研究。在中國,政府同樣可以考慮通過鼓勵多家企業共同參與人工智能相關學位點建設,提供更多共享資源的機會,并間接促進企業在科學研究方面的合作。
加強中美兩國優勢互補型合作,共同推動解決未來人類社會發展所面臨的關鍵問題。中美兩國在人工智能方面如何開展優勢互補型合作也是發展中國人工智能產業需要重點考慮的問題。美國在人工智能基礎層和關鍵技術領域處于領先地位,而中國在人工智能相關人才、數據和應用場景上也具有獨特的優勢。中國政府可以考慮與美國政府共同設立合作研究項目,特別是在人類社會發展面臨的共同關鍵問題上進行合作,如醫療、環境、教育挑戰等。這些合作項目應該涵蓋政府部門、研究機構和企業,以提升中國人工智能企業的國際化合作程度,并通過有效整合資源、人才和技術專長推進全球人工智能產業的發展。
對于美國的人工智能產業
持續加強人工智能基礎技術的研究與資金投入至關重要。美國人工智能頭部企業在基礎技術層面擁有顯著優勢,這為全球人工智能的發展奠定了堅實基礎。通過投資長期研究項目,例如量子計算與人工智能的結合,將有助于探索下一代人工智能技術的潛力,為未來技術變革提供動力。
開放式創新是加速技術突破的關鍵。美國人工智能頭部企業應繼續深化與學術界及同行業企業的緊密合作,共同孵化新技術。特別是在與中國企業的合作方面,美國企業可以依托其在人工智能基礎研究方面的深厚積累,與中國企業在人工智能應用實施方面的廣泛經驗相結合,共同開發出滿足多樣化市場需求的解決方案。
作為人工智能領域的先鋒,美國企業應推廣利用人工智能技術解決全球性問題。例如,增加對能源、環境和生命健康等人類社會重大問題的研發投入,探索人工智能在解決全球性危機中的作用。
(作者:楊錫怡、周小宇,上海科技大學創業與管理學院;賈佳,上海科技大學圖書信息中心;汪壽陽,上海科技大學創業與管理學院 中國科學院預測科學研究中心 中國科學院數學與系統科學研究院。《中國科學院院刊》供稿)