發(fā)展階段層面,《展望》指出,按照行業(yè)整體需要解決的問題,可以把 AI for Science 的歷史和未來十年可預(yù)見的發(fā)展大致分為三個時期:以科學(xué)家為主導(dǎo)的“概念導(dǎo)入期”(2016-2021)、以科學(xué)家和工程師協(xié)作為標志的“大規(guī)?;A(chǔ)設(shè)施建設(shè)期”(2021-2026),和以工程師為主導(dǎo)的“成熟應(yīng)用期”(2026 年及以后),三個時期的演進也是人們對 AI for Science 開發(fā)程度不斷加深、使用范圍不斷擴大的過程。
AI for Science 的發(fā)展不僅取決于 AI 算法的應(yīng)用,還取決于大量經(jīng)典算法的改進和提升。算法迭代層面會經(jīng)歷從“簡單模擬”到“智能化搜索”3 個階段:1.0 階段的關(guān)鍵詞是“模仿”,即基于實驗的思路,在實驗基礎(chǔ)上進行簡單的外推和擴大;2.0 階段的關(guān)鍵詞是“預(yù)測”,即有邊界地預(yù)測,有明確、可驗證的置信區(qū)間;3.0 階段的關(guān)鍵詞是“搜索”,即算法可以非常準確的對真實場景進行建模,并在此基礎(chǔ)上根據(jù)特定需求設(shè)計并返回所需結(jié)果。
《展望》指出,目前正處于 2.0 階段,未來幾年內(nèi) AI for Science 的相關(guān)領(lǐng)域都將會完成 2.0 階段的算法升級,而后將逐漸進入到智能化設(shè)計的 3.0 階段,最終實現(xiàn) AI for Science 廣泛普及。
圖|AI for Science 的相關(guān)要素(來源:2023 版《AI4S 全球發(fā)展觀察與展望》)
AI for Science 的發(fā)展既包含 AI 行業(yè)的要素,也包含科學(xué)領(lǐng)域的要素,更需要來自產(chǎn)業(yè)和公共管理側(cè)的發(fā)展要素,所有這些要素相互交織影響,共同促成 AI for Science 發(fā)展的正反饋。
近十年來,AI 的強大之處大家有目共睹,但其“黑箱”屬性也向來被學(xué)界詬病,即能知其然卻不能知其所以然?!墩雇分赋?,由于 Science 本身的客觀存在性,將 Science 與 AI 融合為 AI 提供了絕佳的“驗證”步驟,讓 AI 在特定領(lǐng)域內(nèi)能產(chǎn)出“可解釋”的成果,而這不亞于為人類發(fā)現(xiàn)新的科學(xué)原理。
而在科學(xué)領(lǐng)域,從“數(shù)據(jù)”中可以提煉出經(jīng)驗性“原理”,亦可以使用“原理”來仿真模擬出“數(shù)據(jù)”,因此“數(shù)據(jù)”和“原理”在一定程度上能夠接近無損轉(zhuǎn)化。
圖|AI for Science 系統(tǒng)工程(來源:深勢科技)
AI for Science 在模型驅(qū)動和數(shù)據(jù)驅(qū)動深度融合的過程更像是一個系統(tǒng)化的工程,不僅需要原理層面的創(chuàng)新,也需要從基礎(chǔ)設(shè)施、產(chǎn)品、場景交互的全方面變革,各個場景可能都需要龐大的團隊來支撐和完成,同時這也意味著巨大的空間和機會。
AI4S 在多個領(lǐng)域的產(chǎn)研實踐
新版《展望》著重介紹了 AI for Science 在生命科學(xué)、材料科學(xué)、能源、半導(dǎo)體、地球與環(huán)境等眾多領(lǐng)域及細分領(lǐng)域的產(chǎn)研實踐。整體而言,在具體的實踐中,如何更好地構(gòu)建 AI-Science 之間的紐帶是核心的創(chuàng)新點,而這在不同的科學(xué)場景中其思路也不盡相同。
生命科學(xué)領(lǐng)域,在過去的十余年間,大量基于機器學(xué)習(xí)和深度學(xué)習(xí)的理解基因調(diào)控的方法被開發(fā)出來,AI 在驅(qū)動藥物研發(fā)和個性化醫(yī)療中取得新突破。如今,AI 正在藥物研發(fā)、疾病篩查、生物學(xué)機制研究等方面發(fā)揮著越來越重要的作用,未來,隨著 AI 的滲透,很多疾病的通路和影響因素將不再神秘,最終有望介導(dǎo)人類健康乃至整個生命科學(xué)領(lǐng)域的系統(tǒng)進步和重大突破。
圖|藥物研發(fā)的主要環(huán)節(jié)(來源:2023 版《AI4S 全球發(fā)展觀察與展望》)
以藥物研發(fā)為例,新藥開發(fā)過程是個多環(huán)節(jié)、漫長且昂貴的流程,每個環(huán)節(jié)的效率提高都有巨大的商業(yè)價值。如今,將 AI 與底層生物機制結(jié)合的新范式(AI for Life Science),正在從底層技術(shù)的突破為整個行業(yè)注入嶄新活力,帶來更多機會。
在 AI for Life Science 范式下,藥物研發(fā)過程中的大部分實驗可以像汽車、飛機等工業(yè)領(lǐng)域?qū)崿F(xiàn)仿真模擬,通過計算手段進行測試和篩選,再通過真實實驗進一步的驗證和篩選,能夠大幅減少真實實驗帶來的時間和經(jīng)濟成本的消耗。
AI for Life Science 的其他應(yīng)用,比如,當今比較熱門的 CAR-T 細胞療法,CAR 分子的胞外結(jié)構(gòu)域中識別抗原的單鏈抗體片段十分重要 ,AI 技術(shù)可被應(yīng)用于學(xué)習(xí)抗體片段規(guī)律,對抗體親和力或人源化性質(zhì)進行預(yù)測和推薦;再比如,Cas9 是 CRISPR-Cas9 基因編輯技術(shù)的重要組成部分,AI 算法可用于尋找毒性更弱的 Cas9 酶,同時還可以借助 AI 在酶設(shè)計中的應(yīng)用,嘗試對已知的 Cas9 酶進行優(yōu)化和改造。
合成生物學(xué)領(lǐng)域,AI for Science 的設(shè)計與合成生物學(xué)的工程模式相輔相成,共同打造“假設(shè)、構(gòu)建、測試、學(xué)習(xí)”的閉環(huán)(DBTL),并且還有可能基于自動化實驗室利用 AI 對于實驗的定量設(shè)計來反向補充數(shù)據(jù)庫,以及探索更多的規(guī)律,突破理性設(shè)計的瓶頸。