新智元報道
編輯:喬楊【新智元導讀】DeepMind聯(lián)合帝國理工學院的學者,專注于用神經(jīng)網(wǎng)絡(luò)方法對量子力學中經(jīng)典的薛定諤方程進行近似求解。繼2020年提出FermiNet后,團隊的最新成果求解量子激發(fā)態(tài),登上Science。繼AlphaFold 3掀起生物學革命后,DeepMind又要開始發(fā)力量子力學了。
8月22日,他們最新的研究成果FermiNet登上了Science,使用神經(jīng)網(wǎng)絡(luò)對量子激發(fā)態(tài)進行準確計算。
而是將問題轉(zhuǎn)化為尋找擴展系統(tǒng)的基態(tài)問題。論文介紹了一種通過變分蒙特卡羅(variational Monte Carlo)估計量子系統(tǒng)激發(fā)態(tài)的算法,而是將問題轉(zhuǎn)化為尋找擴展系統(tǒng)基態(tài)的問題,因此非常適用于神經(jīng)網(wǎng)絡(luò)分析。
通過在兩種不同的神經(jīng)網(wǎng)絡(luò):FermiNet和Psiformer上運行,作者驗證了這種方法的準確性。
其中FerminNet同樣由DeepMind和帝國理工學院于2020年聯(lián)名提出,論文發(fā)表在期刊《Physical Review Research》上。
這篇論文展示了深度學習如何幫助求解量子力學基本方程,提出的創(chuàng)新網(wǎng)絡(luò)架構(gòu)FermiNet非常適合對大量電子集合(即化學鍵的基本構(gòu)建塊)的量子態(tài)進行建模。
更重要的是,F(xiàn)ermiNet首次展示了,如何用深度學習方法、根據(jù)第一性原理計算原子和分子的能量,其準確度足以發(fā)揮實際作用。
這不僅是一個重要的基礎(chǔ)科學問題,而且還可能在未來產(chǎn)生實際用途,比如在制造新材料和化學合成物之前,使用計算機進行模擬或原型制作。
此外,F(xiàn)ermiNet在蛋白質(zhì)折疊、玻璃動力學、晶格量子色動力學等領(lǐng)域都可能有廣泛的用途。
FeimiNet相關(guān)代碼已經(jīng)公布在GitHub上,方便計算物理和計算化學領(lǐng)域相關(guān)研究的參考。
除了FermiNet,DeepMind在2022年發(fā)布的基于自注意力的架構(gòu)Psiformer仍然是迄今為止用于求解量子力學方程的最準確的AI方法。
量子力學簡史
沒有什么比「量子力學」這四個字更能讓人困惑的了,畢竟這是讓普朗克都為之頭禿的領(lǐng)域。
比如薛定諤思維實驗里那只又死又活的貓,還有經(jīng)典物理完全無法描述的粒子和波的性質(zhì)同時存在。
在經(jīng)典模型中,原子核位于中間,固定數(shù)量的電子繞著固定的軌道運行,如同太陽系一般嚴謹有序。
但在量子系統(tǒng)中,電子等粒子完全沒有這種精確的軌道,它們的位置是由「概率云」描述的。
「概率云」是什么意思?
這個模型告訴我們,原子中的電子沒有固定的運動軌跡,也沒有確切的位置,只能用「電子概率密度」描述它們在某個區(qū)域出現(xiàn)的概率。
然而,概率云模型給我們的僅僅是「概率」而已,無法真正判斷電子在任何特定時刻是否位于某個區(qū)域。
這種情況已經(jīng)超出了一般人類能理解的范疇,因此著名物理學家Richard Feynman才會宣稱:「如果你認為自己理解量子力學,那你就根本不理解量子力學。」
雖然直覺無法理解,語言解釋起來也很困難,但是理論的核心內(nèi)容可以用非常簡潔的數(shù)學語言描述。
所以計算機科學領(lǐng)域常聽到的「Talk is cheap, show me your code」,在理論物理也有類似的一句話「Shut up and calculate」。
在核心的幾個方程中,最著名的是薛定諤方程,足以描述所有熟悉物質(zhì)在原子和原子核水平上的行為。
化學中的共價鍵,或者超導體、超流體、激光和半導體的各種反直覺性質(zhì),都是電子間量子相互作用的結(jié)果,也都可以用薛定諤方程來描述。
上世紀20年代,量子力學的相關(guān)規(guī)則出現(xiàn)后,科學家們第一次可以用詳細理論描述化學反應(yīng)的最底層原理。
比如,對不同分子建立相應(yīng)方程,求解系統(tǒng)的能量,就可以找出哪些分子處于穩(wěn)定態(tài),哪些分子間會自發(fā)地發(fā)生反應(yīng)。
然而,理想很美好,現(xiàn)實很骨感。
當科學家們實際開始計算時,他們發(fā)現(xiàn),只有氫原子的方程可以求解其他的都太復(fù)雜了,算不出來。
因此,量子力學奠基人之一、物理學家Paul Dirac在1929年說了這樣一句話,到今天依舊適用
「要描述大部分物理學和整個化學的數(shù)學理論,所必需的基本物理定律是完全已知的。困難只在于,要精確應(yīng)用這些定律的話,會導致方程過于復(fù)雜而無法求解!
「所以,我們需要開發(fā)能應(yīng)用量子力學的近似方法。」
Dirac之后,物理學家使用了一種近似方法,將電子分配到一個特定的軌道,每個軌道的形狀由所有其他軌道平均得到。
這種「平均徹方法只給每個電子分配一個軌道,因此對電子實際行為的描述非常不完整,但依然是一個可行的方法,對分子總能量的估算誤差在0.5%左右
原子軌道示意圖,藍色或紫色區(qū)域的表面表示最有可能找到電子的區(qū)域;藍色區(qū)域波函數(shù)為正,紫色區(qū)域波函數(shù)為負然而,誤差為0.5%的方法依舊不夠。
要知道,分子鍵能量僅僅占系統(tǒng)總能量中的微小部分,想正確預(yù)測分子是否處于穩(wěn)定態(tài),要依靠占比0.001%的能量差值來判斷,或剩余相關(guān)能量中的0.02%。
相比電子平均場,近幾十年開發(fā)的多種計算方法都取得了進步,但總是不能在同時達到令人滿意的準確率和計算效率。
為費米子量身定做神經(jīng)網(wǎng)絡(luò)
表示量子系統(tǒng)的挑戰(zhàn)之處在于,必需為每種可能的電子位置分配相應(yīng)概率,這就構(gòu)成了一個極其龐大的構(gòu)型空間。
比如,單單是硅原子,其可能的電子構(gòu)型數(shù)量就會比宇宙中所有原子的數(shù)量加起來還要多。而這正是深度神經(jīng)網(wǎng)絡(luò)的用武之地。
過去幾年中,神經(jīng)網(wǎng)絡(luò)在表示復(fù)雜的高維概率分布方面取得了巨大的進步,而且能以有效、可擴展的方式進行訓練。它們在AI領(lǐng)域中擬合高維函數(shù)的能力,或許也能用于表示量子的波函數(shù)。
泡利不相容原理處理電子時,還需要考慮一個問題電子必須遵守泡利不相容原理(Pauli exclusion principle),這意味著它們不能同時處于同一空間。
因為電子屬于「費米子」,其波函數(shù)必須是反對稱(antisymmetric)的。如果交換兩個電子的位置,波函數(shù)就會乘以-1。這意味著如果兩個電子彼此重疊,則波函數(shù)(以及該構(gòu)型的概率)將為零。
這意味著我們需要開發(fā)一種新的神經(jīng)網(wǎng)絡(luò),接受反對稱結(jié)構(gòu)的輸入這就是FermiNet。
矩陣的行列式恰好具有這種「反對稱」屬性:如果交換兩行,輸出就會乘以-1,就像費米子的波函數(shù)一樣。因此在大多數(shù)量子化學方法中,「反對稱性」是通過行列式引入的。
Slater行列式就采用了這種思路:使用單電子函數(shù)對系統(tǒng)中的每個電子進行評估,并將所有結(jié)果打包到一個矩陣中,該矩陣的行列式就是反對稱波函數(shù)。
Slater行列式的動畫演示:每條曲線都是上面所示軌道之一的切片當,電子1和2交換位置時,對應(yīng)于Slater行列式發(fā)生行交換,波函數(shù)乘以-1,保證遵循泡利不相容原理在表示復(fù)雜函數(shù)方面,深度神經(jīng)網(wǎng)絡(luò)通常比基函數(shù)的線性組合更有效。
在FermiNet中,進入行列式的每個函數(shù)都是所有電子的函數(shù),這遠遠超出了僅使用單個電子或兩個電子構(gòu)建函數(shù)的方法(如Slater行列式)。
此外,F(xiàn)ermiNet中每個電子都對應(yīng)單獨的信息流。但如果這些流之間沒有任何交互,F(xiàn)ermiNet的表達能力也不會比Slater行列式有所提升。
因此,網(wǎng)絡(luò)中每一層所有流的信息都被平均后,才會傳遞到下一層的信息流中,這類似于圖神經(jīng)網(wǎng)絡(luò)在每一層聚合信息的方式。
因此,與Slater行列式不同,如果神經(jīng)網(wǎng)絡(luò)層變得足夠?qū)挘現(xiàn)ermiNet就可以作為通用函數(shù)逼近器。這意味著,如果得到正確訓練,F(xiàn)ermiNet就能夠擬合薛定諤方程的近似精確解。
FermiNet的動畫演示:網(wǎng)絡(luò)的單個流(藍色、紫色或粉色)的功能與傳統(tǒng)軌道非常相似。FermiNet引入了流之間的對稱交互,使波函數(shù)更加通用、表達能力更強,且保留了Slater行列式的反對稱特性
變分量子蒙特卡羅如果要準確地通過最小化系統(tǒng)能量來擬合FermiNet,就需要評估所有可能出現(xiàn)的電子構(gòu)型的波函數(shù)。顯然,我們不能直接計算其精確值,只能估算其近似值。
我們隨機選擇電子配置,評估每種電子排布的局部能量,將其相加后進行最小化。
與直接計算真實的能量最小值不同,這種估算方法被稱為蒙特卡羅方法(Monte Carlo method),有點像賭徒一遍又一遍地擲骰子。雖然得到的只是近似值,但如果需要使其更精確,我們隨時可以再次擲骰子。
這些電子排布的樣本從何而來呢?
由于波函數(shù)的平方給出了在任何位置觀察到某種特定粒子排布的概率,因此從波函數(shù)本身生成樣本是最方便的本質(zhì)上是模擬觀察粒子的行為。
雖然大多數(shù)神經(jīng)網(wǎng)絡(luò)根據(jù)外部數(shù)據(jù)進行訓練,但在FermiNet中,用于訓練的輸入數(shù)據(jù)由神經(jīng)網(wǎng)絡(luò)本身生成的。這意味著,除了指定原子核的結(jié)構(gòu)和位置,我們不需要任何額外的訓練數(shù)據(jù)。
這種思想被稱為「變分量子蒙特卡羅」(variational quantum Monte Carlo, VMC)。雖然60年代就被提出,但通常被認為是一種低成本且不精確的計算方法。
通過用FermiNet替換Slater行列式,VMC成功「改頭換面」,準確率得到了極大的提升。
從FermiNet采樣:模擬電子圍繞雙環(huán)丁烷分子移動
實驗結(jié)果
我們首先從簡單的、經(jīng)過充分研究的系統(tǒng)開始:元素周期表第一行中的原子(氫到氖)。
這些都是小型系統(tǒng),電子數(shù)≤10個,而且足夠簡單甚至簡單到可以用最準確且最昂貴(指數(shù)擴展)的方法來處理它們。
結(jié)果發(fā)現(xiàn),F(xiàn)ermiNet的性能遠遠優(yōu)于類似的VMC方法相對于計算量以指數(shù)級別增長的方法,誤差通常能降低一半或更多。
在較大的系統(tǒng)上,指數(shù)擴展的方法過于復(fù)雜,因此使用耦合聚類方法(coupled cluster method)作為基線。
耦合聚類方法對于穩(wěn)定構(gòu)型的分子效果很好,但很難應(yīng)對化學鍵拉伸或斷裂時的情況,而后者對于理解化學反應(yīng)恰恰至關(guān)重要。
另外,雖然這種方法的計算效率比指數(shù)擴展的方法要好得多,但實驗所用方法的計算量仍以電子數(shù)量的七次方的速度增加,因此也只能用于中等大小的分子。
下一階段,將FermiNet應(yīng)用于逐漸變大的分子,從氫化鋰到雙環(huán)丁烷。
對于最小的分子,F(xiàn)ermiNet捕獲了耦合簇能量和單個Slater行列式獲得的能量之間的99.8%的差異。
雙環(huán)丁烷是我們研究過的最大的系統(tǒng),有 30 個電子,F(xiàn)ermiNet仍然捕獲了97%或更多的相關(guān)能量(correlation energy),考慮到我們應(yīng)用的方法非常簡單,這是一個巨大的成就。
FermiNet在分子上捕獲的相關(guān)能量比例:紫色表示99%的相關(guān)能量,從左到右:氫化鋰、氮氣、乙烯、臭氧、乙醇和雙環(huán)丁烷。計算激發(fā)態(tài)的新方法
除了2020年提出的FermiNet,在Science上最新發(fā)表的成果中,DeepMind為計算量子化學領(lǐng)域中最困難挑戰(zhàn)之一提出了解決方案了解分子如何在激發(fā)態(tài)之間轉(zhuǎn)變。
FermiNet最初專注于分子的基態(tài),即給定一組原子核,找到其周圍電子的最低能量排布。
但是,當分子和材料受到大量能量的激發(fā)時,例如光照或高溫,電子可能會進入更高的能量狀態(tài)激發(fā)態(tài)。
激發(fā)態(tài)是理解物質(zhì)與光相互作用的基礎(chǔ),不同的分子和材料會吸收/釋放確切數(shù)量的能量,這相當于它們獨特的指紋。
對這方面原理的理解影響著太陽能電池板、LED、半導體、光催化劑等技術(shù)的性能,也在涉及光的生物過程中發(fā)揮著關(guān)鍵作用,例如光合作用和視覺。
準確計算激發(fā)態(tài)能量比計算基態(tài)能量更具挑戰(zhàn)性。即使是基態(tài)化學的黃金基準方法,如上面提到的耦合簇,在計算激發(fā)態(tài)能量時也會有大數(shù)十倍的誤差。
雖然我們希望將FermiNet的工作擴展到激發(fā)態(tài),但目前來看,神經(jīng)網(wǎng)絡(luò)還不能與與最先進的方法競爭。
因此,這篇論文提出了一種計算激發(fā)態(tài)的新方法,比以前的方法更強大、更通用,可以應(yīng)用于任何類型的數(shù)學模型,包括FermiNet和其他神經(jīng)網(wǎng)絡(luò)。
其工作原理是找到具有額外粒子的擴展系統(tǒng)的基態(tài),因此對現(xiàn)有的優(yōu)化算法進行少量修改即可使用。
論文在廣泛的基準上進行了驗證,并取得了非常理想的實驗結(jié)果。carbon dimer
在雙原子碳(carbon dimer)這種小而復(fù)雜的分子上,該方法實現(xiàn)了4meV的平均絕對誤差 (MAE),而之前的gold standard方法,誤差為20meV,相當于五倍更接近實驗結(jié)果。
雙原子碳示意圖此外,作者還在計算化學中一些最具挑戰(zhàn)性的系統(tǒng)上進行了測試,比如兩個電子同時被激發(fā)。結(jié)果發(fā)現(xiàn)。與迄今為止完成的最苛刻、最復(fù)雜的計算相比,誤差僅在0.1 eV。