當(dāng)前位置：人工智能實(shí)驗(yàn)室> 量子技術(shù) > DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-09-05 09:06:24 瀏覽：3490次

導(dǎo)讀：新智元報(bào)道編輯：?jiǎn)虠?【新智元導(dǎo)讀】 DeepMind聯(lián)合帝國(guó)理工學(xué)院的學(xué)者，專注于用神經(jīng)網(wǎng)絡(luò)方法對(duì)量子力學(xué)中經(jīng)典的薛定諤方程進(jìn)行近似求解。繼2020年提出FermiNet后，團(tuán)隊(duì)的最新成果求解量子激發(fā)態(tài)，登上Science。繼AlphaFold 3掀起生物學(xué)革命后，DeepMind...

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

新智元報(bào)道

編輯：?jiǎn)虠?strong style="box-sizing: border-box !important; margin: 0px; max-width: 100%; outline: 0px; overflow-wrap: break-word !important; padding: 0px; visibility: visible">【新智元導(dǎo)讀】DeepMind聯(lián)合帝國(guó)理工學(xué)院的學(xué)者，專注于用神經(jīng)網(wǎng)絡(luò)方法對(duì)量子力學(xué)中經(jīng)典的薛定諤方程進(jìn)行近似求解。繼2020年提出FermiNet后，團(tuán)隊(duì)的最新成果求解量子激發(fā)態(tài)，登上Science。繼AlphaFold 3掀起生物學(xué)革命后，DeepMind又要開(kāi)始發(fā)力量子力學(xué)了。

8月22日，他們最新的研究成果FermiNet登上了Science，使用神經(jīng)網(wǎng)絡(luò)對(duì)量子激發(fā)態(tài)進(jìn)行準(zhǔn)確計(jì)算。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

而是將問(wèn)題轉(zhuǎn)化為尋找擴(kuò)展系統(tǒng)的基態(tài)問(wèn)題。論文介紹了一種通過(guò)變分蒙特卡羅（variational Monte Carlo）估計(jì)量子系統(tǒng)激發(fā)態(tài)的算法，而是將問(wèn)題轉(zhuǎn)化為尋找擴(kuò)展系統(tǒng)基態(tài)的問(wèn)題，因此非常適用于神經(jīng)網(wǎng)絡(luò)分析。

通過(guò)在兩種不同的神經(jīng)網(wǎng)絡(luò)：FermiNet和Psiformer上運(yùn)行，作者驗(yàn)證了這種方法的準(zhǔn)確性。

其中FerminNet同樣由DeepMind和帝國(guó)理工學(xué)院于2020年聯(lián)名提出，論文發(fā)表在期刊《Physical Review Research》上。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

這篇論文展示了深度學(xué)習(xí)如何幫助求解量子力學(xué)基本方程，提出的創(chuàng)新網(wǎng)絡(luò)架構(gòu)FermiNet非常適合對(duì)大量電子集合（即化學(xué)鍵的基本構(gòu)建塊）的量子態(tài)進(jìn)行建模。

更重要的是，F(xiàn)ermiNet首次展示了，如何用深度學(xué)習(xí)方法、根據(jù)第一性原理計(jì)算原子和分子的能量，其準(zhǔn)確度足以發(fā)揮實(shí)際作用。

這不僅是一個(gè)重要的基礎(chǔ)科學(xué)問(wèn)題，而且還可能在未來(lái)產(chǎn)生實(shí)際用途，比如在制造新材料和化學(xué)合成物之前，使用計(jì)算機(jī)進(jìn)行模擬或原型制作。

此外，F(xiàn)ermiNet在蛋白質(zhì)折疊、玻璃動(dòng)力學(xué)、晶格量子色動(dòng)力學(xué)等領(lǐng)域都可能有廣泛的用途。

FeimiNet相關(guān)代碼已經(jīng)公布在GitHub上，方便計(jì)算物理和計(jì)算化學(xué)領(lǐng)域相關(guān)研究的參考。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

除了FermiNet，DeepMind在2022年發(fā)布的基于自注意力的架構(gòu)Psiformer仍然是迄今為止用于求解量子力學(xué)方程的最準(zhǔn)確的AI方法。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

量子力學(xué)簡(jiǎn)史

沒(méi)有什么比「量子力學(xué)」這四個(gè)字更能讓人困惑的了，畢竟這是讓普朗克都為之頭禿的領(lǐng)域。

比如薛定諤思維實(shí)驗(yàn)里那只又死又活的貓，還有經(jīng)典物理完全無(wú)法描述的粒子和波的性質(zhì)同時(shí)存在。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

在經(jīng)典模型中，原子核位于中間，固定數(shù)量的電子繞著固定的軌道運(yùn)行，如同太陽(yáng)系一般嚴(yán)謹(jǐn)有序。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

但在量子系統(tǒng)中，電子等粒子完全沒(méi)有這種精確的軌道，它們的位置是由「概率云」描述的。

「概率云」是什么意思？

這個(gè)模型告訴我們，原子中的電子沒(méi)有固定的運(yùn)動(dòng)軌跡，也沒(méi)有確切的位置，只能用「電子概率密度」描述它們?cè)谀硞€(gè)區(qū)域出現(xiàn)的概率。

然而，概率云模型給我們的僅僅是「概率」而已，無(wú)法真正判斷電子在任何特定時(shí)刻是否位于某個(gè)區(qū)域。

這種情況已經(jīng)超出了一般人類能理解的范疇，因此著名物理學(xué)家Richard Feynman才會(huì)宣稱：「如果你認(rèn)為自己理解量子力學(xué)，那你就根本不理解量子力學(xué)�！�

雖然直覺(jué)無(wú)法理解，語(yǔ)言解釋起來(lái)也很困難，但是理論的核心內(nèi)容可以用非常簡(jiǎn)潔的數(shù)學(xué)語(yǔ)言描述。

所以計(jì)算機(jī)科學(xué)領(lǐng)域常聽(tīng)到的「Talk is cheap, show me your code」，在理論物理也有類似的一句話「Shut up and calculate」。

在核心的幾個(gè)方程中，最著名的是薛定諤方程，足以描述所有熟悉物質(zhì)在原子和原子核水平上的行為。

化學(xué)中的共價(jià)鍵，或者超導(dǎo)體、超流體、激光和半導(dǎo)體的各種反直覺(jué)性質(zhì)，都是電子間量子相互作用的結(jié)果，也都可以用薛定諤方程來(lái)描述。

上世紀(jì)20年代，量子力學(xué)的相關(guān)規(guī)則出現(xiàn)后，科學(xué)家們第一次可以用詳細(xì)理論描述化學(xué)反應(yīng)的最底層原理。

比如，對(duì)不同分子建立相應(yīng)方程，求解系統(tǒng)的能量，就可以找出哪些分子處于穩(wěn)定態(tài)，哪些分子間會(huì)自發(fā)地發(fā)生反應(yīng)。

然而，理想很美好，現(xiàn)實(shí)很骨感。

當(dāng)科學(xué)家們實(shí)際開(kāi)始計(jì)算時(shí)，他們發(fā)現(xiàn)，只有氫原子的方程可以求解其他的都太復(fù)雜了，算不出來(lái)。

因此，量子力學(xué)奠基人之一、物理學(xué)家Paul Dirac在1929年說(shuō)了這樣一句話，到今天依舊適用

「要描述大部分物理學(xué)和整個(gè)化學(xué)的數(shù)學(xué)理論，所必需的基本物理定律是完全已知的。困難只在于，要精確應(yīng)用這些定律的話，會(huì)導(dǎo)致方程過(guò)于復(fù)雜而無(wú)法求解。」

「所以，我們需要開(kāi)發(fā)能應(yīng)用量子力學(xué)的近似方法�！�

Dirac之后，物理學(xué)家使用了一種近似方法，將電子分配到一個(gè)特定的軌道，每個(gè)軌道的形狀由所有其他軌道平均得到。

這種「平均徹方法只給每個(gè)電子分配一個(gè)軌道，因此對(duì)電子實(shí)際行為的描述非常不完整，但依然是一個(gè)可行的方法，對(duì)分子總能量的估算誤差在0.5%左右

原子軌道示意圖，藍(lán)色或紫色區(qū)域的表面表示最有可能找到電子的區(qū)域；藍(lán)色區(qū)域波函數(shù)為正，紫色區(qū)域波函數(shù)為負(fù)然而，誤差為0.5%的方法依舊不夠。

要知道，分子鍵能量?jī)H僅占系統(tǒng)總能量中的微小部分，想正確預(yù)測(cè)分子是否處于穩(wěn)定態(tài)，要依靠占比0.001%的能量差值來(lái)判斷，或剩余相關(guān)能量中的0.02%。

相比電子平均場(chǎng)，近幾十年開(kāi)發(fā)的多種計(jì)算方法都取得了進(jìn)步，但總是不能在同時(shí)達(dá)到令人滿意的準(zhǔn)確率和計(jì)算效率。

為費(fèi)米子量身定做神經(jīng)網(wǎng)絡(luò)

表示量子系統(tǒng)的挑戰(zhàn)之處在于，必需為每種可能的電子位置分配相應(yīng)概率，這就構(gòu)成了一個(gè)極其龐大的構(gòu)型空間。

比如，單單是硅原子，其可能的電子構(gòu)型數(shù)量就會(huì)比宇宙中所有原子的數(shù)量加起來(lái)還要多。而這正是深度神經(jīng)網(wǎng)絡(luò)的用武之地。

過(guò)去幾年中，神經(jīng)網(wǎng)絡(luò)在表示復(fù)雜的高維概率分布方面取得了巨大的進(jìn)步，而且能以有效、可擴(kuò)展的方式進(jìn)行訓(xùn)練。它們?cè)贏I領(lǐng)域中擬合高維函數(shù)的能力，或許也能用于表示量子的波函數(shù)。

泡利不相容原理處理電子時(shí)，還需要考慮一個(gè)問(wèn)題電子必須遵守泡利不相容原理（Pauli exclusion principle），這意味著它們不能同時(shí)處于同一空間。

因?yàn)殡娮訉儆凇纲M(fèi)米子」，其波函數(shù)必須是反對(duì)稱（antisymmetric）的。如果交換兩個(gè)電子的位置，波函數(shù)就會(huì)乘以-1。這意味著如果兩個(gè)電子彼此重疊，則波函數(shù)（以及該構(gòu)型的概率）將為零。

這意味著我們需要開(kāi)發(fā)一種新的神經(jīng)網(wǎng)絡(luò)，接受反對(duì)稱結(jié)構(gòu)的輸入這就是FermiNet。

矩陣的行列式恰好具有這種「反對(duì)稱」屬性：如果交換兩行，輸出就會(huì)乘以-1，就像費(fèi)米子的波函數(shù)一樣。因此在大多數(shù)量子化學(xué)方法中，「反對(duì)稱性」是通過(guò)行列式引入的。

Slater行列式就采用了這種思路：使用單電子函數(shù)對(duì)系統(tǒng)中的每個(gè)電子進(jìn)行評(píng)估，并將所有結(jié)果打包到一個(gè)矩陣中，該矩陣的行列式就是反對(duì)稱波函數(shù)。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

Slater行列式的動(dòng)畫(huà)演示：每條曲線都是上面所示軌道之一的切片當(dāng)，電子1和2交換位置時(shí)，對(duì)應(yīng)于Slater行列式發(fā)生行交換，波函數(shù)乘以-1，保證遵循泡利不相容原理在表示復(fù)雜函數(shù)方面，深度神經(jīng)網(wǎng)絡(luò)通常比基函數(shù)的線性組合更有效。

在FermiNet中，進(jìn)入行列式的每個(gè)函數(shù)都是所有電子的函數(shù)，這遠(yuǎn)遠(yuǎn)超出了僅使用單個(gè)電子或兩個(gè)電子構(gòu)建函數(shù)的方法（如Slater行列式）。

此外，F(xiàn)ermiNet中每個(gè)電子都對(duì)應(yīng)單獨(dú)的信息流。但如果這些流之間沒(méi)有任何交互，F(xiàn)ermiNet的表達(dá)能力也不會(huì)比Slater行列式有所提升。

因此，網(wǎng)絡(luò)中每一層所有流的信息都被平均后，才會(huì)傳遞到下一層的信息流中，這類似于圖神經(jīng)網(wǎng)絡(luò)在每一層聚合信息的方式。

因此，與Slater行列式不同，如果神經(jīng)網(wǎng)絡(luò)層變得足夠?qū)�，F(xiàn)ermiNet就可以作為通用函數(shù)逼近器。這意味著，如果得到正確訓(xùn)練，F(xiàn)ermiNet就能夠擬合薛定諤方程的近似精確解。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

FermiNet的動(dòng)畫(huà)演示：網(wǎng)絡(luò)的單個(gè)流（藍(lán)色、紫色或粉色）的功能與傳統(tǒng)軌道非常相似。FermiNet引入了流之間的對(duì)稱交互，使波函數(shù)更加通用、表達(dá)能力更強(qiáng)，且保留了Slater行列式的反對(duì)稱特性

變分量子蒙特卡羅如果要準(zhǔn)確地通過(guò)最小化系統(tǒng)能量來(lái)擬合FermiNet，就需要評(píng)估所有可能出現(xiàn)的電子構(gòu)型的波函數(shù)。顯然，我們不能直接計(jì)算其精確值，只能估算其近似值。

我們隨機(jī)選擇電子配置，評(píng)估每種電子排布的局部能量，將其相加后進(jìn)行最小化。

與直接計(jì)算真實(shí)的能量最小值不同，這種估算方法被稱為蒙特卡羅方法（Monte Carlo method），有點(diǎn)像賭徒一遍又一遍地?cái)S骰子。雖然得到的只是近似值，但如果需要使其更精確，我們隨時(shí)可以再次擲骰子。

這些電子排布的樣本從何而來(lái)呢？

由于波函數(shù)的平方給出了在任何位置觀察到某種特定粒子排布的概率，因此從波函數(shù)本身生成樣本是最方便的本質(zhì)上是模擬觀察粒子的行為。

雖然大多數(shù)神經(jīng)網(wǎng)絡(luò)根據(jù)外部數(shù)據(jù)進(jìn)行訓(xùn)練，但在FermiNet中，用于訓(xùn)練的輸入數(shù)據(jù)由神經(jīng)網(wǎng)絡(luò)本身生成的。這意味著，除了指定原子核的結(jié)構(gòu)和位置，我們不需要任何額外的訓(xùn)練數(shù)據(jù)。

這種思想被稱為「變分量子蒙特卡羅」（variational quantum Monte Carlo, VMC）。雖然60年代就被提出，但通常被認(rèn)為是一種低成本且不精確的計(jì)算方法。

通過(guò)用FermiNet替換Slater行列式，VMC成功「改頭換面」，準(zhǔn)確率得到了極大的提升。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

從FermiNet采樣：模擬電子圍繞雙環(huán)丁烷分子移動(dòng)

實(shí)驗(yàn)結(jié)果

我們首先從簡(jiǎn)單的、經(jīng)過(guò)充分研究的系統(tǒng)開(kāi)始：元素周期表第一行中的原子（氫到氖）。

這些都是小型系統(tǒng)，電子數(shù)≤10個(gè)，而且足夠簡(jiǎn)單甚至簡(jiǎn)單到可以用最準(zhǔn)確且最昂貴（指數(shù)擴(kuò)展）的方法來(lái)處理它們。

結(jié)果發(fā)現(xiàn)，F(xiàn)ermiNet的性能遠(yuǎn)遠(yuǎn)優(yōu)于類似的VMC方法相對(duì)于計(jì)算量以指數(shù)級(jí)別增長(zhǎng)的方法，誤差通常能降低一半或更多。

在較大的系統(tǒng)上，指數(shù)擴(kuò)展的方法過(guò)于復(fù)雜，因此使用耦合聚類方法（coupled cluster method）作為基線。

耦合聚類方法對(duì)于穩(wěn)定構(gòu)型的分子效果很好，但很難應(yīng)對(duì)化學(xué)鍵拉伸或斷裂時(shí)的情況，而后者對(duì)于理解化學(xué)反應(yīng)恰恰至關(guān)重要。

另外，雖然這種方法的計(jì)算效率比指數(shù)擴(kuò)展的方法要好得多，但實(shí)驗(yàn)所用方法的計(jì)算量仍以電子數(shù)量的七次方的速度增加，因此也只能用于中等大小的分子。

下一階段，將FermiNet應(yīng)用于逐漸變大的分子，從氫化鋰到雙環(huán)丁烷。

對(duì)于最小的分子，F(xiàn)ermiNet捕獲了耦合簇能量和單個(gè)Slater行列式獲得的能量之間的99.8%的差異。

雙環(huán)丁烷是我們研究過(guò)的最大的系統(tǒng)，有 30 個(gè)電子，F(xiàn)ermiNet仍然捕獲了97%或更多的相關(guān)能量（correlation energy），考慮到我們應(yīng)用的方法非常簡(jiǎn)單，這是一個(gè)巨大的成就。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

FermiNet在分子上捕獲的相關(guān)能量比例：紫色表示99%的相關(guān)能量，從左到右：氫化鋰、氮?dú)狻⒁蚁�、臭氧、乙醇和雙環(huán)丁烷。計(jì)算激發(fā)態(tài)的新方法

除了2020年提出的FermiNet，在Science上最新發(fā)表的成果中，DeepMind為計(jì)算量子化學(xué)領(lǐng)域中最困難挑戰(zhàn)之一提出了解決方案了解分子如何在激發(fā)態(tài)之間轉(zhuǎn)變。

FermiNet最初專注于分子的基態(tài)，即給定一組原子核，找到其周圍電子的最低能量排布。

但是，當(dāng)分子和材料受到大量能量的激發(fā)時(shí)，例如光照或高溫，電子可能會(huì)進(jìn)入更高的能量狀態(tài)激發(fā)態(tài)。

激發(fā)態(tài)是理解物質(zhì)與光相互作用的基礎(chǔ)，不同的分子和材料會(huì)吸收/釋放確切數(shù)量的能量，這相當(dāng)于它們獨(dú)特的指紋。

對(duì)這方面原理的理解影響著太陽(yáng)能電池板、LED、半導(dǎo)體、光催化劑等技術(shù)的性能，也在涉及光的生物過(guò)程中發(fā)揮著關(guān)鍵作用，例如光合作用和視覺(jué)。

準(zhǔn)確計(jì)算激發(fā)態(tài)能量比計(jì)算基態(tài)能量更具挑戰(zhàn)性。即使是基態(tài)化學(xué)的黃金基準(zhǔn)方法，如上面提到的耦合簇，在計(jì)算激發(fā)態(tài)能量時(shí)也會(huì)有大數(shù)十倍的誤差。

雖然我們希望將FermiNet的工作擴(kuò)展到激發(fā)態(tài)，但目前來(lái)看，神經(jīng)網(wǎng)絡(luò)還不能與與最先進(jìn)的方法競(jìng)爭(zhēng)。

因此，這篇論文提出了一種計(jì)算激發(fā)態(tài)的新方法，比以前的方法更強(qiáng)大、更通用，可以應(yīng)用于任何類型的數(shù)學(xué)模型，包括FermiNet和其他神經(jīng)網(wǎng)絡(luò)。

其工作原理是找到具有額外粒子的擴(kuò)展系統(tǒng)的基態(tài)，因此對(duì)現(xiàn)有的優(yōu)化算法進(jìn)行少量修改即可使用。

論文在廣泛的基準(zhǔn)上進(jìn)行了驗(yàn)證，并取得了非常理想的實(shí)驗(yàn)結(jié)果。carbon dimer

在雙原子碳（carbon dimer）這種小而復(fù)雜的分子上，該方法實(shí)現(xiàn)了4meV的平均絕對(duì)誤差 (MAE)，而之前的gold standard方法，誤差為20meV，相當(dāng)于五倍更接近實(shí)驗(yàn)結(jié)果。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題

雙原子碳示意圖此外，作者還在計(jì)算化學(xué)中一些最具挑戰(zhàn)性的系統(tǒng)上進(jìn)行了測(cè)試，比如兩個(gè)電子同時(shí)被激發(fā)。結(jié)果發(fā)現(xiàn)。與迄今為止完成的最苛刻、最復(fù)雜的計(jì)算相比，誤差僅在0.1 eV。

DeepMind最新成果劍指量子力學(xué)，F(xiàn)ermiNet或?qū)⑵平饨倌暧?jì)算難題