:
內容一覽:氣味總是縈繞我們身邊。然而,我們卻很難對氣味準確描述。最近,Google Research 的子公司 Osom 基於圖神經網路,開發了氣味分析 AI。它可以根據化學分子的結構,對分子的氣味進行預測。基於這一 AI,研究人員繪製出了主氣味譜圖,建立了化學結構與氣味之間的對映,有望為感知覺研究提供新方法。
關鍵詞:氣味分析 GNN 氣味譜圖
作者 | 雪菜
編輯 | 三羊
神經科學研究的一項基本問題,是將外部刺激的物理特性對映到感知覺中。
視覺中,顏色是波長的對映。聽覺中,音調是頻率的對映。但在嗅覺中,氣味與物質之間的對映卻很難建立。
目前,我們只能提取出一些基本的氣味,繪製出氣味輪 (fragrance wheel),再用這些基本氣味組成更復雜的氣味。

圖 1:氣味輪示意圖
然而,這種粗略的分類很難用於科學研究。雖然已有氣味傳感器等技術用於氣味的監測,但這些傳感器仍只能識別特定氣味。現有的氣味鑑定很多時候仍需要氣味評價員的參與,這一過程耗時長,且可重複性差。
近期,Google Research 的分支 Osom 公司基於圖神經網路 (GNN) 開發了一種氣味分析 AI。它可以根據化學分子的結構,對該分子的氣味進行描述。這一模型在 53% 的化學分子、55% 的氣味描述詞判斷中優於人類。最終,研究人員利用這一模型繪製出了主氣味譜圖 POM (Principle Odor Map)。這一成果已發表於《Science》。

相關研究已發表於 《Science》
論文連結:
https://www.science.org/doi/full/10.1126/science.ade4401
實驗過程
GNN 模型在多個架構中表現穩定
氣味本質上是人們對於空氣中化學分子的感應。因此,化學分子的結構會對氣味產生影響。在 GNN 中,化學分子的結構被分析整合,形成了一張代表整個分子的圖表。
分子結構輸入到模型中後,GNN 會最佳化不同化學結構在特定氣味中的權重,最後通過預測層對分子的氣味進行判斷,輸出對應的氣味描述詞。

圖 2:GNN 模型示意圖
結合 Good Scents 和 Leffingwell & Associates 資料庫 (GS-LF 資料庫),研究人員挑選出了 5,000 種分子作為模型的資料庫。每種分子可以由多個氣味描述,如乳酪味、果香味等。

圖 3:GS-LF 資料庫中的部分分子
隨後,將 GS-LF 資料庫按照 8 : 2 的比例劃分為訓練集和測試集,訓練集被進一步劃分為五個交叉驗證的子集。
使用貝葉斯最佳化演算法對資料進行交叉驗證,並對 GNN 模型的超參數進行最佳化。最佳化完成後,GNN 模型在多個架構中表現穩定,交叉驗證集中 AUROC 最高為 0.89。
GNN 模型在氣味預測中優於人類
為驗證模型對其他分子的分辨能力,研究人員對 GNN 模型和人類組進行了氣味測試。

圖 4:不同模型對於 2,3-二氫苯並呋喃-5-甲醛氣味的判斷
A:GNN 模型;
B:RF 模型;
C:人類組;
D:不同評價員對 2,3-二氫苯並呋喃-5-甲醛氣味的評價。
對於 53% 的分子,GNN 模型的氣味預測結果優於人類組的中位數。而目前最先進的演算法,基於計數摩根指紋法 (cFP, count-based fingerprint) 的隨機森林模型 (RF),僅在 41% 的分子氣味預測中優於人類組。

圖 5:不同模型的預測結果與人類組平均值的相關性
隨後,研究人員將 GNN 模型的預測結果按氣味描述詞分類。除麝香外,GNN 模型對分子氣味的預測結果均在人類組的誤差分佈中,且在 30 個氣味描述詞的預測結果中優於人類組中位數。

圖 6:GNN 模型、RF 模型和人類組對不同分子的判斷結果
GNN 模型的預測結果會受到分子的結構影響,因此對於含硫基的大蒜味和含胺的魚腥味,GNN 模型有著較高的預測準確率。而麝香至少包含五種不同的結構,大環、多環、硝基、甾體和直鏈,因此 GNN 模型的預測結果最差。
而人類組的表現則會受到熟悉度的影響。他們對堅果、大蒜、乾酪等常規的食物香味判斷較為一致,而在麝香和乾草味上分歧較大。
同時,描述詞在訓練集中的數量也會影響 GNN 模型對某一氣味的預測。出現次數夠多時,GNN 模型可以對複雜的結構進行較準確的預測,如果香、花香和甜味。

圖 7:訓練資料對 GNN 模型預測結果與人類組平均值相關性的影響
然而,對於出現次數較少的味道,GNN 模型的正確率兩極分化。對於魚腥味、薄荷和樟腦的預測正確率較高,但對臭氧、醋酸味和發酵的味道判斷較差。
GNN 模型繪製主氣味譜圖
對 GNN 模型的性能進行驗證後,研究人員進一步將其用在了不同嗅覺任務中。
首先,他們測試了模型對結構相似的分子的判斷能力。模型已知一種分子的氣味後,需要對結構相似、氣味不同和結構不同、氣味相似分子的氣味進行判斷。對於這種反常的結構-氣味關係,GNN 模型有 50% 的判斷正確率,而 RF 模型僅有 19%。

圖 8:一組結構或氣味與已知分子接近的「三胞胎」
在獲得了穩定的結構-氣味關係之後,研究人員開始嘗試繪製大規模的氣味譜圖。他們完成了約 500,000 種分子的主氣味譜圖 (POM)。這些分子在科研領域尚不為人知,甚至絕大多數未被合成出來。
然而它們在譜圖中的位置可以直接被 GNN 模型計算出來,因此可以繪製出很大規模的氣味譜圖。如果讓一名訓練過的人類評價員對這些分子的氣味進行評估,大概需要連續工作 70 年。

圖 9:主氣味譜圖
圖中,每個分子氣味的座標由 GNN 模型確定,其顏色的 RGB 值對應其在預測氣味矩陣中前三個維度的座標。
普魯斯特效應:嗅覺與記憶的聯動
當我們聞到特定氣味時,就會想起曾經的記憶,氣味會使這一記憶更加形象、更富情感。作家馬塞爾·普魯斯特在《追憶似水年華》中提到,敘述者聞到浸在茶水中的瑪德萊娜蛋糕的味道時,「往事浮上心頭」。因此,這一現象也被稱為普魯斯特效應。
嗅覺與記憶在神經系統中的聯繫較其他感知覺更為密切。它是唯一一個直接與情感腦區、記憶腦區直接相連的感覺系統。嗅覺細胞被激活後,神經衝動會直接傳遞到梨狀皮層。這一腦區包括負責恐懼和其他情感的杏仁核和負責記憶的海馬旁回。

圖 10:嗅覺環路的組成
Primary olfactory cortex:初級嗅皮層;
Amygadala:杏仁核;
Hippocampus:海馬。
正是因為嗅覺與記憶、情感之間有著如此密切的聯繫,香水成了人們外出會面的必備品。也許對方再次見到你已經叫不出你的名字,但聞到這個味道,他一定會想起與你相見的那個情景。
藉助 AI,人們對於分子結構與氣味之間的聯繫有了更深入的了解。也許有一天,我們真的能調配出自己最熟悉的味道。打開瓶蓋,就能搭乘時光機器,讓記憶回到過去。
參考連結:
[1] https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/ [2] https://www.slideserve.com/cora-schroeder/functional-neuroanatomy