

機器也能歸納語言嗎?
人類具有學習新概念的能力,並善於將其與現有概念系統地結合起來。例如,一旦小孩學會了如何「跳」,他們就能理解如何「向後跳」或「繞著某物跳兩圈」;再比如一個人如果能聽懂「貓追狗」,他也能不假思索地聽懂「狗追貓」。這種能力源自於人類的組合技能。
那麼,機器也能具有這種思維能力嗎?20世紀80年代末,哲學家和認知科學家Jerry Fnodor和Zenon Pylyshyn認為,人工神經網路缺乏這種系統性,無法建立這類「組合泛化」聯繫,因此不是真正可信的認知模型。這一論調引發了一場持續35年的激烈辯論。
神經網路是一種模擬人類認知的方法,在人工智慧(AI)研究領域一直占主導地位。幾十年來,科學家一直在研究如何將人類的組合技能,灌輸到神經網路和相關技術中,並取得了長足的進步。但在面對學習新的詞語時,神經網路仍然難以在對該詞進行多種語境訓練之前,去使用這個詞。
在一項新發表於《自然》雜誌的研究中,一個研究團隊開發出了一種名為組合元學習(MLC)的技術,可以提高ChatGPT等工具進行組合歸納的能力,讓機器與人的互動比現在最好的人工智慧系統更自然。
測試組合元學習技術
MLC的核心是訓練神經網路,能通過實踐來更好地進行組合泛化。當MLC接收到一個新詞時,它會被要求以組合的方式使用它。例如,當它接收到單詞「跳(jump)」,它需要創建新的片語,比如「跳兩次」或「繞右邊跳兩次」。這是一種新穎的學習過程,在這種過程中,神經網路可以從錯誤中學習,不斷更新並提高其技能。
為了測試MLC的有效性,研究人員進行了一系列實驗,讓人類與MLC執行相同的任務。
在實驗中,研究人員設計了一種由兩類無意義的單片語成的「偽語言」。他們用dax、wif、lug等「原語」代表「skip(蹦)」和「jump(跳)」等基本的具體動作;用blicket、kiki、fep等更抽象的「功能詞」和原語組合,來指定使用原語的規則,從而產生比如「跳轉三次」或「向後跳過」之類的組合。
研究人員先測試了25名人類參與者在不同情況下使用新學的單詞的能力。他們訓練參與者將每個原語與特定顏色的圓圈聯繫起來,例如dax是紅色圓圈,wig是綠色圓圈,lug是藍色圓圈。
然後,他們會向參與者展示原語和功能詞的組合,並同時向他們展示當功能詞應用於原語時所形成的圓圈圖案。例如,dax fep是三個紅色圓圈,lug fep是三個藍色圓圈,這表明fep表示是將一個原語重複三次的抽象規則。
最後,研究人員通過給參與者提供原語和功能詞的複雜組合來測試他們應用這些抽象規則的能力。參與者必須選擇正確的圓圈顏色和數量,並將它們按適當的順序排列。
具有人類的關鍵能力
在實驗中,人類在這項任務中的表現如預料般出色,平均正確率為80%。研究人員讓MLC完成了類似的任務,除了學習這些由研究人員定義的不存在的單詞的意思之外,MLC還學習了一些實際單詞的含義。結果表明,MLC的表現和人類參與者一樣好,在某些情況下,甚至超過了人類參與者的表現,意味著MLC具有類似人類的能力,可以對語言進行歸納。
另外,像ChatGPT這樣的大型語言模型仍然在努力實現組合泛化,儘管近年來它們已經有所改善,但在完成這類任務時,也顯得力不從心。相比之下,MLC和人類參與者的表現都要優於ChatGPT和GPT-4。研究人員認為,MLC可以進一步提高大型語言模型的組合技能,使神經網路成為更高效的學習者。
#創作團隊:
撰文:小雨
排版:雯雯
#參考來源:
https://www.nyu.edu/about/news-publications/news/2023/october/can-ai-grasp-related-concepts-after-learning-only-one-.html
https://www.nature.com/articles/d41586-023-03272-3
https://www.nature.com/articles/s41586-023-06668-3
#圖片來源:
封面圖&首圖:GrumpyBeere / Pixabay