CAMBRIDGE, MA 在過去的幾年里,語言的人工智能模型已經(jīng)變得非常擅長某些任務。最值得注意的是,它們擅長預測文本字符串中的下一個單詞;這項技術可幫助搜索引擎和短信應用程序預測您要輸入的下一個單詞。
最新一代的預測語言模型似乎也了解了語言的潛在含義。這些模型不僅可以預測接下來出現(xiàn)的單詞,還可以執(zhí)行似乎需要一定程度真正理解的任務,例如問答、文檔摘要和故事完成。
此類模型旨在優(yōu)化預測文本的特定功能的性能,而不會試圖模仿人類大腦如何執(zhí)行此任務或理解語言的任何內(nèi)容。但麻省理工學院神經(jīng)科學家的一項新研究表明,這些模型的潛在功能類似于人腦中語言處理中心的功能。
在其他類型的語言任務上表現(xiàn)良好的計算機模型并沒有表現(xiàn)出與人腦的這種相似性,這提供了人腦可能使用下一個詞預測來驅動語言處理的證據(jù)。
“模型在預測下一個單詞方面做得越好,它就越接近人類大腦,”麻省理工學院麥戈文大腦研究所和大腦中心成員、認知神經(jīng)科學沃爾特 A.羅森布利斯教授 Nancy Kanwisher 說, Minds, and Machines (CBMM),以及這項新研究的作者。“令人驚訝的是,這些模型的擬合如此之好,它非常間接地表明,人類語言系統(tǒng)正在做的事情可能正在預測接下來會發(fā)生什么。”
Joshua Tenenbaum,麻省理工學院計算認知科學教授,CBMM 和麻省理工學院人工智能實驗室(CSAIL)成員;和 Evelina Fedorenko,神經(jīng)科學領域的 Frederick A. 和 Carole J. Middleton 職業(yè)發(fā)展副教授以及麥戈文研究所的成員,是該研究的資深作者,該研究本周發(fā)表在美國國家科學院院刊上。在 CBMM 工作的麻省理工學院研究生 Martin Schrimpf 是該論文的第一作者。
做出預測
新的、高性能的下一個詞預測模型屬于一類稱為深度神經(jīng)網(wǎng)絡的模型。這些網(wǎng)絡包含形成不同強度連接的計算“節(jié)點”,以及以規(guī)定方式在彼此之間傳遞信息的層。
在過去的十年里,科學家們使用深度神經(jīng)網(wǎng)絡來創(chuàng)建視覺模型,可以像靈長類動物的大腦一樣識別物體。麻省理工學院的研究還表明,視覺對象識別模型的潛在功能與靈長類動物視覺皮層的組織相匹配,即使這些計算機模型并不是專門為模仿大腦而設計的。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!