32位能用什么剪輯軟件(適合32位系統(tǒng)的視頻剪輯軟件) 如何使用支付寶里有的功能去超市能讓你更省錢?(支付寶如何在超市使用) 如何使用淘寶點(diǎn)外賣服務(wù) (如何使用淘寶點(diǎn)外賣服務(wù)中心) 酚類化合物有哪些性質(zhì)(酚類化合物有哪些呀) 蘋果id充值怎么充(蘋果id充值不成功怎么辦) 淘寶怎么付錢(淘寶支付) 拋光磚和拋釉磚的區(qū)別哪個(gè)好(拋光磚和拋釉磚的優(yōu)缺點(diǎn)) 大理劍川沙溪旅游攻略(大理古城到劍川沙溪古鎮(zhèn)坐什么車) 古籍?dāng)?shù)字化步驟詳解(古籍?dāng)?shù)字化定義) 極地女神和女皇哪個(gè)好(極地女神) 淘寶代練店怎么開(kāi)(淘寶代練店怎么開(kāi)店) DNF(地下城與勇士) 真野豬 怎么打經(jīng)驗(yàn)分享(DNF真野豬怎么打) 網(wǎng)絡(luò)線上培訓(xùn)系統(tǒng)如何進(jìn)行課程管理?(網(wǎng)絡(luò)線上培訓(xùn)系統(tǒng)如何進(jìn)行課程管理教學(xué)) 用C語(yǔ)言編寫 打漁曬網(wǎng)問(wèn)題(用c語(yǔ)言編寫三天打魚,兩天曬網(wǎng)) 契丹人是中國(guó)人嗎(女真人是什么民族) DNF如何獲得無(wú)色小晶塊最合適(dnf無(wú)色大晶塊怎么得) 21部共和國(guó)名將電影(央視的共和國(guó)名將系列電影共有幾部) 怎么知道電腦安裝了監(jiān)視軟件(怎么知道電腦安裝了監(jiān)視軟件沒(méi)有) 遠(yuǎn)征ol完整客戶端下載(遠(yuǎn)征OL怎么獲得夜照玉獅子 寫明具體方法) 家庭怎樣防盜?(家庭如何防盜) 英語(yǔ)單詞apply用法 re瀏覽器官網(wǎng)(re瀏覽器) wps文字如何刪除頁(yè)眉橫線(wpsword怎么刪除頁(yè)眉橫線) 額濟(jì)納旗旅游住宿攻略(額濟(jì)納旗旅行攻略) 物候的意思解釋(物候的意思) 新手如何開(kāi)烘焙店?(新手如何開(kāi)烘焙店賺錢) 巧克力用英語(yǔ)怎么說(shuō)(巧克力用英語(yǔ)怎么說(shuō)讀音) 淘寶顏色分類怎么設(shè)置成圖片(淘寶顏色分類怎么設(shè)置) 找不到d3d8.dll d3d8thk.dll丟失 解決方案(d3dx9_27.dll丟失怎么辦) 過(guò)敏性鼻炎怎么治 過(guò)敏性鼻炎治療方法分享(你搜索一下過(guò)敏性鼻炎該怎么治療) bmi指數(shù)計(jì)算器(bmi指數(shù)) 9款圓臉女生適合的甜美長(zhǎng)卷發(fā)發(fā)型(9款圓臉女生適合的甜美長(zhǎng)卷發(fā)發(fā)型是什么) 測(cè)排卵期怎么測(cè)(測(cè)排卵期) 進(jìn)口奶粉哪個(gè)好 教你選購(gòu)進(jìn)口奶粉(進(jìn)口奶粉和進(jìn)口牛奶哪個(gè)好) 組織機(jī)構(gòu)怎么寫模板(組織機(jī)構(gòu)怎么寫) 怎么換微信主題皮膚(怎么換微信主題皮膚華為) 安裝GHOST系統(tǒng)后 IE主頁(yè)被鎖修改不了怎么辦 李瑞東太極十三樁(李瑞東) 花字拼音怎么拼寫(花字拼音怎么拼寫視頻) S8韓服高勝率虛空先知瑪爾扎哈上單符文天賦出裝(新版本瑪爾扎哈出裝) 后綴是什么意思中文(后綴是什么意思) 土豆怎么放才不發(fā)芽(土豆怎么放才不發(fā)芽不腐爛呢) 動(dòng)圈話筒和電容話筒的區(qū)別(動(dòng)圈話筒和電容話筒的區(qū)別在哪) 酒店前臺(tái)常用英語(yǔ)(酒店前臺(tái)英語(yǔ)常用語(yǔ)) dnf95深淵怎么刷(地下城95怎么刷深淵) 英雄聯(lián)盟諾提勒斯技能被動(dòng)介紹(諾提勒斯技能加點(diǎn)) 什么叫中性點(diǎn)接地系統(tǒng)(什么叫中性點(diǎn)) 蛙泳手腳配合慢鏡頭(蛙泳手腳配合慢動(dòng)作) 怎樣安裝電腦xp系統(tǒng)

新的人工智能將自然語(yǔ)言處理的力量帶到非洲語(yǔ)言中

導(dǎo)讀 研究人員開(kāi)發(fā)了一種人工智能模型,以幫助計(jì)算機(jī)更有效地使用更廣泛的語(yǔ)言。非洲語(yǔ)言很少受到計(jì)算機(jī)科學(xué)家的關(guān)注,因此非洲的大片地區(qū)幾乎沒(méi)

研究人員開(kāi)發(fā)了一種人工智能模型,以幫助計(jì)算機(jī)更有效地使用更廣泛的語(yǔ)言。

非洲語(yǔ)言很少受到計(jì)算機(jī)科學(xué)家的關(guān)注,因此非洲的大片地區(qū)幾乎沒(méi)有自然語(yǔ)言處理能力?;F盧大學(xué) David R. Cheriton 計(jì)算機(jī)科學(xué)學(xué)院的研究人員開(kāi)發(fā)的新語(yǔ)言模型開(kāi)始填補(bǔ)這一空白,使計(jì)算機(jī)能夠分析非洲語(yǔ)言文本以執(zhí)行許多有用的任務(wù)。

研究人員稱之為 AfriBERTa 的新神經(jīng)網(wǎng)絡(luò)模型使用深度學(xué)習(xí)技術(shù)為低資源語(yǔ)言實(shí)現(xiàn)了最先進(jìn)的結(jié)果。

該神經(jīng)語(yǔ)言模型專門用于 11 種非洲語(yǔ)言,例如阿姆哈拉語(yǔ)、豪薩語(yǔ)和斯瓦希里語(yǔ),這些語(yǔ)言的總?cè)藬?shù)超過(guò) 4 億。盡管僅從 1 GB 的文本中學(xué)習(xí),但它實(shí)現(xiàn)了與現(xiàn)有最??佳模型相媲美的輸出質(zhì)量,而其他模型需要數(shù)千倍的數(shù)據(jù)。

滑鐵盧大學(xué)計(jì)算機(jī)科學(xué)碩士生 Kelechi Ogueji 說(shuō):“預(yù)訓(xùn)練的語(yǔ)言模型已經(jīng)改變了計(jì)算機(jī)處理和分析從機(jī)器翻譯到問(wèn)答等任務(wù)的文本數(shù)據(jù)的方式。”“可悲的是,非洲語(yǔ)言幾乎沒(méi)有受到研究界的關(guān)注。”

“其中一個(gè)挑戰(zhàn)是神經(jīng)網(wǎng)絡(luò)的構(gòu)建需要大量的文本和計(jì)算機(jī)。與擁有大量可用文本的英語(yǔ)不同,全世界使用的大約 7,000 種語(yǔ)言中的大多數(shù)都可以歸為資源匱乏的特征,因?yàn)槿狈捎玫臄?shù)據(jù)來(lái)饋送數(shù)據(jù)饑渴的神經(jīng)網(wǎng)絡(luò)。”

大多數(shù)這些模型使用稱為預(yù)訓(xùn)練的技術(shù)工作。為了實(shí)現(xiàn)這一點(diǎn),研究人員向模型展示了一些文字被掩蓋或掩蓋的文本。然后模型必須猜測(cè)被屏蔽的詞。通過(guò)重復(fù)這個(gè)過(guò)程數(shù)十億次,該模型學(xué)習(xí)了單詞之間的統(tǒng)計(jì)關(guān)聯(lián),這模仿了人類的語(yǔ)言知識(shí)。

“能夠?qū)δ承┫掠稳蝿?wù)同樣準(zhǔn)確的模型進(jìn)行預(yù)訓(xùn)練,但使用極少的數(shù)據(jù)有很多優(yōu)勢(shì),”計(jì)算機(jī)科學(xué) Cheriton 主席兼 Ogueji 的顧問(wèn) Jimmy Lin 說(shuō)。“需要更少的數(shù)據(jù)來(lái)訓(xùn)練語(yǔ)言模型意味著需要更少的計(jì)算,從而降低與運(yùn)營(yíng)海量數(shù)據(jù)中心相關(guān)的碳排放。較小的數(shù)據(jù)集也使數(shù)據(jù)管理更實(shí)用,這是減少模型中存在的偏差的一種方法。”

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章