韋爾康奈爾醫(yī)學(xué)院和洛克菲勒大學(xué)研究人員的一項新研究發(fā)現(xiàn),強化學(xué)習(xí)是一種人工智能方法,有可能指導(dǎo)醫(yī)生設(shè)計順序治療策略,以獲得更好的患者治療效果,但在應(yīng)用于臨床之前需要進行重大改進。
強化學(xué)習(xí) (RL) 是一類能夠隨時間做出一系列決策的機器學(xué)習(xí)算法。RL 促成了近期人工智能的進步,包括國際象棋和圍棋的超人表現(xiàn),它可以利用不斷變化的患者狀況、測試結(jié)果和之前的治療反應(yīng)來建議個性化患者護理的下一步最佳措施。這種方法對于管理慢性病或精神疾病的決策尤其有前景。
該研究發(fā)表在《神經(jīng)信息處理系統(tǒng)會議論文集》(NeurIPS)上,并于 12 月 13 日發(fā)表,提出了“護理事件”(EpiCare),這是第一個醫(yī)療保健領(lǐng)域的 RL 基準(zhǔn)。
“基準(zhǔn)測試推動了機器學(xué)習(xí)應(yīng)用的改進,包括計算機視覺、自然語言處理、語音識別和自動駕駛汽車。我們希望它們現(xiàn)在能夠推動醫(yī)療保健領(lǐng)域的 RL 進步,”領(lǐng)導(dǎo)這項研究的精神病學(xué)神經(jīng)科學(xué)助理教授 Logan Grosenick 博士說。
RL 代理根據(jù)收到的反饋改進其行動,逐漸學(xué)習(xí)一種可增強其決策能力的策略。“然而,我們的研究結(jié)果表明,盡管目前的方法很有前景,但它們極其耗費數(shù)據(jù),”Grosenick 博士補充道。
標(biāo)簽:
免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。