根據(jù)語言提示生成人體動作的新框架 子宮內(nèi)的壓力可能會影響面部發(fā)育 量子計算推動模擬向前發(fā)展 超輻射原子可以突破時間測量精確度的界限 大爆炸的新模型表明可見的宇宙和不可見的暗物質(zhì)共同進化 研究團隊開發(fā)出改善超薄材料性能的新想法 小因素對基因組編輯產(chǎn)生大影響 研究表明超薄二維材料可以旋轉(zhuǎn)可見光的偏振 研究人員發(fā)現(xiàn)了一種在原子水平的極端溫度下不會破裂的古怪金屬合金 人工智能和物理學相結(jié)合揭示了黑洞周圍爆發(fā)的耀斑的 3D 結(jié)構(gòu) 揭示了南極洲西部冰架正在融化的反饋循環(huán) 新研究顯示人工智能天氣預報可以捕捉重大風暴的破壞路徑 新型 2D 材料以極高的精度和最小的損失操縱光 研究發(fā)現(xiàn)模擬微重力會影響睡眠和生理節(jié)律 天體物理學研究增進了對伽馬射線爆發(fā)如何產(chǎn)生光的理解 普通抗生素可能有助于對抗呼吸道病毒感染 在銀河系中心發(fā)現(xiàn)第一顆毫秒脈沖星 電子攝像捕捉蛋白質(zhì)和脂質(zhì)之間的移動舞蹈 阿司匹林如何幫助預防結(jié)直腸癌的發(fā)生和進展 研究發(fā)現(xiàn)人們認為老年開始得比以前晚 研究表明軸突中線粒體的消耗如何直接導致蛋白質(zhì)積累 科學家創(chuàng)建迄今為止最大 最詳細的鳥類家譜 創(chuàng)新癌癥治療:安全增強免疫細胞對抗腫瘤 研究人員稱山雀具有獨特的情景記憶神經(jīng)條形碼 新研究表明,齒鯨的回聲定位器官是由下頜肌肉進化而來 科學家將鳥類在睡眠期間的聲帶肌肉活動轉(zhuǎn)化為合成歌曲 研究表明緩步動物對電離輻射有異常反應(yīng) 解開飲酒的遺傳密碼 外星生命的顏色:紫色會成為新的綠色嗎 關(guān)鍵連接完成:為量子互聯(lián)網(wǎng)奠定基礎(chǔ) 新發(fā)現(xiàn)可能永遠改變空氣質(zhì)量 天津市食用益生菌重點實驗室揭牌儀式圓滿結(jié)束 新研究將日?;瘜W品與癌癥風險增加聯(lián)系起來 渦輪增壓斯格明子:加速邁向計算的未來 現(xiàn)在可以在弱光條件下進行精密光譜分析 科學變得簡單:鋰離子電池如何工作 革命性研究揭示了為什么我們的肌肉會隨著年齡的增長而減弱 60% 的材料遵循四法則但科學家們不知道為什么 麻省理工學院釋放二維磁鐵用于未來計算的力量 突破性研究將微小的腦泡與阿爾茨海默病的進展聯(lián)系起來 前所未有的光波:科學家推出突破性的光學量子探測 科學家發(fā)現(xiàn)脊髓驚人的記憶能力 登上Nature!壹加細胞治療集團PD1-T技術(shù)3期研究結(jié)果出爐,腫瘤療效確切! 關(guān)愛乳腺,科普起航 2024四川省第四屆乳腺健康科普大賽正式啟動 注意力缺陷多動障礙的高遺傳風險表明可能對健康造成影響 對抗致命神經(jīng)退行性疾病的斗爭在兩條戰(zhàn)線上取得進展 制鞋技術(shù)有助于降低糖尿病足潰瘍的風險 科學家發(fā)現(xiàn)小白鯊更喜歡靠近海岸 天平上的幽靈粒子研究提供了更精確的中微子質(zhì)量測定 綠色之謎鉛銅正長石揭示隱藏資源
您的位置:首頁 >醫(yī)學前沿 >

根據(jù)語言提示生成人體動作的新框架

導讀 在過去幾年中,可以自主生成各種類型內(nèi)容的基于機器學習的模型變得越來越先進。這些框架為制作和編譯數(shù)據(jù)集來訓練機器人算法開辟了新的可能...

在過去幾年中,可以自主生成各種類型內(nèi)容的基于機器學習的模型變得越來越先進。這些框架為制作和編譯數(shù)據(jù)集來訓練機器人算法開辟了新的可能性。

雖然一些現(xiàn)有模型可以根據(jù)文本描述生成逼真或藝術(shù)圖像,但迄今為止,開發(fā)能夠根據(jù)人類指令生成移動人物視頻的人工智能更具挑戰(zhàn)性。在預先發(fā)布在服務(wù)器arXiv上并在 IEEE/CVF 計算機視覺與模式識別會議 2024 上發(fā)表的論文中,北京理工大學、BIGAI 和北京大學的研究人員介紹了一種有前途的新框架,可以有效地解決這一任務(wù)。

“我們之前的工作《HUMANIZE》中的早期實驗表明,通過將任務(wù)分解為場景基礎(chǔ)和條件動作生成,兩階段框架可以增強 3D 場景中語言引導的人體動作生成,”該論文的合著者 Yixin Zhu 說。論文,告訴 Tech Xplore。

“機器人領(lǐng)域的一些工作也證明了可供性對模型泛化能力的積極影響,這激勵我們采用場景可供性作為這項復雜任務(wù)的中間表示。”

朱和他的同事推出的新框架建立在他們幾年前推出的生成模型之上,稱為 HUMANIZE。研究人員著手提高該模型泛化新問題的能力,例如在學習有效生成“躺在床上”動作后,創(chuàng)建逼真的動作來響應(yīng)“躺在地板上”的提示。

“我們的方法分兩個階段展開:用于功能可供性圖預測的功能可供性擴散模型 (ADM) 和用于根據(jù)描述和預生成的功能可供性生成人體運動的可供性到運動擴散模型 (AMDM),”Siyuan Huang 聯(lián)合研究人員說道。論文作者解釋說。

“通過利用從人體骨骼關(guān)節(jié)和場景表面之間的距離場導出的可供性圖,我們的模型有效地將 3D 場景基礎(chǔ)和該任務(wù)中固有的條件運動生成聯(lián)系起來。”

標簽:

免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章