中新網北京11月29日電 (記者 孫自法)備受矚目的人工智能研究應用,又迎來一項新突破。施普林格·自然旗下學術期刊《自然-通訊》最新發(fā)表一篇論文稱,研究人員研發(fā)出一個人工智能(AI)體(智能體),在3D模擬中,該智能體能在第一次見到的任務中實時模仿專家。
論文作者指出,該智能體能從第三人稱視角實時可靠地獲取來自人類搭檔的知識,這項研究結果是對具身AI實現(xiàn)快速知識傳播的一次概念驗證,也是朝著人類-AI互動的開放式文化演變邁出的第一步。
該論文介紹,之前在物理模擬和現(xiàn)實世界機器人中已經證明了用人類數(shù)據讓具身AI智能體學習新技能的效果。過去的智能體通常需要在監(jiān)督下從大量第一人稱的人類演示中學習,這類演示的獲取既昂貴又費時。相比之下,人類本身可以通過模仿示范者,在幾秒內以互動方式學會新技能,即使嬰兒也有這種能力。因此,研究人員一直在尋求一種AI智能體,能從效率和隱私與人類相仿的其他個體那里進行社會化學習。
論文通訊作者、位于英國倫敦的谷歌DeepMind的Edward Hughes和同事一起,利用深度強化學習訓練了一個智能體,這個智能體能在名為GoalCycle3D的物理模擬任務空間里,幾分鐘內發(fā)現(xiàn)和模仿新專家的行為,并記住所學知識。訓練后,他們發(fā)現(xiàn)這個智能體可以在各種有挑戰(zhàn)性的導航問題中從人類和AI專家這里快速學習,雖然它們以前從來沒見過人類。
比如,這個智能體可以在包含大量障礙的復雜地形中穿梭。該方法的一個關鍵是一種新形式的自動化課程,該課程結合了示范者的階段性遮蔽以及任務難度的逐步升級。研究人員發(fā)現(xiàn),這個智能體的個體神經元是可解釋的,而且能同時編碼物理信息和社會信息。
論文作者總結表示,這項研究結果為 AI領域和文化演化心理學之間的密切互動奠定了基礎。他們認為,AI從業(yè)者可從人類社會學習中汲取靈感,構建出適應當下人類伙伴的具身智能體,并保護好隱私。此外,能社會學習的AI智能體或為研究人類文化能力發(fā)展提供新的建模工具。(完)
責任編輯:王雨蜻