首頁 -> 港澳 ->社會

香港中大研新技術助機器人理解三維空間

分享到:
2026-04-30 19:21 | 稿件來源:香港中通社

【字號:

香港中通社4月30日電 香港中文大學30日公佈,該校工程學院團隊最近成功研發具空間智能的視覺語言大模型(VLM)技術,讓機器人能像人類一樣理解三維空間資訊,並具備可擴展的視觸融合能力,能自主完成涉及各類型物件的複雜長序列操作任務。

圖為香港中文大學。香港中文大學網站圖片

據介紹,現時的VLM雖然能讓機器人準確理解人類的語言指令,但它們對物體之間的三維空間關係缺乏深入認知,難以準確規劃長序列的操作任務。為增強VLM的空間理解能力,中大團隊提出名為“檢索增強操作”的新方法,使機器人在規劃操作任務過程中,能同時回答“每一步該做什麼”及“在三維空間中怎樣做才可行”兩個關鍵問題。

研究團隊介紹,團隊為機器人建構了一個結構化的三維物件知識庫,記錄日常生活常見物件的三維幾何形狀、擺放方式及可抓取部位;VLM在生成操作計劃時,可即時從知識庫檢索物體的幾何與操作紀錄,評估操作的可行性,以判斷實際可行的操作序列,並將抽象的指令轉化成準確的空間描述,從而賦予人工智能機器人執行複雜任務的能力。(完)

【編輯:馬華】

視頻

更 多
香港將推史上最嚴控煙新政 專家力挺:這是“嚴厲的愛”
開業以來首次實現“零貸款” 香港迪士尼一年能賺多少錢?
【通說環球】52個月打穿天山,中國基建的硬核與溫情
【你不知道的香港】香港竟也有張雪機車賣?香港代理:從月賣10輛到全球缺貨
AI演員會替代真人演員嗎?中國影視業人士這樣說
油價狂飆全球叫苦 香港能倖免嗎?
中國為何選拔外籍航天員進入空間站?