新華社北京12月13日電 新聞分析|“具身智能”如何加速人形機(jī)器人“進(jìn)化”
新華社記者彭茜 張漫子
繼大模型后,“具身智能”成為今年科技界的新熱點(diǎn),被認(rèn)為是新一波人工智能(AI)浪潮中的重點(diǎn)方向。眾多初創(chuàng)公司涌現(xiàn)、融資屢創(chuàng)新高、技術(shù)不斷突破……人形機(jī)器人作為該領(lǐng)域最具代表性的實(shí)體,正在大模型催化下加速產(chǎn)業(yè)化落地。
如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機(jī)器人則有了“好看的皮囊”,已在多個(gè)領(lǐng)域成為人類的有力助手。
圖為2024年9月20日,在2024世界制造業(yè)大會(huì)展館內(nèi),人形機(jī)器人“啟江二號(hào)”抓取橙子遞給參觀者。(新華社記者黃博涵攝)
重新定義機(jī)器人
作為連接虛擬空間和現(xiàn)實(shí)空間的橋梁,“具身智能”是指將AI融入機(jī)器人等物理實(shí)體,賦予它們像人一樣感知、學(xué)習(xí)和與環(huán)境動(dòng)態(tài)交互的能力。
“具身智能”一詞本身具有濃厚的技術(shù)哲學(xué)色彩。1945年,法國(guó)哲學(xué)家莫里斯·梅洛-蓬蒂提出“具身性”概念,認(rèn)為人類需通過(guò)身體與周圍環(huán)境進(jìn)行互動(dòng)和感知,進(jìn)而理解世界。1950年,被稱為“AI之父”的英國(guó)計(jì)算機(jī)科學(xué)家圖靈在論文《計(jì)算機(jī)器與智能》中首次提出“具身智能”這一概念。
事實(shí)上,智能化水平相對(duì)較低的工業(yè)機(jī)器人(機(jī)械臂)早已在制造業(yè)廣泛應(yīng)用,帶來(lái)質(zhì)效提升。但傳統(tǒng)工業(yè)機(jī)器人是“固定程序+機(jī)械臂”的組合,而“具身智能”賦能的機(jī)器人則是“多模態(tài)感知+大腦決策”的迭代。
清華大學(xué)交叉信息研究院助理教授許華哲認(rèn)為,未來(lái)機(jī)器人將呈現(xiàn)多姿多彩的形態(tài):雙足、四足、輪式,機(jī)械狗、智能無(wú)人機(jī)甚至機(jī)械小蜜蜂,但人形機(jī)器人對(duì)人類社會(huì)適配性最佳,將成為最能夠幫助人類的機(jī)器人。
人形機(jī)器人可解決生產(chǎn)線“最后一公里”的問(wèn)題。很多個(gè)性化、定制化的產(chǎn)品無(wú)法靠流水線統(tǒng)一組裝,這就需要具有泛化能力的人形機(jī)器人來(lái)“幫忙”,把批量生產(chǎn)的零部件按客戶的定制需求組裝成產(chǎn)品。在家庭服務(wù)、公共服務(wù)等更復(fù)雜多變的場(chǎng)景中,人形機(jī)器人也更具優(yōu)勢(shì),可適應(yīng)不同的環(huán)境和需求完成多種任務(wù)?!?/p>
三大難點(diǎn)待突破
人形機(jī)器人研發(fā)始于對(duì)人類的學(xué)習(xí)與模仿,其研發(fā)難點(diǎn)也可以比照人類的大腦、小腦和本體來(lái)理解。“大腦”主要是機(jī)器人負(fù)責(zé)自主學(xué)習(xí)、規(guī)劃和決策的中樞;“小腦”負(fù)責(zé)運(yùn)動(dòng)控制,包括從行走到跑跳,以及從簡(jiǎn)單抓取到復(fù)雜的手部動(dòng)作等;而“本體”部分則包括軀干四肢結(jié)構(gòu)和靈巧手設(shè)計(jì)。
優(yōu)必選科技副總裁、研究院院長(zhǎng)焦繼超告訴記者,目前這三大領(lǐng)域都有較多技術(shù)難點(diǎn)有待突破:“大腦”方面,云邊端一體計(jì)算架構(gòu)、多模態(tài)感知與環(huán)境建模等是近年技術(shù)焦點(diǎn),“仿人最大難點(diǎn)在于對(duì)人腦的模仿,現(xiàn)有科學(xué)理論對(duì)人腦的研究遠(yuǎn)遠(yuǎn)不足”;“小腦”方面,人機(jī)交互能力、復(fù)雜地形通過(guò)、全身協(xié)同精細(xì)作業(yè)等是重要方向;“本體”方面,剛?cè)狁詈戏律鷤鲃?dòng)機(jī)構(gòu)、高緊湊機(jī)器人四肢結(jié)構(gòu)與靈巧手設(shè)計(jì)等關(guān)鍵技術(shù),是人形機(jī)器人靈活運(yùn)動(dòng)所需的重要硬件基礎(chǔ)。
大模型的出現(xiàn)讓機(jī)器人“大腦”顯著“進(jìn)化”,大大提升了機(jī)器人的通用性和泛化性,有望降低人形機(jī)器人開(kāi)發(fā)成本,加速其走入千家萬(wàn)戶。
據(jù)優(yōu)理奇機(jī)器人科技公司創(chuàng)始人兼首席執(zhí)行官楊豐瑜介紹,現(xiàn)在業(yè)界主要使用預(yù)訓(xùn)練大模型對(duì)機(jī)器人進(jìn)行預(yù)訓(xùn)練,讓其具備更強(qiáng)學(xué)習(xí)能力;大模型可將特定任務(wù)的學(xué)習(xí)遷移到機(jī)器人任務(wù)上,提高其適應(yīng)能力;另外還可利用大模型的多模態(tài)處理能力,結(jié)合視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等各種輸入,提升機(jī)器人對(duì)復(fù)雜場(chǎng)景的理解。
圖為2024年8月21日在2024世界機(jī)器人大會(huì)現(xiàn)場(chǎng)拍攝的仿生人形機(jī)器人。(新華社記者任超攝)
中國(guó)起跑不落后
環(huán)顧全球,人形機(jī)器人已進(jìn)入產(chǎn)業(yè)化落地初期階段,在工業(yè)制造、商用服務(wù)和家庭陪伴領(lǐng)域開(kāi)始“試水”。無(wú)論是技術(shù)突破、落地進(jìn)展還是融資規(guī)模,人形機(jī)器人研發(fā)競(jìng)賽基本以中美為主導(dǎo)。
優(yōu)必選人形機(jī)器人Walker今年聚焦汽車、消費(fèi)電子等制造業(yè)重點(diǎn)領(lǐng)域,已進(jìn)入多家車廠實(shí)訓(xùn);宇樹(shù)科技的機(jī)器人實(shí)現(xiàn)了完全仿人的自然行走;優(yōu)理奇機(jī)器人正在醞釀“進(jìn)家”計(jì)劃;波士頓動(dòng)力的新版Atlas機(jī)器人實(shí)現(xiàn)了在工廠中不同儲(chǔ)物柜之間靈活搬動(dòng)零件;特斯拉人形機(jī)器人“擎天柱”計(jì)劃2025年開(kāi)始量產(chǎn)……
焦繼超說(shuō):“如果把人形機(jī)器人行業(yè)比喻成一場(chǎng)馬拉松,中國(guó)和歐美國(guó)家,目前幾乎都處在前面1000米的起跑階段?!?/p>
楊豐瑜持同樣觀點(diǎn),大模型研發(fā)能力、感知技術(shù)的領(lǐng)先使美國(guó)企業(yè)在機(jī)器人決策系統(tǒng)和復(fù)雜任務(wù)處理方面具有更強(qiáng)競(jìng)爭(zhēng)力。而中國(guó)的優(yōu)勢(shì)更多體現(xiàn)在工業(yè)機(jī)器人領(lǐng)域,特別是在制造業(yè)中的應(yīng)用較為成熟。在人形機(jī)器人技術(shù)專利方面,中國(guó)也已走在前列。
雖然機(jī)器人“大腦”的核心算法和高端芯片仍存在挑戰(zhàn),但中國(guó)機(jī)器人行業(yè)擁有豐富的應(yīng)用場(chǎng)景和龐大的潛在用戶人口,數(shù)據(jù)是最大競(jìng)爭(zhēng)優(yōu)勢(shì)之一。
如何在真實(shí)世界場(chǎng)景中采集大量數(shù)據(jù),并將數(shù)據(jù)統(tǒng)籌流通和供給人形機(jī)器人行業(yè)是關(guān)鍵。許華哲介紹說(shuō),真實(shí)世界的數(shù)據(jù)一般都靠各家機(jī)器人公司自己采集。北京人形機(jī)器人創(chuàng)新中心有限公司正計(jì)劃打造一個(gè)開(kāi)源數(shù)據(jù)集供學(xué)界和業(yè)界使用。未來(lái),高質(zhì)量的共享數(shù)據(jù)集將大大助力行業(yè)發(fā)展。