具身智能“進(jìn)化”加速
2024-12-20 17:29:43 作者 : 彭茜、樂艷娜 來源 : 《環(huán)球》雜志????????警用裝備網(wǎng)訊:?作為連接虛擬空間和現(xiàn)實(shí)空間的橋梁,“具身智能”被認(rèn)為是新一波AI浪潮的核心方向,在這一領(lǐng)域,眾多初創(chuàng)公司涌現(xiàn)、融資屢創(chuàng)新高、技術(shù)不斷取得突破。
在大模型催化下,作為具身智能領(lǐng)域最具代表性實(shí)體的人形機(jī)器人,2024年加速產(chǎn)業(yè)化落地。如果我們將大模型視為“有趣的靈魂”,具身智能賦能的人形機(jī)器人就可看作是“好看的皮囊+有趣的靈魂”。

8月21日在世界機(jī)器人大會(huì)上拍攝的人形機(jī)器人
重新定義機(jī)器人
“具身智能”一詞具有極濃厚的技術(shù)哲學(xué)色彩。1945年,法國哲學(xué)家梅洛·龐蒂提出“具身性”概念,認(rèn)為身體是我們在世界上存在的媒介物,人類通過身體與周圍的環(huán)境進(jìn)行互動(dòng)和感知,進(jìn)而理解世界。
1950年,被稱為“人工智能之父”的英國計(jì)算機(jī)科學(xué)家圖靈在論文《計(jì)算機(jī)器與智能》中首次提出“具身智能”這一概念。
顧名思義,具身智能是指將人工智能(AI)融入機(jī)器人等物理實(shí)體,賦予它們具有像人類一樣的感知、學(xué)習(xí)和與環(huán)境動(dòng)態(tài)交互的能力。在生活中,可感知周邊環(huán)境的智能掃地機(jī)器人、已進(jìn)入路測的自動(dòng)駕駛汽車,都可被視為具身智能的雛形,而人形機(jī)器人則是具身智能最理想的載體。
被提出后經(jīng)過了半個(gè)多世紀(jì),具身智能這一經(jīng)典概念為何重新煥發(fā)生命力?優(yōu)必選科技副總裁、研究院院長焦繼超接受《環(huán)球》雜志記者專訪時(shí)說,過往因?yàn)锳I相關(guān)技術(shù)、軟硬件及算力等因素還未發(fā)展成熟,具身智能領(lǐng)域進(jìn)展緩慢。近幾年,機(jī)器人運(yùn)動(dòng)控制系統(tǒng)和機(jī)電系統(tǒng)設(shè)計(jì)等硬件取得顯著進(jìn)步,使得機(jī)器人能在更復(fù)雜環(huán)境中執(zhí)行任務(wù)。軟件方面,強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)等算法的應(yīng)用,提升了機(jī)器人在未知環(huán)境中的學(xué)習(xí)和適應(yīng)能力。算力、傳感器等技術(shù)也日趨成熟,使整個(gè)具身智能底層系統(tǒng)得到完善,加速落地。
事實(shí)上,最近十年,智能化水平相對較低的工業(yè)機(jī)器人/機(jī)械臂早已大量進(jìn)入制造業(yè)工廠,帶來質(zhì)效提升。專用工業(yè)機(jī)器人是“固定程序+機(jī)械臂”的組合,具身智能賦能的通用機(jī)器人則是“多模態(tài)感知+大腦決策”的迭代。
清華大學(xué)交叉信息研究院助理教授許華哲展望,未來機(jī)器人將呈現(xiàn)多姿多彩的形態(tài):雙足、四足、輪式,正如自然界的物種多樣性一樣。比如可以載重爬山的機(jī)械狗、智能無人機(jī)甚至機(jī)器小蜜蜂。由于這個(gè)世界是為人打造的,大至建筑小至家具的高矮都是為了適配人,人形機(jī)器人將成為最能夠幫助人的機(jī)器人形態(tài)。
作為通用機(jī)器人代表的人形機(jī)器人,被稱為機(jī)器人皇冠上“最亮的明珠”。無論是電影《超能陸戰(zhàn)隊(duì)》里可愛且暖心的機(jī)器人大白,《人工智能》里深愛人類養(yǎng)母的機(jī)器男孩大衛(wèi),還是《終結(jié)者》里施瓦辛格飾演的機(jī)器人戰(zhàn)士T-800,這類影視劇作品中描摹的機(jī)器人大多就是以高度擬人的外形出現(xiàn),塑造了大眾對機(jī)器人最原始的認(rèn)知。
人形機(jī)器人的外觀和行為與人高度相似,其標(biāo)志就是靈活的雙手、四肢以及靠雙足行走的運(yùn)動(dòng)方式。最重要的是,它能夠適應(yīng)人類的生存環(huán)境、使用人類的生產(chǎn)工具,形態(tài)更易令人產(chǎn)生共鳴。
人形機(jī)器人領(lǐng)域在2024年取得“技驚四座”的進(jìn)展:優(yōu)必選人形機(jī)器人Walker聚焦汽車、3C等制造業(yè)重點(diǎn)領(lǐng)域,已進(jìn)入多家車廠實(shí)訓(xùn);宇樹科技機(jī)器人實(shí)現(xiàn)了完全仿人的自然行走;波士頓動(dòng)力的新版Atlas機(jī)器人可在工廠里不同儲(chǔ)物柜之間絲滑搬動(dòng)零件;特斯拉人形機(jī)器人擎天柱(Optimus)計(jì)劃在2025年量產(chǎn)……
“目前,國內(nèi)很多工廠都已實(shí)現(xiàn)高度的自動(dòng)化,但工廠里現(xiàn)在仍需要人的地方,就是未來人形機(jī)器人接手的地方?!痹S華哲告訴記者,未來工廠將呈現(xiàn)流水線機(jī)械臂和人形機(jī)器人配合的最終形態(tài)。
人形機(jī)器人可解決生產(chǎn)線“最后一公里”的問題。比如,在總裝環(huán)節(jié)——即把所有批量生產(chǎn)好的零件按顧客需求組裝成產(chǎn)品,就可以由具有泛化能力的人形機(jī)器人來幫忙。此外,在家庭服務(wù)、公共服務(wù)等更復(fù)雜多變的場景中,人形機(jī)器人更具優(yōu)勢,可適應(yīng)不同的環(huán)境和需求,完成多種任務(wù)。
從“學(xué)習(xí)人”到“超越人”
人形機(jī)器人的研發(fā)始于對人本身的學(xué)習(xí)與模仿。我們可以用大腦、小腦和本體,來拆解人形機(jī)器人的研發(fā)難點(diǎn)?!按竽X”是機(jī)器人承擔(dān)自主學(xué)習(xí)、規(guī)劃和決策任務(wù)的中樞;“小腦”負(fù)責(zé)運(yùn)動(dòng)控制,包括從行走到跑跳,以及從簡單抓取到復(fù)雜的手部動(dòng)作等;而本體部分包括軀干四肢結(jié)構(gòu)和靈巧手設(shè)計(jì)。

9月12日,一款智能機(jī)器人在服貿(mào)會(huì)國家會(huì)議中心會(huì)場向觀眾“比心”
焦繼超告訴《環(huán)球》雜志記者,目前這三大領(lǐng)域都有較多技術(shù)難點(diǎn)待突破:“大腦”方面,云邊端一體計(jì)算架構(gòu)、多模態(tài)感知與環(huán)境建模等是近年技術(shù)攻關(guān)焦點(diǎn),“仿人最大難點(diǎn)在于對人腦的模仿,因?yàn)楝F(xiàn)有科學(xué)理論對人腦的研究遠(yuǎn)遠(yuǎn)不足”;“小腦”方面,人機(jī)交互能力、復(fù)雜地形通過、全身協(xié)同精細(xì)作業(yè)等是重要方向;“本體”方面,剛?cè)狁詈戏律鷤鲃?dòng)機(jī)構(gòu)、高緊湊機(jī)器人四肢結(jié)構(gòu)與靈巧手設(shè)計(jì)等關(guān)鍵技術(shù),構(gòu)成了人形機(jī)器人靈活運(yùn)動(dòng)所需的重要硬件基礎(chǔ)。
近些年,大模型的出現(xiàn)讓機(jī)器人“大腦”顯著“進(jìn)化”,大大提升了機(jī)器人的通用性和泛化性,更有望降低人形機(jī)器人的開發(fā)成本,加速其走入千家萬戶。
優(yōu)理奇機(jī)器人科技公司創(chuàng)始人兼首席執(zhí)行官楊豐瑜接受記者專訪時(shí)說,現(xiàn)在業(yè)界主要使用預(yù)訓(xùn)練大模型訓(xùn)練機(jī)器人,讓其具備更強(qiáng)的學(xué)習(xí)能力;大模型還能將特定任務(wù)的學(xué)習(xí)遷移到機(jī)器人任務(wù)上,提高其適應(yīng)能力;另外還可利用大模型的多模態(tài)處理能力,結(jié)合視覺、聽覺、觸覺等各種輸入,提升機(jī)器人對復(fù)雜場景的理解。
許華哲向記者介紹了最近很火的“視覺語言行動(dòng)模型”。這一模型同時(shí)兼具大腦的泛化性和小腦的運(yùn)動(dòng)控制能力,能幫助機(jī)器人在完全陌生的環(huán)境下完成規(guī)定動(dòng)作。比如,通過該模型訓(xùn)練的機(jī)器人在進(jìn)入不同家庭后,面對不同外觀的冰箱,可以做到絲滑開門取物。
“大模型技術(shù)的發(fā)展,大大提升了人形機(jī)器人的智能化水平,更‘聰明’的人形機(jī)器人將更符合人類心智,交互也更自然。除了具有勞動(dòng)價(jià)值,人形機(jī)器人還能為我們帶來情感價(jià)值。”焦繼超說。
楊豐瑜也認(rèn)為,在自然語言處理方面,大模型能夠提升機(jī)器人與人類的交互能力,讓機(jī)器人更容易理解人的指令。
研發(fā)馬拉松,中美同起跑
目前,人形機(jī)器人已進(jìn)入產(chǎn)業(yè)化落地初期階段,在工業(yè)制造、商用服務(wù)和家庭陪伴領(lǐng)域都開始“試水”。環(huán)顧全球,無論是在技術(shù)突破、落地進(jìn)展還是融資規(guī)模上,人形機(jī)器人研發(fā)競賽基本上以中國和美國為主導(dǎo)。
“如果把人形機(jī)器人行業(yè)比喻成一場馬拉松,中國和歐美國家,目前幾乎都處在前面1000米的起跑階段?!苯估^超說。
許華哲認(rèn)為,在大模型技術(shù)方面,美國已搶占先機(jī),但在具身智能領(lǐng)域,中美幾乎勢均力敵,“這對中國來說是一個(gè)機(jī)會(huì)”。
楊豐瑜也認(rèn)為,美國在AI和多模態(tài)大模型技術(shù)上領(lǐng)先中國1年左右。大模型研發(fā)能力、感知技術(shù)的領(lǐng)先,使美國企業(yè)在機(jī)器人決策系統(tǒng)和復(fù)雜任務(wù)處理方面具有更強(qiáng)競爭力。而中國的優(yōu)勢更多體現(xiàn)在工業(yè)機(jī)器人領(lǐng)域,特別是在制造業(yè)中應(yīng)用較為成熟。
而在人形機(jī)器人技術(shù)專利方面,中國已走在前列。人民網(wǎng)研究院《人形機(jī)器人技術(shù)專利分析報(bào)告》顯示,截至2023年5月,中國已累計(jì)申請6618件人形機(jī)器人技術(shù)專利,是申請人形機(jī)器人技術(shù)專利數(shù)量最多的國家。同時(shí),國內(nèi)的廣闊市場也為人形機(jī)器人落地提供了充足的場景。
但對中國機(jī)器人行業(yè)來說,更大的挑戰(zhàn)在于機(jī)器人大腦的核心算法和高端芯片(特別是英偉達(dá)芯片)受美國芯片法案影響較大。“盡管中國在硬件自研方面取得了一些突破,但在機(jī)器人操作的‘大腦’部分,即算法開發(fā)和高性能芯片制造上,尚存在差距?!睏钬S瑜說。
許華哲也認(rèn)為,盡管目前在機(jī)器人領(lǐng)域,電機(jī)等國產(chǎn)零部件質(zhì)優(yōu)價(jià)廉,但芯片被“卡脖子”是最大隱患。包括地平線機(jī)器人在內(nèi)的一些業(yè)內(nèi)公司正努力實(shí)現(xiàn)芯片國產(chǎn)化,但只有核心芯片實(shí)現(xiàn)國產(chǎn)化才能“安心”,這需要時(shí)間。
打造機(jī)器人“試驗(yàn)田”
算力、算法和數(shù)據(jù)被普遍認(rèn)為是具身智能發(fā)展的核心生產(chǎn)要素,盡管目前中國可能在算力和算法方面受制于人,但數(shù)據(jù)卻是中國的最大競爭優(yōu)勢。楊豐瑜指出,在具身智能領(lǐng)域,物理世界中的數(shù)據(jù)比較稀缺,僅靠合成數(shù)據(jù)難以完全復(fù)刻現(xiàn)實(shí)中的復(fù)雜場景。一些模型在合成數(shù)據(jù)訓(xùn)練后會(huì)崩潰,因?yàn)樗鼈儫o法應(yīng)對真實(shí)世界中多樣且不可預(yù)期的情況。

9月20日,在2024世界制造業(yè)大會(huì)上,一款人形機(jī)器人展示搬運(yùn)技能
這方面,中國擁有豐富的應(yīng)用場景和龐大的潛在用戶人口。許華哲介紹,真實(shí)世界的數(shù)據(jù)一般靠各家機(jī)器人公司自己采集。接下來的關(guān)鍵就是,如何在真實(shí)世界場景中采集大量數(shù)據(jù),并由國家統(tǒng)籌流通和供給人形機(jī)器人行業(yè)使用。比如,北京創(chuàng)新中心人形機(jī)器人有限公司正計(jì)劃打造一個(gè)開源數(shù)據(jù)集供學(xué)界和業(yè)界使用。未來,高質(zhì)量的共享數(shù)據(jù)集將大大助力行業(yè)發(fā)展。
機(jī)器人要取得更大突破,還需在更多真實(shí)場景中去驗(yàn)證。然而,傳統(tǒng)行業(yè)出于風(fēng)險(xiǎn)、成本等考慮,不愿過早采用未成熟的創(chuàng)新技術(shù),這限制了機(jī)器人技術(shù)的迭代和實(shí)際應(yīng)用。
楊豐瑜認(rèn)為,如果一些傳統(tǒng)行業(yè)開放部分工業(yè)或服務(wù)場景(比如商超零售、公共服務(wù)、醫(yī)療陪護(hù)等)作為“試驗(yàn)田”,讓機(jī)器人公司在真實(shí)環(huán)境中不斷調(diào)整、優(yōu)化功能,將有助于快速推進(jìn)技術(shù)成熟。國家對此可以考慮出臺相關(guān)措施加以推動(dòng)。許華哲提出建議,傳統(tǒng)行業(yè)還可以股東而非客戶形式加入機(jī)器人公司,提供更長期支持,借此逐步實(shí)現(xiàn)部分生產(chǎn)線被機(jī)器人替代。
對于具身智能來說,人才是行業(yè)未來高速發(fā)展面臨的另一大挑戰(zhàn)。許華哲指出,目前具身智能領(lǐng)域人才資源緊張,甚至出現(xiàn)和“大模型”公司搶人的現(xiàn)象。楊豐瑜也認(rèn)為,很多人才被吸引到大模型或AI領(lǐng)域,導(dǎo)致機(jī)器人行業(yè)出現(xiàn)較大人才缺口。
楊豐瑜指出領(lǐng)域內(nèi)主要缺乏三類人才:首先是在觸覺反饋、多模態(tài)感知、機(jī)械臂精密控制、硬件設(shè)計(jì)等高精尖領(lǐng)域的人才;其次是急需橫跨算法、硬件、軟件、工業(yè)設(shè)計(jì)等領(lǐng)域的復(fù)合型人才;最后是具備產(chǎn)品設(shè)計(jì)思維、用戶體驗(yàn)設(shè)計(jì)能力的非傳統(tǒng)技術(shù)人才。
“可通過高校、研究院等協(xié)同培養(yǎng),設(shè)置專項(xiàng)獎(jiǎng)學(xué)金或引進(jìn)國際頂尖人才,培養(yǎng)跨學(xué)科復(fù)合型人才。”楊豐瑜說。
新聞稿件歡迎直接聯(lián)系:QQ 34004818 微信公眾號:cpsjyzb
我要評論
0 條評論
- 還沒有人評論過,趕快搶沙發(fā)吧!
熱點(diǎn)榜
最新專題
更多-
-
科技助警,干貨滿載:第八屆警用無人機(jī)論壇亮點(diǎn)紛呈!
第八屆警用無人機(jī)創(chuàng)新 [ 詳情 ]
- 回顧第七屆世界無人機(jī)大會(huì) 07-10
- 專題:回顧2022世界無人機(jī)大會(huì) 01-13
加入收藏
加關(guān)注
登錄
注冊
微警用
