一場(chǎng)被一些業(yè)內(nèi)人士視作是“中國(guó)具身智能路線(xiàn)之爭(zhēng)”的學(xué)術(shù)爭(zhēng)論,引起了機(jī)器人行業(yè)的討論。
一位討論參與者是許華哲,來(lái)自清華大學(xué)交叉信息研究院(簡(jiǎn)稱(chēng)“清華叉院”),是中國(guó)科技頂尖人才培養(yǎng)機(jī)構(gòu)的助理教授,同時(shí)也是機(jī)器人企業(yè)星海圖的聯(lián)合創(chuàng)始人。另一位則是獲得IEEE T-RO最佳論文獎(jiǎng)的周博宇,這是亞洲單位首次獲得該獎(jiǎng)項(xiàng),同時(shí)他也是南方科技大學(xué)的助理教授、博士生導(dǎo)師。知乎平臺(tái)中,他們圍繞“機(jī)器人領(lǐng)域特殊任務(wù)研究是否有價(jià)值”等話(huà)題展開(kāi)了討論。
前者主張“特殊任務(wù)研究”于學(xué)科有益,但對(duì)于推動(dòng)具身智能的發(fā)展“幾乎沒(méi)有用處”。后者則主張無(wú)用之用方為智能基石。5月23日,第一財(cái)經(jīng)記者分別采訪(fǎng)了許華哲、周博宇以及其他業(yè)內(nèi)人士后了解到,在二者觀(guān)點(diǎn)的分歧和共識(shí)之外,這場(chǎng)爭(zhēng)論折射出了學(xué)界對(duì)技術(shù)決定論的警惕,更直接對(duì)行業(yè)進(jìn)行了“糾偏”。
在資本追捧大模型、企業(yè)砸錢(qián)秀肌肉的浪潮中,究竟該押注通用顛覆,還是深耕工業(yè)現(xiàn)場(chǎng)那些“不夠性感”的工程細(xì)節(jié)?這是每一位具身智能從業(yè)者必須親自探索的命題。
針對(duì)“特殊任務(wù)”的研究是否有意義?
整場(chǎng)討論的原點(diǎn),是許華哲在知乎上發(fā)表了一篇名為《具身智能需要從ImageNet做起嗎?》的文章。
許華哲在其中提到,傳統(tǒng)機(jī)器人學(xué)有相當(dāng)一部分的研究重點(diǎn)在于“特別”的機(jī)器人或者“特別”的任務(wù)。比如一個(gè)蛇形機(jī)器人、一個(gè)老鼠機(jī)器人,或是讓機(jī)器人去包餃子、抖落衣服。這類(lèi)“特殊任務(wù)研究”的任務(wù)對(duì)科學(xué)雖然有用,但對(duì)“推動(dòng)具身智能的發(fā)展幾乎沒(méi)有用處”。
“我認(rèn)為這種觀(guān)點(diǎn)顯然不對(duì)。”在《具身智能:一場(chǎng)需要謙遜與耐心的科學(xué)遠(yuǎn)征》中,周博宇直接指出,具身智能本身是跨學(xué)科產(chǎn)物,它的發(fā)展必須依賴(lài)具體科學(xué)問(wèn)題的突破。他以波士頓動(dòng)力和蛇形機(jī)器人的研究為例,指出波士頓動(dòng)力早期研究足式機(jī)器人時(shí),沒(méi)有人能預(yù)見(jiàn)其動(dòng)態(tài)平衡算法會(huì)成為現(xiàn)代人形機(jī)器人的核心;蛇形機(jī)器人研究中的柔性驅(qū)動(dòng)技術(shù),也直接推動(dòng)了醫(yī)療內(nèi)窺鏡機(jī)器人的發(fā)展。“這些看似無(wú)用的特別任務(wù),都推動(dòng)了科學(xué)的進(jìn)步,以及具身智能的進(jìn)步。”
針對(duì)特定場(chǎng)景的研究,對(duì)于行業(yè)來(lái)說(shuō)的意義究竟有多大,成為了二者討論的核心矛盾。在許華哲看來(lái),按照深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)領(lǐng)域的發(fā)展規(guī)律,推動(dòng)力主要來(lái)自ImageNet這樣的標(biāo)準(zhǔn)化數(shù)據(jù)集以及ResNet或Transformer這樣的通用模型。例如流水線(xiàn)分揀、零件拋光打磨等“特別的任務(wù)”,短期內(nèi)有經(jīng)濟(jì)價(jià)值、創(chuàng)業(yè)需求,但長(zhǎng)期會(huì)被具身智能的進(jìn)展淹沒(méi)。
許華哲向第一財(cái)經(jīng)記者進(jìn)一步解釋?zhuān)詸C(jī)器人的局部運(yùn)動(dòng)為例,在強(qiáng)化學(xué)習(xí)為主導(dǎo)的方案興起前,人們利用控制手段也能讓機(jī)器人完成特定任務(wù),如在草地上行走、跳舞等。“不過(guò),直到強(qiáng)化學(xué)習(xí)應(yīng)用于此,機(jī)器人才具備了從平地到草地、山地、跨臺(tái)階等只用一套系統(tǒng)就能應(yīng)對(duì)的能力。”
“只要通用智能做成,各種細(xì)分領(lǐng)域的問(wèn)題也將迎刃而解”的觀(guān)點(diǎn),被周博宇視作是“通用大腦優(yōu)越論”。他提到,即便是人類(lèi)自身,在掌握某項(xiàng)特定技能時(shí),也必須經(jīng)歷反復(fù)錘煉,方能得心應(yīng)手。“通用智能無(wú)疑是一個(gè)宏偉的目標(biāo),但與此同時(shí),我也希望青年學(xué)生與工程師們能關(guān)注到一些更為具體、務(wù)實(shí)的產(chǎn)業(yè)需求。”
汽車(chē)總裝車(chē)間中亟待解決的線(xiàn)束整理難題、半導(dǎo)體封裝環(huán)節(jié)對(duì)高精度和高穩(wěn)定性的嚴(yán)苛要求……“這些看似‘不夠性感’的工程細(xì)節(jié),恰恰是錘煉真正智能的淬火池。”周博宇說(shuō)。