-
觀察者網(wǎng)WAIC直播實(shí)錄:AI大潮下的具身和人形,中國(guó)在跟跑還是并跑?
最后更新: 2025-08-03 23:55:24趙仲夏: 了解。馮院長(zhǎng),剛剛勉諾提到了給智能一些時(shí)間,給研究者一些時(shí)間。我之前的感受是通用智能的每一次迭代都會(huì)摧毀在專有領(lǐng)域的所有努力,無論早期的 CV 到后面的自動(dòng)駕駛都一樣。您這邊應(yīng)該算是從 AI 1.0 走出來的公司,然后您對(duì)人形機(jī)器人和具身智能的落地是怎么看待的?有沒有一些經(jīng)驗(yàn)可以跟大家分享一下?
馮子勇:落地還早,說明就是還有的做嘛。從我的角度來看,落地還是數(shù)據(jù)先行,現(xiàn)在我已經(jīng)看到不管企業(yè)、政府還是學(xué)校,還有一些其他組織都在牽頭做各種各樣的數(shù)據(jù)采集工廠或者各種機(jī)構(gòu)什么的都有。
所以廣泛的數(shù)據(jù)采集是必不可少的,但是在采什么數(shù)據(jù)上可能大家有一些分歧,像仿真的數(shù)據(jù),動(dòng)補(bǔ)的數(shù)據(jù),各家都在說自己好的,沒有定論。從預(yù)訓(xùn)練的角度,我的想法是回顧像GPT 跟 CLIP 這樣的模型,大家用的主要是互聯(lián)網(wǎng)數(shù)據(jù),GPT 用的就是 common crawl,基本上是整個(gè)互聯(lián)網(wǎng)的語料, CLIP 也是在 common crawl 里面把圖文的 pair 給取出來了。所以我有一個(gè)幻想,可能答案還在互聯(lián)網(wǎng)里面,可能數(shù)據(jù)一直在那,只是大家還沒有找到一些非常有智慧的方法把它給找出來,去做具身的預(yù)訓(xùn)練,這是我的想法。
從 action 模型的角度,我更傾向最好是有一個(gè)設(shè)備能跟著人一起走,就像眼鏡。
趙仲夏: 今天的會(huì)場(chǎng)好多眼鏡。
馮子勇:對(duì),有一個(gè)對(duì)比,像特斯拉的FSD,大家在開車的時(shí)候把自己的操作給記錄下來了,就將采數(shù)據(jù)和產(chǎn)品融合到一起,這樣的話,特斯拉有多少,就得有多少數(shù)據(jù)采集員,那這個(gè)量是非常可觀的。眼鏡是這里面最像的一個(gè),我個(gè)人覺得一個(gè)是它可以適合所有人戴。在任何地方、任何場(chǎng)景采任何數(shù)據(jù),然后人肯定戴了之后會(huì)有操作,只要把操作也記錄下來,像Meta,他們有一個(gè)新的演進(jìn)形態(tài)是Arial好像。
趙仲夏: 對(duì),面向研究者的眼鏡,還得申請(qǐng)。
馮子勇:它有一個(gè)機(jī)電的手環(huán),相當(dāng)于我在操作的時(shí)候,把手的操作也記錄下來,是不是這樣的數(shù)據(jù)在量大了之后,就能從量變直接達(dá)到質(zhì)變?有那一刻像 FSD 最開始,也是從小模型到一個(gè)主干多個(gè)分支的模型,到 OCC 網(wǎng)絡(luò),到直接到現(xiàn)在它可能也是數(shù)據(jù)采集到了,它就可以直接上端到端了。
另外一個(gè),剛才說具身真的離落地可能還有點(diǎn)時(shí)間,我也規(guī)劃了一個(gè)項(xiàng)目,關(guān)于多模態(tài)的,這里其實(shí)在 VLM 到具身中間還加了一個(gè)叫 GUI agent,因?yàn)?GUI agent 也是操作物理的世界更加簡(jiǎn)單,而且不停地能重復(fù)。如果我們能在上面做得好,那可以談具身,但如果在這上面都還磕磕巴巴的,就證明離具身的確有點(diǎn)距離。
趙仲夏: 對(duì),您剛剛提到眼鏡的時(shí)候,我的一個(gè)觀察是現(xiàn)在大部分的搖操也要逐漸變成 VR 搖操了,而 VR 搖操很像一個(gè)人的手眼關(guān)系。這應(yīng)該和眼鏡也是可以互通的。
奚老師,這個(gè)就是您這邊的重頭戲了。您剛才有提到家電智能化、智能家電或者具身家電這個(gè)概念,您跟我們先解釋解釋什么叫做具身家電吧?
奚偉: 具身家電我們還沒提這個(gè)詞,我們現(xiàn)在是家電機(jī)器人化的概念?,F(xiàn)在智能家電會(huì)比較注重的是IoT,就是家電互聯(lián)這一塊,但是家電可能也具有一定的機(jī)器人屬性,能夠讓家電進(jìn)行主動(dòng)服務(wù),這是下一步家電需要走的方向,要把機(jī)器人屬性加入到一部分家電的能力中。
比如烤箱,大部分人做飯其實(shí)不太熟悉怎么去使用烤箱,怎么能做出更像大廚的牛排等食品。比如烤牛排,假如把一部分機(jī)器人的屬性,可能把烤箱內(nèi)部也做一些升降機(jī)構(gòu),能夠自動(dòng)升降,自動(dòng)推出,調(diào)料也可以自動(dòng)添加,或者根據(jù)它的溫度場(chǎng)景進(jìn)行調(diào)配。我們就把烤箱也變成一個(gè)智能體,而不是現(xiàn)在只會(huì)拉開門,東西放進(jìn)去再定個(gè)時(shí)就完了。此外,我們希望烤箱能夠更精準(zhǔn)地、定制化地給客戶服務(wù)。把視覺加進(jìn)去之后,比如把食材放進(jìn)去,它可以自動(dòng)識(shí)別,自動(dòng)給你定制菜譜,自動(dòng)根據(jù)你的需求進(jìn)行調(diào)味,這些都可以從我們的產(chǎn)品上實(shí)現(xiàn)。
趙仲夏: 客戶導(dǎo)向這個(gè)感同身受,我感覺做牛排嚴(yán)重打擊了我的積極性。我最后問了一個(gè)餐廳大廚,他跟我講要不你先把油溫升上去,先把鍋弄熱了,然后你再放,有沒有可能鍋不熱永遠(yuǎn)做不出來?我覺得這個(gè)太酷了。另外,我們看到美的既有自己的工廠,還有一個(gè)整體的制造業(yè),包含未來的面向家用的全領(lǐng)域。您覺得人形機(jī)器人未來是一個(gè)怎樣的落地格局?我們什么時(shí)候才能真的每個(gè)家庭都擁有一個(gè)或者幾個(gè)人形機(jī)器人?
奚偉: 剛才馮院長(zhǎng),還有勉諾也說了,這個(gè)還需要一點(diǎn)時(shí)間,但從一個(gè)從業(yè)者的角度來講,還是要應(yīng)用來牽引,否則一直在說我們要打磨技術(shù),我們要去要給一定時(shí)間、一定空間才能發(fā)展。我覺得需要不斷地在應(yīng)用上去探索,反哺我們技術(shù)上的一些缺陷,所以從我們角度來講,工業(yè)場(chǎng)景的應(yīng)用比較具體,也比較聚焦,它在產(chǎn)業(yè)的賦能角度來講,可能短期會(huì)產(chǎn)生比較大的價(jià)值,所以我們也像特斯拉、很多創(chuàng)業(yè)者,都是從工業(yè)場(chǎng)景入手。
這樣做最大的好處是,我們不一定完全需要這種通用的具身智能,才能夠達(dá)到進(jìn)入工廠的階段。我們可能把它分階段變成小模型,比如一些小的通過視覺模型,通過一些傳統(tǒng)的規(guī)劃,也可以做到一定的泛化能力。這個(gè)過程中,把這些數(shù)據(jù)采集回來,去訓(xùn)練更具有通用性的具身智能大模型,不斷地進(jìn)行迭代。就像特斯拉,先做一個(gè) FSD ready 的這樣一個(gè)車,然后放到工廠里,可以先去做一定的自主化或者自動(dòng)化。但是它不一定是要完全的自主化,過程中我們通過人機(jī)混合的方式進(jìn)行數(shù)據(jù)采集,但不斷地迭代模型,最終實(shí)現(xiàn)端到端的這種具身智能模型。這是一個(gè)必由的路徑,它一定不會(huì)是一蹴而就。今天是0,明天接到完全的具身智能。
相對(duì)來講,工業(yè)場(chǎng)景比較好結(jié)構(gòu)化,從工業(yè)場(chǎng)景我覺得下一步是商用場(chǎng)景,需要有一些人機(jī)交互,相對(duì)的,它的任務(wù)有一定的復(fù)雜度,但也會(huì)比較結(jié)構(gòu)的,比較具體的,比如在餐飲行業(yè)、奶茶店、咖啡店,都是比較簡(jiǎn)單的一個(gè)任務(wù),當(dāng)他在商業(yè)行業(yè)能夠用起來之后,我覺得最終是引進(jìn)家庭的。
進(jìn)入家庭有幾個(gè)問題,一個(gè)是安全問題,再比如說真正的語言的人機(jī)交互問題、個(gè)性化的定制問題,還有一些隱私問題,都會(huì)要去解決,這時(shí)候才能真正每一個(gè)家庭或者甚至每一個(gè)人都能用上機(jī)器人的個(gè)人助手。
人民網(wǎng)研究院數(shù)據(jù)統(tǒng)計(jì),從具身智能人形機(jī)器人專利累計(jì)受理量數(shù)據(jù)看,截至 2022 年末,中國(guó)已占據(jù)40%的份額。
趙仲夏: 這個(gè)很棒啊。我們是在觀察者網(wǎng)的直播間,(時(shí)間關(guān)系)也是我們的最后一個(gè)問題。我個(gè)人的感覺,人形機(jī)器人如果真的落地,本質(zhì)上是生產(chǎn)力的解放。當(dāng)生產(chǎn)力解放之后,經(jīng)濟(jì)基礎(chǔ)決定上層建筑,整個(gè)社會(huì)結(jié)構(gòu)都會(huì)完成一次解放,然后也許就有可能實(shí)現(xiàn)大家社會(huì)學(xué)上的一些比較好的愿景。所以我覺得它應(yīng)該是一個(gè)世界人民的視野。在本次的人形機(jī)器人和具身智能的競(jìng)爭(zhēng)與合作過程中,大家覺得中美之間有什么優(yōu)勢(shì)或者各自的劣勢(shì)?對(duì)這塊的話想問一下大家對(duì)這件事的看法,要不奚老師您先回答。
奚偉: 我覺得中國(guó)的優(yōu)勢(shì)還是很明顯的,機(jī)電優(yōu)勢(shì)、產(chǎn)業(yè)的優(yōu)勢(shì)無庸置疑。人形機(jī)器人在中國(guó)發(fā)展兩年,整個(gè)產(chǎn)業(yè)鏈發(fā)展非常迅速。尤其是今年,關(guān)鍵模組也是飛速降價(jià),讓很多的從業(yè)者能夠參與到行業(yè)來,而且進(jìn)入成本可以開始做一些規(guī)模化的應(yīng)用。這個(gè)是中國(guó)的巨大優(yōu)勢(shì)。
但在包括具身智能、 AI 技術(shù)等的發(fā)展上,我覺得中美兩國(guó)還在并肩競(jìng)爭(zhēng)階段,我認(rèn)為從某些角度來講,美國(guó)有一定的領(lǐng)先優(yōu)勢(shì),中國(guó)更多的還是在 follow 、了解、快速地發(fā)展。
趙仲夏: 馮老師,您怎么看待這件事情?
馮子勇:中國(guó)的人工智能的人才還是非常的強(qiáng)的,大家可以看到,不管是中國(guó)本身的,從 paper 層面,從創(chuàng)新層面,哪怕是在美國(guó),一半的人才也都是華人,所以人才儲(chǔ)備是很強(qiáng)的,中國(guó)也有非常廣泛的落地場(chǎng)景,像咱們美的,今天在現(xiàn)場(chǎng)也看到很多。
另外,中國(guó)的政策優(yōu)勢(shì)也很明顯,政府非常大力地支持。需要改進(jìn)的,剛才也都說了,我們的創(chuàng)新性就更多的還是以 follow 為主。
趙仲夏: 了解。勉諾,你可能對(duì)中美之間都會(huì)接觸得更多一點(diǎn),你是如何看待這件事情的?
陳勉諾: 從我的視角下,我自己看到中美確實(shí)兩邊形成了更加鮮明的優(yōu)勢(shì)。在中國(guó),大家可以看到更高的人才密度的這個(gè)涌現(xiàn),我們今天說 AI 和具身智能的整個(gè)行業(yè)的競(jìng)爭(zhēng),變成了中國(guó)的中國(guó)人和美國(guó)的中國(guó)人的競(jìng)爭(zhēng)。
從我的視角下,我自己看到中美確實(shí)兩邊形成了更加鮮明的優(yōu)勢(shì)。在中國(guó),大家可以看到更高的人才密度的涌現(xiàn),我們今天說 AI 和具身智能的整個(gè)行業(yè)的競(jìng)爭(zhēng)變成了中國(guó)的中國(guó)人和美國(guó)的中國(guó)人的競(jìng)爭(zhēng)。
另外一個(gè)層面上,中國(guó)的硬件優(yōu)勢(shì)還是很鮮明的。在美國(guó)可能我們只知道有特斯拉這樣一家電動(dòng)汽車公司,在中國(guó)有蔚小理,有小米等等這樣一些硬件公司,中國(guó)本身的供應(yīng)鏈的優(yōu)勢(shì)能夠讓硬件這個(gè)事情變得更容易去實(shí)現(xiàn),這也是為什么在美國(guó)可能軟件比較盛行,而在中國(guó)硬件可能做的更好,這是中國(guó)本土環(huán)境下的長(zhǎng)足優(yōu)勢(shì)。
另外,我們也看到每一次革命的發(fā)生都會(huì)帶來一次大國(guó)之間格局的變化,比如說從農(nóng)業(yè)時(shí)代到電氣時(shí)代,再到互聯(lián)網(wǎng)時(shí)代,到今天的智能化時(shí)代。我覺得今天可能中國(guó)在更迭上是有巨大機(jī)會(huì)的。
但我們也得正視,中國(guó)在改革開放之后,整個(gè)的經(jīng)濟(jì)發(fā)展速度變快,科技的發(fā)展速度變快,但還是有一些領(lǐng)域我們?nèi)匀挥幸恍┎蛔悖热缭谒懔Ψ矫?。其?shí)今天可能中國(guó)的人工智能瓶頸不在于人才,而在于缺乏比較好的算力,這也是有我們投的公司在去做這個(gè)事情。
此外我也看到在機(jī)器人和AI場(chǎng)景下還有一些現(xiàn)象,由于在美國(guó)可能人力成本比較貴,所以在真正的落地場(chǎng)景里邊,無論AI 還是機(jī)器人可能在美國(guó)落地會(huì)更加容易,美國(guó)的市場(chǎng)會(huì)更加的高效。
所以中國(guó)有大量的,無論是硬件公司還是軟件公司去做出海,這個(gè)也是我們需要去正視的問題,因?yàn)樵谥忻赖母窬窒?,中?guó)本土的市場(chǎng)在這個(gè)人力的成本沒有到達(dá)很高的情況下,確實(shí)在本土市場(chǎng)這一塊有一定的挑戰(zhàn)。
所以我們也一直倡導(dǎo)今天的創(chuàng)業(yè)者要具備全球化視野,要去做全球化市場(chǎng),利用中國(guó)本土的優(yōu)勢(shì)服務(wù)全球的市場(chǎng)。
趙仲夏: 太棒了,我感覺勉諾可以做我的創(chuàng)業(yè)導(dǎo)師。好的,我們也進(jìn)行了一個(gè)半小時(shí)了。我們這場(chǎng)具身和人形機(jī)器人的討論,今天也就到此為止,非常感謝奚老師、馮老師還有勉諾給我們帶來的非常精彩的觀點(diǎn)分享。也感謝大家,感謝各位觀眾。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 張志峰 
-
鴻蒙世界,正上演“寒武紀(jì)大爆發(fā)”
2025-08-03 14:45 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
大疆、影石相互“偷家”!天空與全景的邊界瓦解
2025-08-03 13:43 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
華夏人壽被吊銷業(yè)務(wù)許可證,原董事長(zhǎng)、董秘被終身禁業(yè)
2025-08-02 19:42 -
李寧還能回到過去嗎?
2025-08-02 10:27 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
AI+中國(guó),能否帶來東方文藝的復(fù)興?
2025-08-02 10:06 2025世界人工智能大會(huì) -
-
-
東鵬半年報(bào):凈利增加37.22%,半年?duì)I收首次破百億
2025-08-01 23:19 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
香港法院要求宗馥莉保全18億美元信托,三子女證據(jù)曝光
2025-08-01 20:58 -
-
-
尊湃竊取華為芯片技術(shù)案宣判:14人被判刑,總罰金超千萬
2025-08-01 19:27 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
香港高等法院:宗馥莉暫不得提取匯豐賬戶資產(chǎn)
2025-08-01 19:25 -
谷歌回應(yīng)恢復(fù)中國(guó)大陸服務(wù)傳聞:截圖不是來自Google
2025-08-01 19:10 -
計(jì)劃以29.32億港元進(jìn)行私有化,大悅城地產(chǎn)或?qū)⑼耸?/a>
2025-08-01 16:43 -
66折,李嘉誠(chéng)家族一項(xiàng)目大降價(jià)
2025-08-01 15:01 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
-
夢(mèng)百合、左右家居跨界開酒店,醉翁之意還是“賣貨”?
2025-08-01 12:05 -
相關(guān)推薦 -
習(xí)近平:中方在TikTok問題上的立場(chǎng)是清楚的 評(píng)論 7美媒挑事:巴基斯坦與中國(guó)很鐵,你細(xì)品… 評(píng)論 35“訓(xùn)練成本才這么點(diǎn)?美國(guó)同行陷入自我懷疑” 評(píng)論 108中美高層本月頻繁互動(dòng),什么信號(hào)? 評(píng)論 80“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援” 評(píng)論 121最新聞 Hot
-
美媒挑事:巴基斯坦與中國(guó)很鐵,你細(xì)品…
-
“中方最嚴(yán)厲的公開回應(yīng)”
-
“挑戰(zhàn)中國(guó)主導(dǎo),美國(guó)把手伸向贊比亞”
-
“訓(xùn)練成本才這么點(diǎn)?美國(guó)同行陷入自我懷疑”
-
普京罕見透露前線俄軍人數(shù)
-
加拿大饞哭了:中國(guó)又從澳方買了,一買就是9船…
-
以防長(zhǎng)威脅:胡塞,你的死期到了
-
主謀已落網(wǎng)
-
簽了!“中國(guó)發(fā)動(dòng)機(jī)替代德國(guó)產(chǎn)品”
-
“對(duì)農(nóng)民來說,無異于千刀萬剮!好好和中國(guó)談吧”
-
印媒越吹越離譜:陣風(fēng)領(lǐng)先殲-35A...
-
白宮AI顧問急了:這正中華為下懷,居心何在?
-
“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援”
-
針對(duì)個(gè)別“反華”集會(huì),韓總理緊急指令
-
日本空自一架搜救機(jī)降落時(shí)沖出跑道,暫無人員傷亡
-
獨(dú)山縣委書記李景寬任上被查
-