bibo必博官網(wǎng)-配天觀點(diǎn):具身智能商業(yè)化落地之路,道阻且長(zhǎng),但行則必至!
當(dāng)前,大模型、多模態(tài)、具身智能等概念方興未艾,發(fā)展智能化技術(shù)成為了各行各業(yè)頭部企業(yè)的共識(shí),玩家們各顯神通,紛紛亮出看家法寶。機(jī)器人行業(yè)內(nèi)更是涌現(xiàn)了一批在設(shè)施巡檢、搶險(xiǎn)救災(zāi)、家政服務(wù)等通用或垂直領(lǐng)域的應(yīng)用成果。然而,在配天機(jī)器人CTO郭濤看來(lái),真正的具身智能,需要具備多模態(tài)融合感知決策能力、泛化能力,任務(wù)成功率也尚待提升,從這些層面上來(lái)講,具身智能商業(yè)落地還有很長(zhǎng)一段路要走。
配天機(jī)器人作為國(guó)內(nèi)工業(yè)機(jī)器人領(lǐng)域的頭部廠商,也在具身智能領(lǐng)域進(jìn)行了諸多探索。配天機(jī)器人于2023年發(fā)布了繹零機(jī)器人運(yùn)動(dòng)控制引擎,該技術(shù)將人工智能和傳統(tǒng)控制技術(shù)深度融合,使機(jī)械臂習(xí)得高動(dòng)態(tài)和擬人特性的控制策略網(wǎng)絡(luò),使機(jī)械臂更好地適應(yīng)環(huán)境變化,以滿足各類復(fù)雜任務(wù)的需求,大幅度提升了機(jī)械臂任務(wù)執(zhí)行的精度、速度和泛化能力。通過(guò)本次探索,配天打通了具身智能應(yīng)用的核心技術(shù)邏輯。
配天機(jī)器人CTO郭濤從具身智能的技術(shù)路線出發(fā),分享了他對(duì)行業(yè)未來(lái)發(fā)展方向的洞察。以下為采訪對(duì)話原文,有所修改。
Q:您如何看待當(dāng)前具身智能的發(fā)展水平?
實(shí)現(xiàn)具身智能,多模態(tài)融合感知決策和任務(wù)泛化能力是基礎(chǔ)能力
郭濤:
“具身智能需要的是和物理世界實(shí)時(shí)交互、即時(shí)決策,進(jìn)而處理泛化任務(wù)。將多模態(tài)做深度融合后,進(jìn)行綜合分析,這是處理泛化任務(wù)的基礎(chǔ)。
而目前市面上的大模型應(yīng)用中,只有圖文大模型應(yīng)用做到了雙模態(tài)深度融合,其余應(yīng)用還處于一個(gè)淺融合、淺應(yīng)用的狀態(tài),數(shù)據(jù)量級(jí)也不夠,還沒(méi)有達(dá)到大模型的體量。大多是分別分析幾種模態(tài),再用小模型進(jìn)行融合。比如AI攝像頭融合激光雷達(dá),二者本質(zhì)上更像是一種模態(tài),攝像頭識(shí)別目標(biāo)類別和位置,激光雷達(dá)識(shí)別目標(biāo)位置,結(jié)合起來(lái)精度提升了,但遠(yuǎn)遠(yuǎn)達(dá)不到綜合感知。多模態(tài)融合水平不夠,數(shù)據(jù)量級(jí)不夠,導(dǎo)致現(xiàn)在的一些所謂具身智能沒(méi)有任務(wù)泛化能力,僅能處理同一條件下同一類型的任務(wù),應(yīng)用價(jià)值有限?!?/p>
Q:配天發(fā)展具身智能的驅(qū)動(dòng)力有哪些?
從自動(dòng)化到智能化,生產(chǎn)模式的變化倒逼技術(shù)升級(jí)
郭濤:
“配天機(jī)器人作為國(guó)內(nèi)最早做工業(yè)機(jī)器人的企業(yè),歷經(jīng)多次技術(shù)變遷。這十年間是工業(yè)自動(dòng)化和智能制造的時(shí)代。3C、汽車領(lǐng)域生產(chǎn)特點(diǎn)為大規(guī)模標(biāo)準(zhǔn)化,機(jī)器人在人工編程下重復(fù)同一件工作。當(dāng)下,大規(guī)模同品類的生產(chǎn)場(chǎng)景的自動(dòng)化普及率已經(jīng)非常高,小規(guī)模定制化生產(chǎn)也成為了一種新趨勢(shì),這既是機(jī)器人企業(yè)發(fā)展的危機(jī),也是轉(zhuǎn)機(jī)。自動(dòng)化時(shí)代繁瑣復(fù)雜的人工編程示教模式效率低下、成本高企,已經(jīng)無(wú)法滿足新生產(chǎn)趨勢(shì)的需要。生產(chǎn)模式的變化倒逼機(jī)器人廠商發(fā)展具身智能,只有擴(kuò)展下游市場(chǎng),才能將行業(yè)從盲目?jī)r(jià)格內(nèi)卷的困境中解放出來(lái),贏得更大的發(fā)展空間??梢哉f(shuō),智能生產(chǎn)、柔性生產(chǎn)的浪潮已經(jīng)勢(shì)不可擋。”
Q:具身智能的終極形態(tài)將會(huì)是怎樣的?
硬件上為移動(dòng)機(jī)構(gòu)和執(zhí)行器深度結(jié)合,軟件上采用端到端架構(gòu)
早在2021年,配天機(jī)器人就瞄準(zhǔn)了具身智能這個(gè)方向。彼時(shí),具身智能還是一個(gè)不為人知的概念,直到大模型概念開(kāi)始火爆,機(jī)器人行為大模型逐漸被業(yè)界熟知,配天的戰(zhàn)略藍(lán)圖才逐步顯現(xiàn)在公眾視野中。郭濤認(rèn)為,目前的具身智能,數(shù)據(jù)還沒(méi)有到大模型的量級(jí),但幾億參數(shù)是可以做到的,并且?guī)變|參數(shù)也可以找到商業(yè)落地的突破口。
關(guān)于具身智能的終極形態(tài),郭濤從硬件和軟件兩個(gè)層面分享了他的見(jiàn)解:
“在具身智能的發(fā)展的初級(jí)階段,無(wú)論是協(xié)作機(jī)器人、掃地機(jī)器人還是自動(dòng)駕駛,胳膊和腿是分家的,它們的特點(diǎn)是任務(wù)環(huán)境單一且盡量不和物理世界發(fā)生交互?,F(xiàn)在已經(jīng)出現(xiàn)了大量機(jī)械臂與移動(dòng)平臺(tái)結(jié)合的產(chǎn)品,但商業(yè)價(jià)值存疑,因?yàn)檫@類產(chǎn)品的機(jī)械臂能執(zhí)行的任務(wù)非常有限。
具身智能的高級(jí)形態(tài)將會(huì)是機(jī)械臂和移動(dòng)平臺(tái)的深度結(jié)合,也就是移動(dòng)能力和操作能力的深度融合。到那時(shí),具身智能就會(huì)面對(duì)不斷變化的環(huán)境和暴漲的任務(wù)量,這也是具身智能開(kāi)始顯現(xiàn)商業(yè)價(jià)值的階段。
目前具身智能的架構(gòu)主要有兩種,一種為分層架構(gòu),一種為端到端架構(gòu)。短期來(lái)看,商業(yè)落地的主力還將是分層架構(gòu)。因?yàn)槟壳?,端到端架?gòu)模式需要的算力還無(wú)法被滿足,但是長(zhǎng)期來(lái)看,端到端架構(gòu)更智能、更泛化、更有想象空間,可能是具身智能的終極形態(tài)?!?/p>
Q:多領(lǐng)域玩家入場(chǎng),具身智能未來(lái)的產(chǎn)業(yè)鏈結(jié)構(gòu)將是怎樣的?
格局未定,全生態(tài)共同分享萬(wàn)億蛋糕
“從產(chǎn)業(yè)鏈角度來(lái)講,本體廠商具備硬件基礎(chǔ)、物理運(yùn)動(dòng)控制技術(shù)優(yōu)勢(shì),正躍躍欲試準(zhǔn)備下場(chǎng);網(wǎng)絡(luò)通信廠商有算力優(yōu)勢(shì),必然也會(huì)占領(lǐng)一席之地;本身做AI算法的學(xué)術(shù)機(jī)構(gòu)也會(huì)分一杯羹。整個(gè)生態(tài)將會(huì)由多個(gè)領(lǐng)域的廠家共同打造,大家共同分享這塊價(jià)值萬(wàn)億的大蛋糕。
配天等本體廠商目前的優(yōu)勢(shì)主要體現(xiàn)在物理結(jié)構(gòu)上。具身智能產(chǎn)品對(duì)硬件性能要求比較高,作為國(guó)內(nèi)資深的本體廠商,配天對(duì)機(jī)器人的重量、爆發(fā)力、靈敏度、功耗等性能有極強(qiáng)的把控能力。當(dāng)然,算力、末端執(zhí)行器、傳感器、感知決策都是未來(lái)熱門的研究方向?!?/p>
Q:具身智能商業(yè)落地的切入點(diǎn)將會(huì)是在哪里?
小模型+機(jī)械臂,工業(yè)場(chǎng)景或?qū)⒊蔀榫呱碇悄苌虡I(yè)落地的最佳切入點(diǎn)
“目前,具身智能商業(yè)落地有一些制約因素,包括數(shù)據(jù)量不夠、物理交互任務(wù)成功率不高等。大家對(duì)具身智能應(yīng)用的想象大多在家用方面,但是家用場(chǎng)景是最需要機(jī)器人具備泛化能力的場(chǎng)景?!惫鶟J(rèn)為,具身智能的最先突破點(diǎn)還是在先進(jìn)工業(yè)。在工業(yè)場(chǎng)景,具身智能只需要把一項(xiàng)任務(wù)做深做透,就能實(shí)現(xiàn)商業(yè)閉環(huán)。工業(yè)場(chǎng)景甚至不需要人形機(jī)器人,很多人形機(jī)器人瞄準(zhǔn)的場(chǎng)景,如貼標(biāo)、測(cè)試等,只用機(jī)械臂就能輕松搞定;另外,人形機(jī)器人的硬件可靠性沒(méi)有達(dá)到商業(yè)化落地的狀態(tài)。
郭濤認(rèn)為,在工業(yè)領(lǐng)域,具身智能的發(fā)展可以從機(jī)械臂+小模型這條路徑出發(fā),先解決一些具體應(yīng)用場(chǎng)景的痛點(diǎn)難點(diǎn),逐步去打通制造業(yè)全場(chǎng)景。
比如目前配天錨定的免示教焊接領(lǐng)域,與3C行業(yè)、汽車零部件行業(yè)大批量復(fù)制的生產(chǎn)模式不同,船舶制造、軌道交通、建筑鋼構(gòu)、航空航天等行業(yè)的焊接生產(chǎn)模式為多品種生產(chǎn)以及單品定制生產(chǎn)。在這種生產(chǎn)模式下,應(yīng)用工業(yè)機(jī)器人的性價(jià)比極低。因?yàn)闄C(jī)器人示教程序重復(fù)利用率低,繁瑣復(fù)雜的編程示教過(guò)程必然造成效率低下,而過(guò)于依賴人工又造成運(yùn)營(yíng)成本高企。應(yīng)用具身智能,實(shí)現(xiàn)免示教焊接,能極大地釋放以上行業(yè)的生產(chǎn)力。
由此延伸,具身智能技術(shù)可以打破場(chǎng)景對(duì)自動(dòng)化的限制,自動(dòng)化將延伸至工業(yè)生產(chǎn)的方方面面,工業(yè)機(jī)器人的市場(chǎng)體量會(huì)指數(shù)級(jí)增長(zhǎng)。
對(duì)于人形機(jī)器人,郭濤認(rèn)為輕量臂結(jié)合移動(dòng)平臺(tái),打造能泛化的人形機(jī)器人,才能實(shí)現(xiàn)商業(yè)化落地。目前,配天既有免示教焊接機(jī)器人,又有輕量臂產(chǎn)品,二者都是基于繹零機(jī)器人運(yùn)動(dòng)控制引擎研發(fā)的。在郭濤看來(lái),二者雖然工藝不同,但核心技術(shù)是相同的。
Q:現(xiàn)階段具身智能的發(fā)展面臨著哪些技術(shù)難點(diǎn)?如何破局?
虛擬仿真技術(shù),或?qū)⒊蔀槠平庵圃鞓I(yè)大模型數(shù)據(jù)集難題的可行之路?
郭濤認(rèn)為,具身智能發(fā)展的重點(diǎn)難點(diǎn)還是在于算力、數(shù)據(jù)和模型結(jié)構(gòu)。這個(gè)階段,產(chǎn)業(yè)格局尚不清晰,還需要整個(gè)生態(tài)的合作伙伴通力協(xié)作,共同推進(jìn)產(chǎn)業(yè)的發(fā)展。
配天目前正著眼于數(shù)據(jù)集這項(xiàng)挑戰(zhàn)。不同于C端大模型應(yīng)用,千億甚至萬(wàn)億的數(shù)據(jù)來(lái)源于網(wǎng)絡(luò)用戶,企業(yè)數(shù)據(jù)只能達(dá)到百萬(wàn)級(jí)、千萬(wàn)級(jí)。應(yīng)用虛擬仿真技術(shù),擴(kuò)展虛擬空間中的數(shù)據(jù)量,或?qū)⒊蔀橐粭l能走通的路,這也是配天打造仿真云平臺(tái)的初衷。通過(guò)配天云平臺(tái),使用者可在線完成機(jī)器人的編程、訓(xùn)練,一方面大幅簡(jiǎn)化了工作流程,另一方面顯著降低了在實(shí)際應(yīng)用中的調(diào)試成本。
在時(shí)代和技術(shù)的變革面前,不轉(zhuǎn)型就是死局。危機(jī)即是轉(zhuǎn)機(jī),具身智能已經(jīng)在站在了人工智能應(yīng)用的舞臺(tái)中央,給各行各業(yè)擘畫出了一個(gè)看得見(jiàn)的未來(lái)。群雄逐鹿時(shí),有機(jī)器人廠商躬身研究AI技術(shù),也有AI企業(yè)布局機(jī)器人產(chǎn)業(yè),大家雖然路徑不同,但都有一個(gè)最終的指向目標(biāo),那就是摸索到具身智能商業(yè)落地的那扇門。在門后的新世界中,無(wú)數(shù)行業(yè)會(huì)因?yàn)樯a(chǎn)力的解放,煥發(fā)出巨大的生機(jī)和活力。打開(kāi)這扇門,釋放具身智能的價(jià)值,配天機(jī)器人愿與各位同道者共同努力。
-bibo必博官網(wǎng)