給機(jī)器人裝上“大腦”!騰訊高管詳解具身智能軟件戰(zhàn)略邏輯
在具身智能賽道半年吸金近200億元、硬件本體陷入“內(nèi)卷”的當(dāng)下,騰訊選擇了一條差異化路徑。
在近日舉行的騰訊全球數(shù)字生態(tài)大會(huì)無(wú)錫峰會(huì)上,騰訊云高管詳解其在具身智能領(lǐng)域的戰(zhàn)略思考:不造機(jī)器人本體,而是通過(guò)軟硬件解耦模式,提供從模型、開發(fā)工具到底層算力的全棧解決方案,意圖做機(jī)器人的“大腦”,加快具身智能產(chǎn)業(yè)落地。
打造具身智能的“大腦”
今年春節(jié),宇樹科技的人形機(jī)器人登上春晚,引發(fā)全民關(guān)注。隨后接踵而來(lái)的人工智能大會(huì)、世界機(jī)器人大會(huì)、世界人形機(jī)器人運(yùn)動(dòng)會(huì)等熱點(diǎn)事件,讓具身智能投融資領(lǐng)域迎來(lái)新的熱潮,國(guó)內(nèi)具身智能企業(yè)紛紛開啟新一輪融資,大筆熱錢涌入。近期,智元和宇樹兩家估值上的頭部具身智能公司進(jìn)軍二級(jí)市場(chǎng),更將具身智能投融資熱潮拉至新高。
騰訊是國(guó)內(nèi)最早布局機(jī)器人產(chǎn)業(yè)的互聯(lián)網(wǎng)企業(yè)之一,早在2018年騰訊就成立了Robotics X實(shí)驗(yàn)室,在過(guò)去七年不斷推出機(jī)器人原型產(chǎn)品。
“具身智能的落地是一個(gè)極其復(fù)雜、環(huán)環(huán)相扣的系統(tǒng)工程。從需要巨大投入的基礎(chǔ)模型,到成本高昂的場(chǎng)景數(shù)據(jù)采集,再到流程化工具的訓(xùn)練仿真,以及令人頭大的真機(jī)部署和升級(jí),每一個(gè)環(huán)節(jié)都很考驗(yàn)技術(shù)能力?!?騰訊集團(tuán)副總裁、政企業(yè)務(wù)總裁李強(qiáng)表示。
李強(qiáng)稱,大量企業(yè)能將硬件本體打磨得非常出色,但在軟件和智能上的投入?yún)s不足,這需要長(zhǎng)期、巨大的成本投入。
這種“軟硬失衡”現(xiàn)象,成為騰訊切入具身智能的空間。騰訊云副總裁王前分析,過(guò)去機(jī)械臂或移動(dòng)機(jī)器人主要解決的是“小腦”問(wèn)題,而真正的具身智能需要“大腦”來(lái)解決感知與決策問(wèn)題。
為此,騰訊Robotics X實(shí)驗(yàn)室聯(lián)合福田實(shí)驗(yàn)室發(fā)布了具身智能開放平臺(tái)Tairos。李強(qiáng)介紹,這是國(guó)內(nèi)首個(gè)以模塊化方式提供多模態(tài)感知、規(guī)劃及行動(dòng)模型的軟件平臺(tái),通過(guò)SDK和API,面向行業(yè)開放,相當(dāng)于為機(jī)器人裝上“大腦”。
Tairos提供規(guī)劃大模型、多模態(tài)感知模型、感知行動(dòng)聯(lián)合大模型三種模型,分別類似于人的左腦、右腦和小腦,可以幫助機(jī)器人將任務(wù)拆解成一個(gè)個(gè)可執(zhí)行的策略步驟,讓機(jī)器人通過(guò)“視覺”和“觸覺”等感官認(rèn)識(shí)周遭世界,根據(jù)感知到的環(huán)境做出安全精準(zhǔn)的行動(dòng)指令。
李強(qiáng)指出,當(dāng)前最熱門的VLA大模型打破了具身智能單任務(wù)局限,但其訓(xùn)練數(shù)據(jù)融合視覺、力控、觸覺、關(guān)節(jié)傳感、語(yǔ)言指令等多維度信息,單條交互軌跡的數(shù)據(jù)量就可高達(dá)數(shù)百兆,“數(shù)據(jù)訓(xùn)練與存儲(chǔ)的能力強(qiáng)弱,直接決定了具身智能企業(yè)的模型迭代效率、產(chǎn)品落地速度與規(guī)模化競(jìng)爭(zhēng)力。”
落地仍臨挑戰(zhàn)
在無(wú)錫峰會(huì)上,騰訊云披露與具身智能初創(chuàng)企業(yè)靈初智能的合作案例。
針對(duì)靈初智能在VLA模型訓(xùn)練中的痛點(diǎn),騰訊云提供了包含HCC高性能計(jì)算集群、Turbo CFS高性能文件存儲(chǔ)等一站式方案。數(shù)據(jù)顯示,該方案將靈初智能的VLA模型訓(xùn)練效率提升了50%以上,并借助冷熱數(shù)據(jù)分層技術(shù),將其存儲(chǔ)成本降低了70%。
靈初智能COO孟福剛告訴記者,數(shù)據(jù)稀缺是行業(yè)普遍面臨的挑戰(zhàn),目前來(lái)看,大語(yǔ)言模型所依賴的互聯(lián)網(wǎng)數(shù)據(jù)已經(jīng)用盡,但具身智能需要更高階的“真機(jī)數(shù)據(jù)”和“人類數(shù)據(jù)”。他透露,國(guó)外真機(jī)遙操作的數(shù)據(jù)采集成本高達(dá)每小時(shí)150美元,成本極高。他預(yù)計(jì),行業(yè)要實(shí)現(xiàn)突破,可能需要積累達(dá)到200萬(wàn)小時(shí)的人類數(shù)據(jù)。
為了解決數(shù)據(jù)和算力難題,靈初智能選擇與騰訊云合作。孟福剛表示,在公司第三代模型解決長(zhǎng)程任務(wù)思考的過(guò)程中,騰訊云提供了極大算力支持。同時(shí),靈初智能還使用了Tairos平臺(tái),利用其開源開放的特性進(jìn)行跨業(yè)務(wù)平臺(tái)的數(shù)據(jù)采集和模型訓(xùn)練,提升了團(tuán)隊(duì)協(xié)作效率。
除了算力與數(shù)據(jù),具身智能從實(shí)驗(yàn)室走向真實(shí)物理世界,還面臨著嚴(yán)苛的IT工程化挑戰(zhàn)。
“人眨眼一次通常是200到400毫秒,而工業(yè)場(chǎng)景要求更快的響應(yīng)?!崩顝?qiáng)以與越疆機(jī)器人的合作為例,憑借騰訊積累的實(shí)時(shí)音視頻技術(shù),雙方將機(jī)器人的端到端時(shí)延壓縮到了100毫秒以內(nèi),大幅提升了操作流暢性。
騰訊云東區(qū)解決方案總監(jiān)余量則指出另一個(gè)行業(yè)痛點(diǎn):許多具身智能企業(yè)關(guān)注深度學(xué)習(xí)算法,但在IT工程優(yōu)化上存在短板?!翱蛻籼岬紾PU效率不高,底層硬件出問(wèn)題,我們調(diào)研發(fā)現(xiàn)解決后,效率提升了30%-50%?!庇嗔勘硎?,這種對(duì)IT工程優(yōu)化的彌補(bǔ),是云廠商在提供算力外的重要價(jià)值。
免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),與本網(wǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
最新內(nèi)容
- 光大理財(cái)李永鋒:共建新時(shí)代“財(cái)富水利工程”
- 廣東發(fā)布金融支持產(chǎn)業(yè)鏈整合兼并方案探索將并
- 開山股份子公司擬設(shè)合資公司推進(jìn)匈牙利地?zé)犴?xiàng)
- 不是迭代,是AI重構(gòu)!中國(guó)房地產(chǎn)決策系統(tǒng)C
- 11月27日“農(nóng)產(chǎn)品批發(fā)價(jià)格200指數(shù)”比
- 再造“云頂天宮”,吉林冰雪還有哪些隱藏玩法
- 博盈特焊301468.SZ:客戶群體涵蓋北
- 工信部:用約五年時(shí)間推動(dòng)消費(fèi)品供需在更高水
- 拓璞數(shù)控沖刺港股IPO
- 工行甘州支行構(gòu)建養(yǎng)老金融新生態(tài)




