什么?小米發(fā)布了全尺寸仿生人形機(jī)器人?
就在雷軍在個(gè)人年度演講快結(jié)束時(shí),順手扔出了這個(gè)王炸——全尺寸仿生人形機(jī)器人CyberOne。
(相關(guān)資料圖)
并且這次不是PPT,也不是請(qǐng)人穿著道具上去跳舞,而是直接拿出原型機(jī),現(xiàn)場(chǎng)和雷軍互動(dòng)了一番。
近些年,機(jī)器人儼然成為眾多科技公司展現(xiàn)自己綜合研發(fā)實(shí)力最好的產(chǎn)品。
從早年的波士頓動(dòng)力、軟銀Pepper,到去年馬斯克的一手「快閃」,每次發(fā)布都引來(lái)無(wú)數(shù)關(guān)注——
小米這臺(tái)CyberOne與其他家有什么區(qū)別?這個(gè)雷總的新寵到底有多少技術(shù)含金量?
老規(guī)矩,更多軟硬件細(xì)節(jié)及幕后信息,一并為大家揭秘。
小米人形機(jī)器人,究竟是個(gè)啥?
縱觀當(dāng)下叫得上號(hào)的“網(wǎng)紅”人形機(jī)器人,我們不難發(fā)現(xiàn),各家公司對(duì)于人形機(jī)器人的描摹有很大差異。
按產(chǎn)品定位大致可以分為三個(gè)方向。
超越人,以大名鼎鼎的波士頓動(dòng)力為代表,旨在追求極致機(jī)能以達(dá)到擁有超越人類(lèi)的運(yùn)動(dòng)能力。
這個(gè)方向也吸引了國(guó)內(nèi)外眾多科研單位參與??梢哉f(shuō)波士頓動(dòng)力在姿態(tài)控制、動(dòng)作預(yù)判算法、動(dòng)力輸出等領(lǐng)域走在了全球人形機(jī)器人領(lǐng)域的前列。
替代人,以去年宣布打造人形機(jī)器人的特斯拉為代表。
馬斯克是個(gè)明白人,特斯拉出貨量穩(wěn)步提高,光超級(jí)工廠就規(guī)劃了不下10個(gè),如果能打造一個(gè)人形機(jī)器人來(lái)代替工廠中重復(fù)勞動(dòng)的員工,只要綜合成本低過(guò)員工工資,就是筆好生意。所以馬老板也絲毫不掩飾他想通過(guò)人形機(jī)器人替代人的想法。
服務(wù)人,這是小米CyberOne選擇的方向。
具體來(lái)說(shuō),是依托人形更好的研究人感知、認(rèn)知、決策、執(zhí)行過(guò)程從而更好服務(wù)于人。
這一定位方向,在產(chǎn)品細(xì)節(jié)上如何體現(xiàn)?我們一項(xiàng)一項(xiàng)看。
如果給CyberOne來(lái)個(gè)外科體檢,高177cm,是一個(gè)標(biāo)準(zhǔn)的成年人身高。
體重則僅為52kg,別看現(xiàn)在身板有點(diǎn)單薄,其實(shí)也是為了后續(xù)進(jìn)一步演進(jìn)做重量冗余。
再查五官科,CyberOne的臉蛋沒(méi)走擬真的精致五官路線。
頭部前面是個(gè)面罩,外層半透明材質(zhì),內(nèi)層為OLED與柔光特效,再加上2D彎曲貼合顯示模組實(shí)時(shí)表達(dá)機(jī)器人情緒。
下一項(xiàng)該考察機(jī)器人的運(yùn)動(dòng)能力。
這其中,關(guān)節(jié)是核心,業(yè)內(nèi)皆知,這塊相關(guān)組件一般占人形機(jī)器人成本三分之一以上。
以CyberOne上肢關(guān)節(jié)電機(jī)為例,小米自研了一枚重量?jī)H為500g,額定輸出扭矩高達(dá)30N·m的高效電機(jī),保證上肢靈活性。
CyberOne髖關(guān)節(jié)主要電機(jī)瞬時(shí)峰值扭矩可達(dá)300N·m,配合自研的人形雙足控制算法,行走姿態(tài)更加平穩(wěn)。
再有就是「手」了,CyberOne單手垂直抓握物體重量為1.5kg。
總體來(lái)看,極致運(yùn)動(dòng)能力非CyberOne的目標(biāo)。
CyberOne更多的采用了以高性能、小型化電機(jī)為主的干系統(tǒng)作為運(yùn)動(dòng)能力支撐,并沒(méi)有過(guò)多的使用機(jī)械性能當(dāng)下更強(qiáng)大的液壓濕系統(tǒng)。
這種選擇上的傾向還是較為激進(jìn)的,迎合了新能源時(shí)代下例如智能汽車(chē)從濕系統(tǒng)逐步替換成干系統(tǒng)的大趨勢(shì)。
傳感器方面,CyberOne對(duì)外界信息獲取來(lái)自聽(tīng)覺(jué)和視覺(jué)。
深度相機(jī)配合AI相機(jī)幫助機(jī)器人收入真實(shí)場(chǎng)景和物體,通過(guò)CV算法獲得物體三維模型實(shí)現(xiàn)避障,自帶小米傳統(tǒng)藝能「萬(wàn)物追焦」技術(shù),讓CyberOne能夠集中注意力看關(guān)鍵物體。
聽(tīng)覺(jué)傳感器配合音頻算法可識(shí)別6類(lèi)45種人類(lèi)情緒語(yǔ)音,外加85種環(huán)境音識(shí)別。
你大概好奇環(huán)境音識(shí)別有什么用?小米工程師舉了一個(gè)有趣的例子——
離家前忘關(guān)水龍頭?它就能識(shí)別滋滋水流聲并提醒你。
據(jù)了解,CyberOne還實(shí)現(xiàn)了「拖動(dòng)示教學(xué)習(xí)」這項(xiàng)特別的功能。
所謂拖動(dòng)示教學(xué)習(xí),就像是父母手把手教你第一次學(xué)會(huì)用上了筷子。
這動(dòng)作對(duì)人來(lái)說(shuō)簡(jiǎn)單,但對(duì)機(jī)器就難度很大了。不僅要求硬件機(jī)械臂是「活」的,可被移動(dòng),反驅(qū)的形式對(duì)關(guān)鍵部位電機(jī)性能要求更高,也是小米團(tuán)隊(duì)最初要求的關(guān)鍵指標(biāo)。
除此之外,機(jī)器人還要通過(guò)傳感器和軟件層能夠記憶學(xué)習(xí)動(dòng)作,重復(fù)執(zhí)行,工程師們希望通過(guò)該功能實(shí)現(xiàn),讓機(jī)器人模擬人的學(xué)習(xí)過(guò)程。
看到這,大致能得出些不吹不黑的結(jié)論——
小米新發(fā)布這個(gè)人形機(jī)器人的確挺像樣,不僅外觀,其各方面組件的確滿足人形機(jī)器人要求。
無(wú)論行動(dòng)速度,還是抓握力,再到突出的交互能力和AI算法對(duì)環(huán)境語(yǔ)義的識(shí)別判斷,能看出這臺(tái)CyberOne更面向/服務(wù)于人本身。
不管怎么說(shuō),小米居然不聲不響,閃亮登場(chǎng)一個(gè)全尺寸人形仿生機(jī)器人,還是出乎了所有人意料。
人形機(jī)器人,有多難?
人形是解決綜合問(wèn)題最高效的形態(tài)之一,是機(jī)器人領(lǐng)域公認(rèn)的終極方向,同時(shí)也是技術(shù)難度最大、需要投入最多的。
毫不夸張的說(shuō),全尺寸人形仿生機(jī)器人是“機(jī)器人皇冠上的明珠”。
原因也不難理解。
身體結(jié)構(gòu)上,人類(lèi)雙足直立行走、雙手操作工具都是歷經(jīng)上百萬(wàn)年進(jìn)化而來(lái),靠的可是自然選擇的力量。
想用完全不同于生物的一套材料、靠人為設(shè)計(jì)去模仿逼近,工程難度可見(jiàn)一斑。
行為和決策上,人形機(jī)器人要做到和人一樣、解決復(fù)雜問(wèn)題問(wèn)題,這就就需要做到對(duì)環(huán)境的全面理解,需要多模態(tài)結(jié)合的推理和交互,除了視覺(jué)、聽(tīng)覺(jué),還要考慮更不成熟的嗅覺(jué)、觸覺(jué)等。
最后還有點(diǎn)現(xiàn)實(shí)原因,人形機(jī)器人行業(yè)還沒(méi)有機(jī)器狗那么成熟,不要說(shuō)開(kāi)源方案了,連論文都沒(méi)有幾篇可以參考。
小米人形機(jī)器人項(xiàng)目的負(fù)責(zé)人向迪昀表示,這次難度和去年的機(jī)器狗鐵蛋不在一個(gè)level上。
看上去理論似乎很健全,但怎么做、技術(shù)如何演進(jìn),誰(shuí)也沒(méi)有正確答案。
縱觀目前市面上成熟的項(xiàng)目,從產(chǎn)品迭代路線來(lái)看大概能分4步:先做下半身站立,到下半身行走,組裝上半身,最后是全身的動(dòng)作協(xié)同。
小米則通過(guò)在智能制造和之前CyberDog機(jī)器狗項(xiàng)目上的技術(shù)積累,最終決定下半身和上半身并行推進(jìn),項(xiàng)目進(jìn)展較快。
機(jī)械方面對(duì)應(yīng)人類(lèi)行為的執(zhí)行部分,一般由小腦控制。但如果只做到擬人運(yùn)動(dòng)能力,充其量可以稱(chēng)之為機(jī)器。
只有擁有了感知-認(rèn)知-執(zhí)行的大腦能力,才真的稱(chēng)得上機(jī)器人。而大腦能力也是仿生人形機(jī)器人的技術(shù)制高點(diǎn)。
從已公開(kāi)的信息來(lái)看,CyberOne首先擁有空間感知、認(rèn)知能力。
CyberOne搭載自研Mi-Sense深度視覺(jué)模組,結(jié)合AI交互算法,使其不僅擁有完整的三維空間感知能力,更能夠?qū)崿F(xiàn)人物身份識(shí)別、手勢(shì)識(shí)別、表情識(shí)別,CyberOne真正做到了不僅看得到也能看得懂。
但相比于機(jī)器狗,人的世界中信息量級(jí)堪稱(chēng)爆炸。就以簡(jiǎn)單的路徑規(guī)劃為例,目前最全面、技術(shù)難度最高的路徑規(guī)劃為自動(dòng)駕駛路徑規(guī)劃。
智能汽車(chē)路徑規(guī)劃除了解決機(jī)器人從A點(diǎn)到B點(diǎn)外,還需要在過(guò)程中針對(duì)各種情況進(jìn)行語(yǔ)義標(biāo)定,例如停止的障礙車(chē)輛、地上的行車(chē)線、運(yùn)動(dòng)中的行人等等,從而對(duì)其作出預(yù)判,保證安全舒適行車(chē)。
雖然CyberOne得到了來(lái)自小米自動(dòng)駕駛團(tuán)隊(duì)的技術(shù)幫助,但自動(dòng)駕駛?cè)匀皇窃诘缆方煌ㄓ邢迗?chǎng)景下的路徑規(guī)劃技術(shù),而人形機(jī)器人則是全場(chǎng)景的路徑規(guī)劃,面對(duì)的情況更加豐富,需要對(duì)環(huán)境語(yǔ)義的標(biāo)定更加復(fù)雜。
CyberOne同樣擁有情緒的感知和認(rèn)知能力,這部分能力則是師承小米內(nèi)部小愛(ài)同學(xué)團(tuán)隊(duì)。
小米人形機(jī)器人項(xiàng)目的負(fù)責(zé)人向迪昀表示,小愛(ài)同學(xué)面向大眾展現(xiàn)的能力只是冰山一角,其實(shí)小愛(ài)團(tuán)隊(duì)很早就開(kāi)始搭建情緒訓(xùn)練模型和環(huán)境語(yǔ)音語(yǔ)義模型,這方面技術(shù)對(duì)軟硬件平臺(tái)要求較高,尚未開(kāi)放給大眾用戶,而讓CyberOne搶了“首發(fā)”。
解決了諸如上述的各類(lèi)問(wèn)題后,CyberOne有了基本的感知、決策、運(yùn)動(dòng)和交互能力,可以算是大小腦平衡發(fā)展了,所以這次發(fā)布會(huì)上雷總把他帶上臺(tái)進(jìn)行了演示。
CyberOne和所有的人形仿生機(jī)器人一樣,都是處在持續(xù)演進(jìn)過(guò)程中。
接下來(lái)一段時(shí)間,CyberOne還需要改進(jìn)的地方有很多,硬件上比如完善手指靈活性、學(xué)著像人一樣使用工具,軟件的架構(gòu)也需要整合,從分布式迭代固化為集成式,智能算法更是需要持續(xù)迭代改進(jìn)等。
不過(guò)擺在機(jī)器人行業(yè)面前的問(wèn)題,從來(lái)就不局限于技術(shù)本身。
人形機(jī)器人投入成本高、回報(bào)周期長(zhǎng),商業(yè)化進(jìn)展上這幾年也經(jīng)歷了一番波折。
波士頓動(dòng)力公司7年內(nèi)被3次轉(zhuǎn)手,產(chǎn)品上機(jī)器狗Spot公布的銷(xiāo)量只有數(shù)百臺(tái),人形機(jī)器人Atlas就要更少。
軟銀的人形機(jī)器人Pepper則在去年被曝出直接停產(chǎn)。
總之,邁過(guò)技術(shù)驗(yàn)證階段之后,小米想要把機(jī)器人打造成一款產(chǎn)品推向市場(chǎng)還有很長(zhǎng)的路要走。
既然如此之難,小米為何要做?
在外界看來(lái),小米新技術(shù)研發(fā)更值得投入精力的地方,似乎應(yīng)該是造車(chē)。
分出人力物力來(lái)搞這么難的人形機(jī)器人,是出于什么考慮?
對(duì)于這個(gè)問(wèn)題,小米給出的答案是CyberOne并不是規(guī)劃而來(lái)的。
他更像是人,是小米“科技生態(tài)”自然進(jìn)化而來(lái)的產(chǎn)物,也是小米科技生態(tài)的代言人,可分為兩個(gè)方面來(lái)看。
第一是技術(shù)方面。
小米自成立以來(lái),從智能手機(jī)出發(fā),到可穿戴設(shè)備、智能家居,再到智能制造、智能電動(dòng)汽車(chē)以及仿生機(jī)器人,貫穿其中的是一套不斷融合進(jìn)化的技術(shù)體系。
融合進(jìn)化,說(shuō)的是看似已成熟的技術(shù)用在新的領(lǐng)域就會(huì)暴露出新的問(wèn)題,然后才有機(jī)會(huì)做出改進(jìn)。
舉例來(lái)說(shuō),機(jī)器人自身可以移動(dòng),對(duì)視覺(jué)、語(yǔ)音算法的要求就和手機(jī)完全不同。這也印證了AI學(xué)術(shù)界最近呼聲很高的”具身智能”——給AI一個(gè)身體,它理解這個(gè)世界的方式才能更貼近人類(lèi)。
進(jìn)一步來(lái)說(shuō),通過(guò)融合創(chuàng)新和改進(jìn)的技術(shù)還可以在科技生態(tài)內(nèi)的各個(gè)場(chǎng)景相互遷移。
如最初用在機(jī)器狗上的萬(wàn)物追焦算法也能用于手機(jī);小米自動(dòng)駕駛進(jìn)展非???,得益于2017年創(chuàng)辦的小米人工智能實(shí)驗(yàn)室;未來(lái)人形機(jī)器人上驗(yàn)證成熟的技術(shù)也有機(jī)會(huì)支援造車(chē)。
正如小米機(jī)器狗項(xiàng)目發(fā)起人去年說(shuō)過(guò)的,”手機(jī)就是沒(méi)有腿的機(jī)器人,機(jī)器狗有腿但不需要顯示屏,汽車(chē)則是四輪機(jī)器人”。
第二個(gè)是場(chǎng)景方面。
如果簡(jiǎn)單粗暴的將人的行為分為四個(gè)狀態(tài):居家生活、工作辦公、交通出行、睡眠休息。那么一個(gè)好的商業(yè)模型應(yīng)該盡可能多的覆蓋人的四個(gè)狀態(tài),并且越了解四個(gè)狀態(tài)中用戶不同的需求,從而提供更好的服務(wù),那么這個(gè)商業(yè)模型的價(jià)值就越高。
小米目前提供的服務(wù)恰好對(duì)這四種狀態(tài)全覆蓋,前面也提到,人形機(jī)器人目前有三種發(fā)展方向。
一種是「超越人」,以波士頓動(dòng)力為代表,專(zhuān)注提升機(jī)器人的運(yùn)動(dòng)性能。
一種是「替代人」,以特斯拉為代表,要讓機(jī)器人進(jìn)入造車(chē)工廠補(bǔ)充勞動(dòng)力。
小米選擇的是第三種「服務(wù)人」,要圍繞人的生活和工作,更好為人服務(wù),緊密連接人和萬(wàn)物。
從這個(gè)角度看,小米的科技生態(tài)在理解人方面有著得天獨(dú)厚的優(yōu)勢(shì)。
原研哉在為小米設(shè)計(jì)全新LOGO的時(shí)候,就提到全新的小米LOGO能夠體現(xiàn)小米的品牌精神:科技就越是進(jìn)化,就越接近生命的形態(tài)。如此看來(lái),小米能夠率先推出仿生機(jī)器人也是順理成章。
△小米集團(tuán)技術(shù)能力示意圖
關(guān)于機(jī)器人如此之難,為何還要做,國(guó)家也給出了相關(guān)答案。
在工信部等十五部門(mén)聯(lián)合印發(fā)《“十四五”機(jī)器人產(chǎn)業(yè)發(fā)展規(guī)劃》中提到:
面向制造業(yè)、采礦業(yè)、建筑業(yè)、農(nóng)業(yè)等行業(yè),以及家庭服務(wù)、公共服務(wù)、醫(yī)療健康、養(yǎng)老助殘、特殊環(huán)境作業(yè)等領(lǐng)域需求,集聚優(yōu)勢(shì)資源,重點(diǎn)推進(jìn)工業(yè)機(jī)器人、服務(wù)機(jī)器人、特種機(jī)器人重點(diǎn)產(chǎn)品的研制及應(yīng)用,拓展機(jī)器人產(chǎn)品系列,提升性能、質(zhì)量和安全性,推動(dòng)產(chǎn)品高端化智能化發(fā)展。
……
看了這么多,最后不妨一起來(lái)聊聊,你覺(jué)得人形機(jī)器人離廣泛來(lái)到人們身邊還有多遠(yuǎn)?
超越人、代替人、服務(wù)人這三種路線,你又更期待哪個(gè)?
關(guān)鍵詞: 小米造人比特斯拉還快首款全尺寸
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書(shū)面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com