對(duì)話 CTO | 聽(tīng)優(yōu)必選科技 CTO 熊友軍講第三代人機(jī)交互中心的人形機(jī)器人時(shí)代

「機(jī)器人將成為第三代人機(jī)交互中心,而人形機(jī)器人所具備的多模態(tài)交互是最好的人機(jī)交互模式。」優(yōu)必選科技 CTO 熊友軍對(duì)此深信不疑。
機(jī)器人有各種各樣的形態(tài),包括輪式的、履帶式的、球形的,作為國(guó)內(nèi)人工智能和人形機(jī)器人領(lǐng)域的獨(dú)角獸公司,優(yōu)必選科技一直堅(jiān)持做「人形」機(jī)器人。在熊友軍看來(lái),機(jī)器人同時(shí)兼?zhèn)錂C(jī)器和人的屬性,不僅從技術(shù)實(shí)現(xiàn)上來(lái)講相對(duì)容易,人形機(jī)器人的動(dòng)作、表情、行為可以由人類映射,而且人形機(jī)器人能更好地適應(yīng)人類社會(huì)環(huán)境,并被人類所接受。他認(rèn)為,機(jī)器人最終會(huì)走進(jìn)千家萬(wàn)戶,成為人類生活的一部分。
而在人形機(jī)器人走進(jìn)千家萬(wàn)戶之前,優(yōu)必選科技的發(fā)展邏輯是「兩條腿走路」。一方面是堅(jiān)持商業(yè)化,將核心技術(shù)輸出給能為商業(yè)市場(chǎng)帶來(lái)價(jià)值的產(chǎn)品,比如人工智能教育類機(jī)器人、娛樂(lè) IP 機(jī)器人、商用服務(wù)機(jī)器人等等。另一方面是放眼未來(lái),進(jìn)行技術(shù)布局,將市場(chǎng)利潤(rùn)更多地投入到前沿技術(shù)研發(fā)當(dāng)中。
瞄準(zhǔn)服務(wù)機(jī)器人,優(yōu)必選科技的重要戰(zhàn)略
穎奇:非常感謝優(yōu)必選科技 CTO 熊友軍接受我們的采訪。首先能否請(qǐng)您介紹一下優(yōu)必選科技的業(yè)務(wù)情況以及技術(shù)上的先進(jìn)性。
熊友軍:優(yōu)必選科技是一家人工智能和人形機(jī)器人公司,我們一直秉承的理念就是機(jī)器人將會(huì)進(jìn)入千家萬(wàn)戶,成為我們生活的一部分。我們最初研發(fā)機(jī)器人核心的元器件,在伺服舵機(jī)上面花了很長(zhǎng)時(shí)間。我們認(rèn)為目前機(jī)器人還是處于比較早期的階段,伺服舵機(jī)是這個(gè)領(lǐng)域技術(shù)含量最高、硬件難度最大的部分。2012 年,我們正式成立了優(yōu)必選科技。現(xiàn)在優(yōu)必選科技已經(jīng)形成完備的研發(fā)管理體系,我們有「12345」這樣的核心戰(zhàn)略。
「1」是指一個(gè)戰(zhàn)略方向,即優(yōu)必選科技要打造「硬件+軟件+服務(wù)+內(nèi)容」的機(jī)器人生態(tài)圈。
「2」是指優(yōu)必選科技構(gòu)建了兩個(gè)機(jī)器人平臺(tái),一個(gè)是機(jī)器人操作系統(tǒng)平臺(tái),一個(gè)是云服務(wù)平臺(tái)。
「3」是指優(yōu)必選科技從三個(gè)層次布局研發(fā)體系,第一層是產(chǎn)品團(tuán)隊(duì)。優(yōu)必選科技的產(chǎn)品分為 To C 和 To B 兩大類。產(chǎn)品團(tuán)隊(duì)要面對(duì)客戶、銷售、市場(chǎng)等很多實(shí)際應(yīng)用場(chǎng)景,這個(gè)團(tuán)隊(duì)是為公司創(chuàng)造利潤(rùn)的一個(gè)最主要的研發(fā)團(tuán)隊(duì);第二層,在產(chǎn)品團(tuán)隊(duì)之上,我們有自己的研究院,專注核心技術(shù)研發(fā)。產(chǎn)品團(tuán)隊(duì)采用的核心技術(shù)基本都來(lái)自這個(gè)研究院;第三層,在研究院的基礎(chǔ)上,我們還有一個(gè)團(tuán)隊(duì)專注于人工智能和機(jī)器人更長(zhǎng)遠(yuǎn)的前沿技術(shù)研發(fā)。我們?cè)谇迦A大學(xué)、華中科技大學(xué)設(shè)立了智能服務(wù)機(jī)器人聯(lián)合實(shí)驗(yàn)室,在悉尼成立了人工智能研究院。當(dāng)上層的研究院有了技術(shù)突破,就會(huì)往下一層轉(zhuǎn)移。技術(shù)一旦成熟,就會(huì)應(yīng)用到產(chǎn)品。
「4」是指優(yōu)必選科技重點(diǎn)關(guān)注的四個(gè)不同的領(lǐng)域。一是教育,優(yōu)必選科技有非常強(qiáng)大的教育產(chǎn)品以及解決方案的輸出能力;二是服務(wù),家庭服務(wù)、商業(yè)服務(wù)、安防等等;三是娛樂(lè),我們與一些品牌合作,推出了 IP 娛樂(lè)機(jī)器人;四是養(yǎng)老服務(wù)大健康這個(gè)領(lǐng)域。
「5」是指我們關(guān)注的五個(gè)核心技術(shù)領(lǐng)域。一是伺服舵機(jī),包括高性能伺服驅(qū)動(dòng)器;二是運(yùn)動(dòng)控制算法,包括機(jī)器人直立行走和運(yùn)動(dòng)的能力,這也是優(yōu)必選科技的機(jī)器人與其他機(jī)器人的本質(zhì)區(qū)別之一;三是智能服務(wù)機(jī)器人自主導(dǎo)航定位算法,使機(jī)器人能夠及時(shí)定位和建模室內(nèi)情況,做好運(yùn)動(dòng)規(guī)劃,避開(kāi)障礙等;四是面向服務(wù)機(jī)器人的計(jì)算機(jī)視覺(jué)算法,機(jī)器人需要通過(guò)視覺(jué)來(lái)感知周圍環(huán)境,涉及物體識(shí)別、人臉身份識(shí)別等技術(shù)。針對(duì)這個(gè)領(lǐng)域,我們參加過(guò)很多國(guó)際比賽并且取得了優(yōu)異成績(jī),也在頂級(jí)國(guó)際學(xué)術(shù)會(huì)議上發(fā)表過(guò)多篇論文。我們近期和清華大學(xué)組成火神隊(duì)參加 2019 RoboCup,獲得了人形組三項(xiàng)大獎(jiǎng),包括 AdultSize 的 Technical Challenge 技術(shù)挑戰(zhàn)賽亞軍、Drop-in 比賽亞軍,以及 2VS2 足球比賽季軍。五是機(jī)器人操作系統(tǒng)應(yīng)用框架 ROSA。
穎奇:機(jī)器人的研發(fā)必然在硬件、軟件上都遇到很多困難,優(yōu)必選科技在軟件方面做了哪些準(zhǔn)備呢?
熊友軍:機(jī)器人應(yīng)該具有兩個(gè)屬性:機(jī)器的屬性和人的屬性。人的屬性是指它應(yīng)該具有人的智能,包括感知智能、認(rèn)知智能和運(yùn)動(dòng)智能。運(yùn)動(dòng)方面,優(yōu)必選科技已經(jīng)研發(fā)了伺服舵機(jī)等核心硬件。硬件以外,還需要有運(yùn)動(dòng)控制算法。如果用人來(lái)類比,好的硬件就像人長(zhǎng)得強(qiáng)壯健康,但一個(gè)身體強(qiáng)壯的人不一定擁有很好的運(yùn)動(dòng)能力。到目前為止,優(yōu)必選科技的專利很多集中在運(yùn)動(dòng)控制領(lǐng)域。
除了運(yùn)動(dòng)控制以外,我們?cè)谌斯ぶ悄芊矫嬉沧隽撕芏喙ぷ鳌a槍?duì)優(yōu)必選科技主要關(guān)注的家庭環(huán)境下的視覺(jué),我們提出了 Home AI。包括機(jī)器人跟人的一些交互,比如人臉檢測(cè)、情感檢測(cè)、行為檢測(cè)、環(huán)境檢測(cè),還有物體識(shí)別等等。機(jī)器人在家庭中成為人機(jī)交互中心后,需要知道自己在和誰(shuí)交互,機(jī)器人與爸爸、孩子或爺爺?shù)慕涣髂J娇赡苁遣灰粯拥模@就要對(duì)人進(jìn)行識(shí)別。這個(gè)識(shí)別的技術(shù)可能和其他的人工智能公司所關(guān)注的方向有所不同,我們更多是希望機(jī)器人可以識(shí)別這個(gè)人在家庭里的身份,而不需要它從全國(guó)十幾億人口里面精準(zhǔn)識(shí)別某個(gè)人。在交互過(guò)程中,機(jī)器人還會(huì)感知交互對(duì)象的情緒,同樣的問(wèn)題在交互對(duì)象處于不同情感狀態(tài)下時(shí),得到的反饋可能是不一樣的。此外,機(jī)器人還需要對(duì)家庭場(chǎng)景下的物體做一些簡(jiǎn)單的識(shí)別,比如杯子、水、沙發(fā)等等。同時(shí)還要識(shí)別場(chǎng)景,比如是在客廳還是起居室等等。
人形機(jī)器人與第三代人機(jī)交互中心
穎奇:現(xiàn)在 IoT 及智能家居的技術(shù)已經(jīng)有了一些突破,可以和人進(jìn)行語(yǔ)音交互,并逐漸形成了生態(tài)鏈,對(duì)我們的生活有了很大幫助。但這其中其實(shí)經(jīng)過(guò)了很長(zhǎng)時(shí)間。距離機(jī)器人真正可以走入家庭,還有哪些技術(shù)有待突破,還需要多長(zhǎng)時(shí)間呢?
熊友軍:優(yōu)必選科技專注的方向與智能家居公司是不一樣的。我們希望人形機(jī)器人走入家庭后,成為下一代人機(jī)交互中心,結(jié)合目前所掌握的運(yùn)動(dòng)控制技術(shù),給人提供物理上的幫助,而不僅是信息層面的溝通和交流。
技術(shù)方面還有很長(zhǎng)的路要走。我們希望把機(jī)器人打造為第三代的人機(jī)交互中心。第一代人機(jī)交互中心是 PC,人與電腦進(jìn)行交互。交互的時(shí)候,人必須坐在電腦前,利用鼠標(biāo)和鍵盤進(jìn)行交互,電腦被動(dòng)接受指令。
第二代人機(jī)交互中心是智能手機(jī),交互的時(shí)間、地點(diǎn)、方式相對(duì) PC 來(lái)說(shuō)靈活性更大一些,但是智能手機(jī)反饋的信息也有限。
優(yōu)必選科技要打造的是第三代人機(jī)交互中心,也就是人形機(jī)器人,這是一種主動(dòng)的交互模式。比如早上我來(lái)到辦公室的第一件事情是安排今天的行程。機(jī)器人知道我的習(xí)慣,它會(huì)提前通知我的助理,或者主動(dòng)告訴我今天的行程安排是怎樣的。而且我的指令是多元化的,我不需要通過(guò)手機(jī)輸入信息給它,而是可以用語(yǔ)音告訴它,或者通過(guò)一個(gè)動(dòng)作、眼神,它就知道我的意圖。
穎奇:優(yōu)必選科技為什么一直堅(jiān)持做「人形」機(jī)器人?
熊友軍:我們一直堅(jiān)持人形機(jī)器人是未來(lái)的方向,而且是走入家庭的最好形態(tài),因?yàn)槿诵螜C(jī)器人擁有最好的人機(jī)交互模式。我們所說(shuō)的機(jī)器人,實(shí)際上是機(jī)器加人,同時(shí)具有機(jī)器和人的屬性。
未來(lái)機(jī)器人要在人類生活的環(huán)境中生存和發(fā)展,而這個(gè)環(huán)境對(duì)人類是更友好的。比如門把手是為人類設(shè)計(jì)的,如果機(jī)器人沒(méi)有手,就不能很好地適應(yīng)這個(gè)環(huán)境。所以機(jī)器人要想在這個(gè)環(huán)境里工作,最好的方式是具有人的形態(tài),就可以操作很多人類現(xiàn)有的工具,更好地適應(yīng)人類社會(huì)環(huán)境。
另一方面,機(jī)器人與人進(jìn)行交互的時(shí)候也最好是人形。人類發(fā)展到一定程度之后,情感方面的需求會(huì)越來(lái)越強(qiáng)烈,交流時(shí)的認(rèn)同感是很重要的。機(jī)器人如果能在外形上更接近人類,人類在情感上就會(huì)更容易接受,交互的時(shí)候更容易接納,這是第一點(diǎn)。第二點(diǎn),人形機(jī)器人有更豐富的信息交互方式,人也更容易理解。人形機(jī)器人表現(xiàn)情感,可以有面部表情,高興的時(shí)候可以手舞足蹈。
而且一些技術(shù)我們可以由人類(動(dòng)作、表情、行為)映射到人形機(jī)器人,在技術(shù)上更快迭代。機(jī)器人抓物體、直立行走等,很多都是按照我們?nèi)祟惖姆绞絹?lái)做的,包括機(jī)械手臂的動(dòng)作。我覺(jué)得人形機(jī)器人是唯一能夠成為第三代人機(jī)交互中心的形式,現(xiàn)在的智能音箱只是一個(gè)過(guò)渡的產(chǎn)品。一旦技術(shù)突破之后,我相信大家更愿意接受人形機(jī)器人成為我們的助手和生活伙伴。
兩條腿走路,技術(shù)和商業(yè)相輔相成
穎奇:人形機(jī)器人真正進(jìn)入家庭生活還需要一段時(shí)間,優(yōu)必選科技是否會(huì)考慮推出一些中間態(tài)的產(chǎn)品,在這個(gè)階段讓機(jī)器人為人類提供幫助呢?
熊友軍:優(yōu)必選科技選擇兩條腿走路,即「COO 養(yǎng) CTO」戰(zhàn)略。我們目前研發(fā)人員占比約 40%,在研發(fā)方面投入了非常多的精力,我們會(huì)把研發(fā)過(guò)程中掌握的核心技術(shù),轉(zhuǎn)化為能夠在商業(yè)市場(chǎng)上給大眾帶來(lái)價(jià)值的產(chǎn)品。因?yàn)閮?yōu)必選科技是一家商業(yè)化公司,我們不是純研究型的公司,也不是那種只關(guān)注短期利益的公司。站在 CTO 的角度,我會(huì)關(guān)注未來(lái) 5-10 年機(jī)器人產(chǎn)業(yè)發(fā)展的方向,公司會(huì)在技術(shù)領(lǐng)域做很多布局,把在市場(chǎng)上獲得的利潤(rùn)更多地投入到研發(fā)中去。
商業(yè)化方面,我們會(huì)針對(duì)教育、娛樂(lè)、家庭、商用服務(wù)、安防等多個(gè)領(lǐng)域進(jìn)行技術(shù)和產(chǎn)品的落地。有人認(rèn)為優(yōu)必選科技的部分產(chǎn)品比較像玩具,但我認(rèn)為這是公司堅(jiān)持兩條腿走路的戰(zhàn)略的體現(xiàn)。從商業(yè)化的角度來(lái)看,我們會(huì)思考公司目前掌握的技術(shù),哪些是市場(chǎng)需要并且能給公司帶來(lái)利潤(rùn)的,從而推動(dòng)產(chǎn)品的落地。產(chǎn)品團(tuán)隊(duì)會(huì)獲取市場(chǎng)需求、行業(yè)信息,結(jié)合我們對(duì)機(jī)器人的想法,去完成產(chǎn)品的研發(fā)。
穎奇:接下來(lái)可以簡(jiǎn)單介紹下您的個(gè)人履歷。
熊友軍:我博士畢業(yè)于華中科技大學(xué),讀博的時(shí)候研究的是機(jī)械手臂相關(guān)的方向。我記得有一年我們的總理訪問(wèn)日本,到本田的時(shí)候接待總理的是一臺(tái)本田的機(jī)器人,也是 ASIMO 的前身,這個(gè)機(jī)器人帶著總理參觀了本田的汽車流水線。這件事當(dāng)時(shí)給我?guī)?lái)很大的沖擊,在我們做機(jī)械手臂都做得很困難的時(shí)候,日本的人形機(jī)器人已經(jīng)做得非常棒了。當(dāng)時(shí)我就覺(jué)得我喜歡人形機(jī)器人,以后發(fā)展方向可能就是研發(fā)人形機(jī)器人。
2011 年,我跟周總一起聊天,兩人一拍即合,隨后我就來(lái)到深圳了。優(yōu)必選科技在 2012 年 3 月成立,開(kāi)始就是做機(jī)器人的產(chǎn)品和機(jī)器人的系統(tǒng)。到了 2012 年年底,公司已經(jīng)研發(fā)出 Alpha 的原型機(jī)。2016 年,優(yōu)必選科技的 500 多臺(tái) Alpha 機(jī)器人亮相央視春晚。上春晚之后,在行業(yè)也引起了轟動(dòng)。隨后我們針對(duì)教育領(lǐng)域推出了 Jimu Robot,并迅速與蘋果展開(kāi)合作。后來(lái)陸續(xù)又跟迪士尼、Amazon 有一些合作,公司發(fā)展進(jìn)入了快車道。
穎奇:能否請(qǐng)您推薦一些最近在看的比較不錯(cuò)的書給大家?
熊友軍:技術(shù)方面我主要看論文,書會(huì)側(cè)重看管理和社科方面的,比如《人類簡(jiǎn)史》。最近大家都很關(guān)注華為,我也在看有關(guān)華為的書,《以客戶為中心》寫的很好,還有《下一個(gè)倒下的會(huì)不會(huì)是華為》,這本書探討了危機(jī)意識(shí),對(duì)于認(rèn)知華為也有非常大的幫助。
穎奇:有時(shí)間我也可以讀一下這本書。今天有很多收獲,非常感謝您的分享。
[免責(zé)聲明]
原文標(biāo)題: 對(duì)話 CTO | 聽(tīng)優(yōu)必選科技 CTO 熊友軍講第三代人機(jī)交互中心的人形機(jī)器人時(shí)代
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。




