橘子百科-橘子都知道橘子百科-橘子都知道

波士顿动力创始人 对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

波士顿动力创始人 对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

8月24日下午,2024世(shì)界机器人大会上,举行(xíng)了一场期待已久的中国(guó)、美国“具身智能”与人形机器人领域学者的“世界对谈”。

大名 鼎(dǐng)鼎的“机器(qì)狗之父”、美国波士顿动力创始人Marc Raibert(马克(kè)·雷伯特)首次来到北京。他说,“我简直不敢相信,不仅是机器人的数量,难(nán)以置信,还有这么多热情的人(rén)参(cān)加(jiā)了展(zhǎn)览。中国 对机器 人的(de)兴奋和热情很高。”

而此次与Marc对(duì)谈的(de)四位CEO所在的公司也不寻常:除了宇树(shù)科 技之外,星动纪元、银河通用、北京具身智(zhì)能机(jī)器人创新中心都(dōu)成立不足2年,一出 道就是具 身智(zhì)能(néng)和(hé)人形机器人行(xíng)业的“顶流”。

而且 ,星动纪元(yuán)、银河通用背后也站着中国最高学府(fǔ):北大和清华,代表着中国前沿科(kē)技创新的重(zhòng)要来源。

其中,星动纪元由姚期智带领的清华大学交叉信息研究院(yuàn)孵(fū)化(huà)成立的,星动纪元创始人陈建宇现在还是清华(huá)大学交 叉信息研究院(yuàn)助理教授,公司融资超亿(yì)元,联想(xiǎng)创投已加入其中。

银河通(tōng)用机器人创始人(rén)的(de)王鹤则是(shì)北京大学助理教授,也(yě)是北(běi)京智源人工智能(néng)研究院具(jù)身(shēn)智能研(yán)究(jiū)中心主任,过去半(bàn)年,银河通(tōng)用完成天使轮融资共计7亿元人民币,刷新了国内(nèi)人(rén)形机器人(rén)领域单轮融资规模,美团战投、北汽产投、商汤国香基金、讯飞基金、启明创投、蓝驰创(chuàng)投、经纬(wěi)创投、源码资本(běn)、IDG资本(běn)等(děng)头部财务机构都参与 其中。

而北京具 身(shēn)智(zhì)能机器人创(chuàng)新中心则是北京市发(fā)起成立的机器人“国家队(duì)”机构。北京具身(shēn)智能机器人创新中心总经理熊友军,目前(qián)还是“人(rén)形机(jī)器人第一股”优必选科技CTO。

Unitree Robotics(宇树科技)也是当下人(rén)形机(jī)器人(rén)行业(yè)的明星企业。公司创始人、CEO、CTO王兴兴毕业于 上海大学,取得 了(le)机械工程硕士,具有近10多年足(zú)式机(jī)器人研发经 验,拥有产品从0-1-100的研(yán)发(fā)与商业 化落地能力,100+项机器人相关专利。

此次圆桌由德国慕尼黑工业大学教授 Alois.C.Knoll主持,美国波士顿动(dòng)力创始人Marc Raibert(马克·雷(léi)伯特(tè)),与中国(guó)四大AI机器人企业领军者——陈建宇、王兴兴(xīng)、王鹤、熊友军,五人围绕机器人行业、AI 大模型(xíng)驱动机器人发(fā)展等议题(tí)展开(kāi)讨论。

一(yī)个多小时的圆桌当中,Marc表示,未来5年,机器人(rén)硬件发展仍将非常重要,但同时,能够(gòu)打破语义理解障碍的(de)基础模型(xíng)或其他 AI 方法也将对(duì)机器人(rén)技术产生更大的影响。不过(guò),要想(xiǎng)取得(dé)机器人领域真正的进步,就需(xū)要(yào)更(gèng)高的可靠性和安全性,未来人们需要(yào)投入大量资源努力解决此类问(wèn)题。

Marc非常不看好人形机(jī)器人行业。他认为,工业机器人已经非常成熟(shú),而且能够商业化(huà),目前人形机器(qì)人“在 某种程(chéng)度上是 一种炫耀,而不是一种(zhǒng)生(shēng)产力(lì)”。

陈建宇表示(shì),过去10年AI发展(zhǎn)很快,从简单的图像(xiàng)处理,到深度学习、强化学习,再到ChatGPT技术,这对于(yú)未来“具身智能”产生很大的(de)影响。未来几年,AI、具身智能会与人形(xíng)机器人(rén)不断融合,去训练一个通用模型。他相信未(wèi)来5年,我们将(jiāng)迎来“机器人的ChatGPT时刻”。

王鹤指出,当(dāng)前 AI 大模型在机器人上仍有巨大的局限(xiàn),尤其是“泛化的开瓶盖”技能(néng)还没有(yǒu)训练(liàn)出来(lái),但同时,这(zhè)也是大模型(xíng)带来了重(zhòng)要机会,一旦大模型涌现(xiàn)能力不断加强,他认为未来5年,依然有一个至少(shǎo)做(zuò)操作任务的通用机器人机会。

熊友军表示,当前关节性能提升、高的(de)能量和电(diàn)池密度的提升非常快,使得机器人的运动控制能力、电机等(děng)方面提升(shēng)非 常快。未(wèi)来5年,机器(qì)人关节和能量密度(dù)会持 续提升。毕竟和人类相比(bǐ),现在机器人的能量执行效率还是有非常(cháng)大的 差距。

以下是钛媒(méi)体AGI编辑对此次圆(yuán)桌全文整理:

问:您能否向观众简单介绍一下您的工作:您为什么以及(jí)什么时 候开始对人形机器人感兴(xīng)趣的?

Alois:我从 2001 年开始担任慕尼黑大学的教授。我对人(rén)类噪音的一个方面产生了兴趣,那就是具(jù)象化,对吧?我(wǒ)的朋友 Pfeiffer 和我们一起从大学毕业。苏黎世退休了,不幸的是,我(wǒ)们坚信具象化。所以我们认为(wèi),在我们的人类类型中,智力只会在以非常自然的方式与世界相连的人类类型身体中发展 。所(suǒ)以身体应(yīng)该有(yǒu)同样(yàng)的动力,同样的尺寸(cùn),等等。否则,就很难做到这一点,你在这里看到(dào)的 Kronos 系列 机器人,左边,左下角的 Roll Boy2024 就是这种信念的(de)结(jié)果之(zhī)一。

Marc:我认为你(nǐ)贴出的(de)那张图片对我回答这个问题很有(yǒu)帮助。如果人形(xíng)机(jī)器人意味着两只胳膊(bó)、两条腿直立向前,那么直到最近我才对此感兴趣。事实(shí)上 ,我一(yī)直(zhí)认为现 在的公司注(zhù)重功能(néng)性,作为一名教授,我(wǒ)认为功能性(xìng)才是最重要的,机(jī)动性、灵巧性、感知力(lì)和智能,而外形和外观则(zé)是次要的。另一方面,如果人形机器人意味着像腿一样的动态生命,我会把(bǎ)它与世(shì)界互动。我一直是人 形机器人的粉丝,尽管我建造的第一个机器人是弹簧单高跷的东西。我认为人形(xíng)机器人的许多基本(běn)要素都在那些弹簧单高跷的东西中。确实,当我们开始建造机器人时,波士顿动力公司是直立的(de),有两条腿,两只(zhǐ)胳膊。有时(shí)领先。如 果(guǒ)你看看公(gōng)众的反应,你会(huì)发现 YouTube 点击量增加(jiā)了 10 倍,我非(fēi)常关注(zhù)这些点击量或评论,或 者(zhě)只是人们的态度。人们非常感兴趣。普通的非科学家,比如(rú)说(shuō),非工程师,他们对人形机器人很(hěn)感兴趣,而狗惹(rě)恼机器人却得不到同样(yàng)的(de)赞(zàn)誉。

熊友军:我是从读博士的时候(hòu),2000年开始做机器人的研发,当时(shí)读博(bó)士的时(shí)候,那时候更多的是做工业领域、特种领(lǐng)域的一些机器人,用在(zài)一些危险的环境(jìng)里面,因为那时候机器(qì)人技术(shù)还是非常(cháng)不(bù)成熟,但在很多特种领域和(hé)危(wēi)险场景里(lǐ)面,是(shì)需要用机器人去完成工作了,然而那时候(hòu)机器智能实际上是很差的。所以我们当时想的办法,是将机(jī)器人的智能跟人的智能结合起来,所(suǒ)以做(zuò)了一些机器人要操作(zuò)的一些事情。

但在遥控操作完成这些(xiē)工作的过程中,我们发现有很多的场景,实际上用轮式的工业机械手臂(bì)是解决不了的,尤其是有(yǒu)时候在一些特种场景环境比(bǐ)较狭(xiá)小,然后环(huán)境比(bǐ)较复杂(zá)的轮式(shì),然后履带(dài)式(shì)实际上根本就(jiù)进不去,但是人是可以进去。还有一种,是要试用(yòng)很多工具去(qù)完成那些工作。

所以(yǐ)当时我(wǒ)们就觉得,如果说有(yǒu)微型机器人的话(huà),实际(jì)上应该是能(néng)够提供很好的解决工具,或者一种解决方案,但是我们当时那时候也看到了日本本(běn)田ASIMO,给我们提供了很多的一些启发,所以那时候我就对人形机器人非常感兴(xīng)趣。后面(miàn)毕(bì)业之(zhī)后,一直在做机器人相关的工(gōng)作,

2012年,我跟优(yōu)必选科技CEO周剑(jiàn)先(xiān)生创立了(le)公司,做人形机器人研发工作,去年从深圳(zhèn)到北京开始(shǐ)筹建具 身智能(néng)机器人创新中心,现在也是一(yī)直在聚焦人形(xíng)机器人方面的研发,主(zhǔ)要的(de)想法(fǎ)是希望说能够解决人形(xíng)机器人方面的一些共(gòng)性、关键(jiàn)的技术问题,比如本体的(de)一些基础(chǔ)研发不足,其实我们(men)现在微型机器人在本体在关键的核心器件,然后(hòu)在一些传感器方面(miàn)其实上有(yǒu)非常多要攻克的地方。另外在(zài)运动控制(zhì),实际上我们也做(zuò)了非常多的运动控制(zhì)的技(jì)术研发,采(cǎi)用深度(dù)学习强(qiáng)化学习的这种运(yùn)动 控制的方式(shì),包括现在也用一些融神经网络的一些方式用(yòng)去做运动(dòng)控制,同(tóng)时其实我们(men)现在还在做关(guān)于智能方(fāng)面的一些研发,比(bǐ)如说把用现在具身智能的方式,做一些(xiē)基础性(xìng)工作,比如建(jiàn)它的数(shù)据集,研发(fā)机器人大模 型框架等。所以这(zhè)就是现在我在(zài)做的一些事情(qíng)。

陈(chén)建宇:其实这个兴趣(qù)是很小的时候(hòu),就一直(zhí)对(duì)智能机器人非常感兴趣,我印象很深(shēn)刻,刚刚兴兴说她10岁的时候,我估计也是差不多类似的时间(jiān),不过当(dāng)时看的不是波士顿动力,当时关注的是ASIMO系列机器人,当时(shí)我就非常的去着迷。然后我(wǒ)觉(jué)得(dé),创业这件事其实是充(chōng)满了挑战性(xìng)的,marc创办(bàn)了波士顿动力做了40多年(nián),其实我是 非常尊敬的(de),就是说你没有一个发自内心的、天(tiān)生(shēng)热爱的话,其实很难去坚持下来的。所以对我来说,对这(zhè)类机器(qì)人的(de)热(rè)爱,我觉(jué)得(dé)某种程度上是从小就具备就拥有的。

那么真(zhēn)正开始做机器人其实是本科的时候。当时在学校里(lǐ)面,我就接(jiē)触真正意义上的机器(qì)人的研(yán)究,当时接触了双(shuāng)足机器人,主要是做的就是捕获点步态(tài)规(guī)划相关的研究。后 来,博士阶段(duàn)继(jì)续做机器人,虽然不是人形机器人,但是也是相(xiāng)关的一些机器(qì)人的领域,控(kòng)制它的(de)学(xué)习,包括无人(rén)车和(hé)机械臂。而真正(zhèng)的去全力做(zuò)人(rén)形机器(qì)人,是在我回国 之后(hòu),然后在现在清华正式投入(rù)去做人形机器人,还(hái)孵化了(le)星动纪元公(gōng)司,如今我们已(yǐ)经做 了最(zuì)新(xīn)一代、第六代机器人了(le),然后我们也(yě)在展会(huì)上(shàng)面带来了我们机器人的实物,欢迎(yíng)大家去关(guān)注。

王兴兴:大家(jiā)好,我是宇树科技创始人王兴兴 ,刚才有提到我大概可能(néng)10岁的时候就(jiù)看 过marc先生在MIT实验(yàn)室做的(de)双足,还有 单条腿的机器人,然后印(yìn)象非常深,在 09年、10年的时候,大概大(dà)一寒假,我就做过一个小的 人形机(jī)器(qì)人,然后当时做的(de)不是特别满意(yì),然后后来的话,就在研究生(shēng)期间做了XDog这款机器人,差(chà)不多在13年到15 16年,这(zhè)款机器人的话又采用(yòng)了比(bǐ)较低(dī)成本(běn)的硬件,然(rán)后运(yùn)动性能非常(cháng)好,可以直接实(shí)现(xiàn)关节的(de)力控以(yǐ)及整(zhěng)机的力控。

后来的话(huà),一开(kāi)始 我对人体 机器人的技术还是跟相对(duì)来说比较(jiào)悲(bēi)观的,但是后来的话在2022年左右,整个的机器人、AI技术的进步,然后再加上ChatGPT出来以后,大家(jiā)都看到人(rén)形机器 人(rén)和(hé)AI结合的可能性,所以说我们公司又重(zhòng)新开始做人形(xíng)机(jī)器人。说实在(zài)的,其实我真(zhēn)正感兴趣的并不是说人(rén)形机器人,而是新的一个智能体(tǐ)机器人(rén)的形态。而人形机(jī)器人可能只是说目前(qián)大家比较公认的、一个最有可能性的通用机器人和通用AI的结合体(tǐ),但是(shì)这可(kě)能并不是个唯一的,我真(zhēn)正希望(wàng)能诞生甚至更比人更 高级的一个智能体(tǐ)形态,可以大大推动整个人类工(gōng)业的(de)变革,推 动新的工业(yè)革命。

王鹤:我是北(běi)京(jīng)大学计算机学院助理教(jiào)授,也是北(běi)大银河通用具身智能联合实验室的主任王鹤,那么(me),我跟人形(xíng)机器(qì)人、具身智能结缘,主要是从我在(zài)斯坦福大学开始读博(bó)的时候。那么2016年的时候,当时深度(dù)学习技术(shù)已经出来了,也应 用在很多图(tú)像识别 分类这些任务当中(zhōng)。那 么当时(shí)作为一个前(qián)沿研究,我(wǒ)们试图去理解人类是如何把感(gǎn)知思考(kǎo)还有交互的能力融合在一起的(de)。

所以我博士期(qī)间的第(dì)一个工作,就用一个视觉模型来看桌面上人(rén)的(de)动作和物体的一个运动,然后推理人下一(yī)步(bù)想要什么,这(zhè)是一(yī)个语言模型(xíng)。

最后再用一(yī)个简单的机器人,智能的马(mǎ)克杯去响应人的动作,那么这个工作获得了欧洲图形学(xué)的最(zuì)佳(jiā)论(lùn)文提名,但是我们认(rèn)为它非常(cháng)的不(bù)足,就是我们(men)的一个马克杯只能在桌面上移动响(xiǎng)应(yīng)人的动作,它没有跟人交互的能力,我们的视觉(jué)只能(néng)看(kàn)有限的几一种物体,那么(me)我们的语言模型只能根据这个人跟这些桌面东西(xī)的一些动作来做简单的推理(lǐ)。

那么通过过去8年我们的研究,在怎(zěn)么样把机器人的操作能力搞得(dé)更泛化,什么东(dōng)西都能(néng)抓,都能够(gòu)放置,那么还有跟现在的多模态(tài)大模型技(jì)术结合,真的明白人类想让你干什么,那么言出法随的去执行所 以去(qù)年(nián)我们就孵化了北京银河(hé)通用这家(jiā)人形机器人公司,我们现在也是把视觉(jué)、语(yǔ)言、动作这三 种不同的模态融合到 大模(mó)型当中,真正的赋能人形机器(qì)人,让人形机器人能(néng)够走进千(qiān)行百业、千(qiān)家万户,这是我们(men)的愿(yuàn)景。

问:你(nǐ)认为,我们(men)今天拥有的哪些(xiē)重要技术是 10 年前没有(yǒu)的(de),但对于实(shí)用的人形机器人来说却至关重要?它们在未来 5 年将如何发展?

Marc:我认为硬件开发仍将非常重要。如果我(wǒ)们 谈论未来 5 年,毫无疑问(wèn),能够打破语义理解障(zhàng)碍(ài)的基础模型或其他人工智能方法将产生最大 的影响。

我认为(wèi),人 类可以(yǐ)做的就是,概括和(hé)理解他们所看到事物的(de)含义,而目前还无(wú)法真正 捕捉到这些含义。我相信,如果人工智能能够在这方面取得进展,我(wǒ)认为它将产生巨大的影响。

实际上,过(guò)去十年来,每个人都在计算机、传感器、感知、控制等方面取得了巨大进步。电(diàn)池,我认(rèn)为人们忘记了电 池。虽然电池(chí)是工(gōng)业时代的产物,但是它们确实非常重要。是的,所以在电机方面过去 5 年里,人们做得很好,我认为电机已经取得了长足的进步,当然,我们将看到更多。

陈建宇:我从AI的视角来讲(jiǎng)一(yī)讲,觉得非常大的一个不同。如果按照(zhào)10年前的话,其实是2014年左右(yòu),当时是DeepLearning刚(gāng)刚出来不(bù)久(jiǔ),它其实解决了很大(dà)一部分,比如图像处理等等一些问题。

那么(me)后面,其实有我(wǒ)认为两个最重要的里程碑(bēi):一个是以(yǐ)16年(nián)阿尔法狗为代表的深度学(xué)习,紧接(jiē)着把它用在了强化(huà)学习上(shàng)面,做(zuò)深度强化(huà)学习,解决了(le)一些问(wèn)题;第(dì)二个(gè)是以ChatGPT为代表(biǎo)的大语言模型(xíng),所以这点我认为是过(guò)去10年没有的,但又 对未来(lái)我(wǒ)们人形机器人,或者是具身智(zhì)能起到非常大的决定性(xìng)作用的两个因素。

那么可能在接下(xià)来的这几年时间,这(zhè)两(liǎng)项技术会(huì)非常深度(dù)的跟人形机器(qì)人、具身智(zhì)能融合起来,但他们(men)也分别(bié)需(xū)要经过(guò)一定(dìng)程度的(de)训练,从而能训练比较通用的一个模型,那么我们也能解决更加丰富的物理(lǐ)世界的数据(jù)程序。那么我相信,在接(jiē)下来的5年,这几项技术都能起(qǐ)到非常大的一个进展,我们可能会在5年内迎来“机器(qì)人的ChatGPT时刻”。

王兴兴:对过去10年最大(dà)的,还是AI技术带(dài)来的各种事情(qíng)有更多的信心。我觉得(dé)除了 AI技术本(běn)身最大的(de)点,对于人形(xíng)机器人,对于整(zhěng)个社会共识的增加也(yě)是(shì)非常关键的,就是目前大家更加相(xiāng)信AI,更加相信人形机器人可以诞生更多价值,这在(zài)10年前是完全不能想象的,那时整个(gè)社会(huì)基本(běn)上对此都完全没(méi)有信心。

另外一(yī)点的话,我(wǒ)觉得在未来5年,总体上是肯(kěn)定整个 AI 机器人、AI模(mó)型变化会非常快,因为目前的AI真的是日新月异,大家可(kě)以用AI集成(chéng)技术,去搭建(jiàn)各种自己的模型去做训练,这(zhè)整个已经变成一个非常的扁平化,以及容易操作的过(guò)程,其实很多人大家 都可以参(cān)与进来,去做机器(qì)人模型并且去做训(xùn)练,所以我觉得。未(wèi)来5年这块的各种AI模型创新,包括更新的一些神(shén)经网(wǎng)络模型,包括脉冲(chōng)神经网络等都有很大的一(yī)些机会。

王鹤:我觉得10年好快,10年前是2014年,其(qí)实我们(men)已(yǐ)经看到inbody的AI,甚(shèn)至不(bù)是(shì)一(yī)个(gè)在(zài)西方的学术界比较popular的词汇,那么过去的十年,我觉得一大技术的进展,就是我们在具身智能里头已经有一些(xiē)技能实现了非常强的(de)泛(fàn)化性。

那么以我个(gè)人的研究举例,在抓取问题上,我们取得了比(bǐ)较长足的进(jìn)步(bù),那(nà)么我们(men)从只能抓方块圆的(de)这些特定形 状的物体(tǐ),到基于三维视觉传感器,我(wǒ)们可以抓(zhuā)不(bù)透明、不反光,也就是在深(shēn)度传感器里头(tóu)能完美成像(xiàng)的这些物体,到(dào)我们最近的技(jì)术能够预测透明、高(gāo)反光、金属、吸光这些非常有挑战(zhàn)材质的物体,基于它(tā)去做泛化抓取操作。

那么在今天的展厅,我们都接 受观(guān)众给(gěi)我们的各种形(xíng)状,各种材(cái)质随便堆叠乱七八(bā)糟(zāo)的物体,我们(men)的机器人(rén)都展示了非常(cháng)泛化和高成功(gōng)率的抓(zhuā)取能力,那么现在的问题是,像这样的每一(yī)个技能(néng),大家都(dōu)在分(fēn)分别的去做开发,那么很多人会提问 你能(néng)帮我抓水瓶 ,你能不能帮我把瓶盖给拧开?我非(fēi)常不好意思的说,现在泛化的开瓶盖技能我 们还没有训练出来,这(zhè)个就(jiù)是大模型能够带(dài)给我们的机会,那么(me)大语言模型涌现,也就是这种紧急行为(wèi)紧急行为,他能够在只见一次或者是第(dì)一次零次的(de)演示的情况下(xià),他都理解你要生成什么(me)样的文字,我们相信 未来的5年给(gěi)我们的(de)机会就是发展机(jī)器人(rén)基础大模型,它能够(gòu)实现涌现能力,它吞吐足够量的(de)数据后,有灵(líng)巧手,它能够(gòu)抓能够加、能够拧,能够掰各种基本的手的各种(zhǒng)运动(dòng)能力都有了以后,他能涌现,我们给(gěi)他看一个视频,他就能理解这个活怎么干(gàn),到那个时 候我们真正的就有一个通(tōng)用的、至少做操作任务的的机器人了,这是我认为 未来5年 的一(yī)个机会。

熊友军:我觉得(dé)这(zhè)一轮的(de)机 器人技术的进步主要是由AI来驱动的。毫无疑问, AI驱动我觉得体现在 几(jǐ)个方面。

第一个就是它人机交互性能得到了极大的提升。我记 得10年前我们做人工智能、做机器人的时候的那 些交互,如果说(shuō)我要加语音加(jiā)视觉,第(dì)成(chéng)本非(fēi)常高,第二个我们要做大量的研发的工作(zuò),我们需要几个博士、硕士(shì)带(dài)着(zhe)一个团队,花很长的时间才能够(gòu)完成一些物体识别、语音合成(chéng),自(zì)然语言理解NLP,还(hái)有甚至是TTS、语音合(hé)成等方面的一些工作,甚至包括导航(háng),但是我觉 得,现在随着(zhe)技术(shù)的(de)进(jìn)步,我们现在做(zuò)人(rén)形(xíng)机(jī)器人的大模型,我(wǒ)们直接一个端到端的直接语音给指定给他,然(rán)后很快(kuài)他就可(kě)以有比较好的行为输出(chū),有很好(hǎo)的意图理解(jiě),然后做任务规(guī)划等。这是一方面,我觉得这一(yī)轮对人机交互、对动物的规划、对(duì)执行等方面都有巨大提升,在 10年前基本上(shàng)都很难去想象。

然后第二个现在的这(zhè)些硬件方 面也有极大的提升,体现在两个方向,第一个现在关节的性(xìng)能的提升是非(fēi)常快的(de),大家可(kě)以看到很(hěn)多公司机(jī)器人可以开(kāi)始去做(zuò)一(yī)些非常动态的、剧(jù)烈(liè)的(de)运动,实际上离不(bù)开关节性能的提升、高能量密(mì)度比,然后高的转速、高性(xìng)能等这些技(jì)术(shù)的提升,实际上,在10年前我觉(jué)得(dé)是很难去做到的。当然了这也有运动控制能力的提升、电机的(de)提升,现 在其实(shí)也有采用更多结构设计的方式,更适合它的布局等方面都有非常大的(de)进步,包括(kuò)把腿的转成惯量、把电(diàn)机往上提等等,有(yǒu)各种各样的(de)结构设计的技术的变化。

另外,刚才还(hái)提到能量,其实早前我觉得(dé)10年前我们(men)做机器人的时候,一个电池就像我(wǒ)们背后要背一个非常巨(jù)大(dà)的(de)电池包能(néng)源包(bāo),而且能够(gòu)持续的时间很短。但是这几年随着新能源汽车对电池技术的推动作(zuò)用,其实我们看到它的电池能量密度大幅提升,我现在一个比较小(xiǎo)的电(diàn)池(chí),可以支持比(bǐ)较长的时间,我觉得这是一个非常重要的技术突(tū)破。

未来,我觉得5年之后,这几 个可能还(hái)是(shì)一个重大、要(yào)突破的方(fāng)向,像刚(gāng)才说的人机交互方面,我们希望大模(mó)型能 提供更长期的 任务规(guī)划,然后做意图理解等等方面,我觉得我们能只要给他一个非常模糊的指令,他(tā)就(jiù)可(kě)以给我(wǒ)们输(shū)出(chū)我们很标准的很自然的这种交互(hù)的结果。第二方面,可能就 是在规划实施(shī)任 务方面是一个非常(cháng)重大、要攻克的方向,我们环(huán)境会经常变,面对(duì)的是一个动(dòng)态环境,然后机器人(rén)能够根据环境变化,能够(gòu)实 时去改(gǎi)变它的一些(xiē)执行策略等。当然(rán),像能量方 面我觉得是一个持续要提升的,它毕竟现在能量执(zhí)行效率和我们人相比,还是有非常(cháng)大的一个差距。

问:大规 模部署人形机(jī)器(qì)人需要完成哪些任务?

Marc:但是(shì)如果(guǒ)你现在从更宏观的角度来看 ,我刚才说了如果你想致富你现在就不会着手开公司(sī),但是(shì)如果你想生存下(xià)去。你至少也得(dé)收支平衡。

我想这是一个更长远的计划,我(wǒ)认为要(yào)想(xiǎng)取得(dé)真(zhēn)正的进步,你必须暂停,或者我不(bù)是说(shuō)你必须暂停(tíng),我们在我的研究所(suǒ)暂停,让机器(qì)人更可靠的本地目标将是(shì)一件关键的事情,如果我能指出旧金山的自动驾驶汽车,他们杀死(sǐ)了一个人,这实际上甚至不是自动驾驶(shǐ)汽车的坠落。然后克鲁(lǔ)兹完全退出了(le)旧金山。我知道现在(zài)还有很多事(shì)情在进行,但 这在机(jī)器人(rén)领域很容易发生。因此,可(kě)靠性是一个关键因素,这是人(rén)们投入大量资源努力解决的问(wèn)题之一。但这(zhè)无(wú)助于解决,将我们带入下一代(dài)的更大(dà)问题。当我说我不(bù)认为每个人(rén)都必须专注于你所说的真正有用(yòng)的东西时。

陈建宇:要做到大规模应(yīng)用(yòng)的话,有(yǒu)非常重要两(liǎng)个事(shì)情:一个是能不(bù)能找到大规模的(de)需(xū)求,另 一(yī)个能(néng)不能有我们技术,足够去实(shí)现(xiàn)、满(mǎn)足需求。

其实现在有很(hěn)多零散的表(biǎo)演需求,如果需(xū)要真的达到(dào)max(大规模)的话,我觉得主要还是看劳动力,非常密集(jí)的一些产业(yè),比如三个阶段,一个是工业、商用和服务。

大体我认为,技术也基本上是按照这样(yàng)一个方向去成熟(shú)发展,其中我觉得给我的感受,我认为(wèi)工(gōng)业的话可能会比较快就能够去用(yòng)上了。其实刚才Marc的报告中里面也已经展(zhǎn)现出来了,不管是人形,还是(shì)一些轮式的机器人,在工(gōng)厂搬运的这一 类的环境里面,已经是达到(dào)了非常接近人(rén)类的(de)一个节点,那么在未来,它可 能会(huì)更快更(gèng)强大,然后(hòu)以及成本更低,达到这个(gè)时 候(hòu)的话,其实它的第一个大规模 应用(yòng)的点就到了。

王鹤:我(wǒ)觉得具身智能今天不能讲完全(quán)成熟,但是我们(men)今天GPT能力搭配人形(xíng)机器人,其实已经能够在(zài)很多场(chǎng)合干事(shì)情了。

像我们今(jīn)天在展台(tái)展示了就是在一个零(líng)售(shòu)的场景,那么用户(hù)可以下(xià)单,我们的机器人可以根据(jù)你的(de)具体下单的内容,是拿一个冰红(hóng)茶,还是拿一个巧克力,那么我(wǒ)们从货架(jià)把它取下来,同时我们(men)也可以从地面的篮子里头把这些(xiē)货不断的上到(dào)货架上,我们 也(yě)可以从(cóng)更大的(de)一个仓(cāng)储的料架(jià)上,抱着一箱东(dōng)西放到传送带上。

这些场景其实都(dōu)展示了,目前(qián)具身(shēn)智能对于比较糙(cāo)的活,就是抓取放置(zhì)和 双手抱持这样的(de)能力已经走向成熟。

在这(zhè)种(zhǒng)情况(kuàng)下,我(wǒ)们还要问一个问题,为什(shén)么是这个人形对吧(ba)?有很多人现场问我(wǒ),你们(men)为什么要做(zuò)成人形?因为你想如果货架上的一个商品掉在(zài)地上了,我的机器人得(dé)有能力去 够地面这么低的东西,我的货架可能两米高,我要能够抓到两米那么高的东西,同时我还能还得来回走动,还要得有两只手才能抱住一个箱子,又有两只手(shǒu)又能高又能低又能(néng)够来回走,那么 它基本上就把形态(tài)往人基本上非常的靠拢了,那么我们目前(qián)用的 是一个轮式底盘,没有腿,那么也已经达到这样的一个能力了。那(nà)么我们(men)认为像这样(yàng)的抓 取放(fàng)置搬运的能力,在很多行业(yè),比(bǐ)如说零售,比(bǐ)如说工厂,比如说一些服(fú)务的场景全都可以用(yòng)起来。

所(suǒ)以我(wǒ)判断(duàn),人形机器人的大规模应用,2025年(nián)、2026年(nián)我们将见到从(cóng)百台级到千台(tái)级的一(yī)个快速的增长,

王(wáng)兴(xīng)兴:我个人(rén)的话,总体来(lái)说(shuō),对目前整个人形机(jī)器人应用落地(dì)还是需要一些时间,但(dàn)当(dāng)下(xià),包括(kuò)今年(nián)和(hé)明年对一些简单场景,像特斯拉场景里面把一个电池(chí)从什么地方波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”装到什么地方里面,这种(zhǒng)简单的,用模仿学习能做的事情,目(mù)前(qián)的(de)AI技术其实成功率还是做的比较高了,今年或明年可以做一些应用,包括把整个的GPT速度也提升。

但是我觉得,真正要提升人形机器人大规模应用,确实还(hái)需要更多的时间(jiān),把机器人(rén)的模型本身(shēn)做得更好一点,让它(tā)更通用,基本(běn)上无论是更精细化的或者更泛用心(xīn)的一些事情都可以做一起来,所以我还是希望(wàng)社会大众对AI和机器(qì)人能更多一些耐心。但实际上可能中国其(qí)实还是有很多(duō)人比较心(xīn)急的,我觉(jué)得还是大家可以再(zài)多给一(yī)点耐心。谢谢(xiè)。

熊友军:我觉得人形经济和大规模的(de)应用(yòng),其实上这(zhè)个就涉及到一个商(shāng)业化场景选择的问题,实际上(shàng),并不是(shì)说现在人形机器人不能够应用,而(ér)是说要(yào)再看什么场(chǎng)景。我觉得在(zài)有一些刚(gāng)需的场景,或者对人不可达(dá)到的这种场景,还是(shì)有一些可以(yǐ)用的,尤其是这种刚性需求的,比如抢险救灾,特(tè)种的对核辐射,或(huò)者是说有毒有害气体环境等等,这些我觉得现在(zài)实际上是可以用的。

大家(jiā)其实想的更多是,技术怎么去提升(shēng),然后怎么它能(néng)够让人形机器人能够快速适(shì)应更多的(de)场景,然后把(bǎ)成本快速的降下来,只(zhǐ)有 这样(yàng)通过一方面通过技术的提升(shēng),提高有更多(duō)工作效率,让人有(yǒu)更好的体验感,然后更多人愿意用它。

第二方面,就是把成本继续(xù)往(wǎng)下降,我觉(jué)得让大家更买得起,这个我觉得要是要想的这(zhè)个方式。

另外(wài)我觉(jué)得还有一种 ,就(jiù)是商业模式上的探索,实际上人形机器人(rén)是我觉得是一个集(jí)大成者,它基本(běn)上(shàng)涵盖(gài)了机(jī)器人和人工智能的绝大(dà)部分的技术领域,然后(hòu)在人体技术上的研究能够大大的推进这(zhè)些技术(shù)的成熟(shú),然后技术甚至技术的市场化,我们可以采用“沿途下蛋”方式(shì)获 得(dé)这个商业的利润。通过这(zhè)些其(qí)他的一些技术,人形(xíng)机器(qì)人产品上孵化的其(qí)他技术(shù)商业化(huà)、产业(yè)化来推动(dòng)人形机器人研究。一个典型的例子(zi),就是我们现在有一些人形机器人 公司已经在其他产品上实现盈利,然后已(yǐ)经实现了一个很好的商(shāng)业化,这我觉得是一种非常好的模式。

问:作为技术人员,我们是(shì)否意识到有很多(duō)机器人都有道德伦(lún)理方面的顾虑——我们如何才能消除这些顾虑?

Marc:我认为,从最高层面来(lái)说,理解所有技术都涉及一些(xiē)风险和(hé)机遇是很重要的。我参(cān)加(jiā)了一个政(zhèng)府会议(yì),但(dàn)我听到许(xǔ)多政府的人都(dōu)在谈(tán)论(lùn)监管人工智能,而压倒性的(de)感(gǎn)觉是关注最糟糕的结果,对吗?

比如(rú)在欧洲,来(lái)自英国一位人士在发言,让我印象深刻的是,人们几乎陷入恐慌,担心最糟糕的事情会发生,并且不惜一切代价想要阻(zǔ)止这种事情发生。但我(wǒ)认(rèn)为,不利用机会(huì)的风险与让坏事发生(shēng)的风险一样大。

所以我认为,正(zhèng)如开(kāi)发人员指出的(de)那样,我们需要找到(dào)一种平衡,当(dāng)我们撰(zhuàn)写论文(wén)时,我们会在开头列出这些内(nèi)容。这些都是我们工作可能产(chǎn)生的巨大影响,但我们从不谈论我们的工 作,可能产生的坏事 是什么。

我们需要诚(chéng)实和开 放,更加公平地对待这(zhè)个问题,但随后继续强(qiáng)调这种平衡,并以(yǐ)某种方(fāng)式防止我们错过机会,我认为由于公众的恐惧,这种机会很容易发生。

陈建宇:我觉得人们对(duì)这个人形(xíng)机器人、或 者(zhě)相(xiāng)应的具身智(zhì)能机器人技术的担忧(yōu),其实核心来(lái)自于对(duì)自身安全性的一个担忧。

安全其实有几个(gè)不同的层次(cì),最底层的层次是物理的安全,大家担心机器人会不会在工作的时候去伤(shāng)害到人,那么(me)这是一个层次;当然其实在 它分(fēn)情况,那么比如(rú)说我们刚才说的如果是工厂里(lǐ)面(miàn)的话,其实如果我们(men)把它跟人工作(zuò)环境隔开,其实一定程(chéng)度上能解决这个问题;同时,我 们也需(xū)要从我们的算法硬件等等(děng)上面做的(de)更鲁棒来去优化这个问题。

那么第二个层次,其实(shí)也是生存上面的问题,但是 不是说物理层面的,那么也是不是(shì)说全人类的一个(gè)担忧,而是说有一部分人一个担忧,他担心这个会替(tì)代咱们的某一些工作,大家会有担忧,我觉得(dé)这个事情可能需要政府或者(zhě)商号进行有一些引(yǐn)导,我们尽量的(de)开始去做一些确实劳动(dòng)力非(fēi)常 紧缺的这样的一些产业(yè),比如说我们(men)一些非常恶劣环境工业环 境,或者是比如(rú)说养老等。

当然(rán)第三个层面(miàn),如果未(wèi)来我们的具身智能机(jī)器人真(zhēn)正拥有了意识,那么这个会对人类的自我存在的价值可能产(chǎn)生一些(xiē)担(dān)忧(yōu),我觉得这个事是(shì)更远的和更大的topic。

王兴兴:我觉得(dé)机(jī)器(qì)人的伦理道德和安全性问(wèn)题,是(shì)非常重要的一件事情,而且我觉得,要(yào)希望(wàng)是在场所有的人都大家需要共(gòng)同(tóng)去维护的(de)一件事情,就有点(diǎn)像(xiàng)现在新(xīn)能源汽车以及无人驾驶(shǐ),它其 实(shí)还是有很(hěn)多安(ān)全 性问(wèn)题,并且比如说(shuō)有一(yī)辆 早些年(nián)新能源汽车起火了,或者有一家新能(néng)源(yuán)汽车(chē)无人驾驶出了交通事故,这个对整个(gè)行(xíng)业影响是非常大的,会降低(dī)普通老百姓对技术行业(yè)的认可度以及信心。

这个事(shì)情很容易发(fā)生在人形机器人和AI这个领域。所(suǒ)以我一直觉得。当下以及未来大家都应(yīng)该在机器人(rén)安全性上(shàng),无论是出台一些规章 政策,或者做一些更(gèng)好的引导,或者需要全世界政府出台一些相关(guān)的政策,都共(gòng)同推动整个行业的 健康发(fā)展。

王鹤:所以(yǐ)我就从技术的角度,人形机器人它(tā)的一个面向终局的技术必然是大模型,那么其实只(zhǐ)有大模型才(cái)可(kě)能实现非常高的通用(yòng)性,把(bǎ)很多能力(lì)全部汇集在一起,把很多模(mó)态,从视觉(jué)感知,到(dào)语言(yán)理解(jiě),到(dào)动作执行,那么融会贯通,那么(me)今天我们在技术上其实是(shì)有方法对大模型的行为进行限(xiàn)制,就是“对齐”,我(wǒ)们在大模型内部已经(jīng)进行了深入研究,那么(me)未来,我们会对语言模型、多(duō)模(mó)态(tài)模 型进行更(gèng)深入的(de)对齐,让它不会(huì)伤害到我们的人(rén)类,并(bìng)且(qiě)他的技能会被局限在服务的(de)范畴内(nèi),那(nà)么这一些是我(wǒ)们技术上能做的,在技(jì)术上之外,必然还需(xū)要政府社会和 国际的 合作。

熊友(yǒu)军:我觉得(dé)前面几位都(dōu)说的都挺好的,我就补充一点,就是说我觉得应该是有一些行业组织或(huò)者 是政府出(chū)来(lái),更多在法律法规这方(fāng)面更多的立法,包括更(gèng)多的是做(zuò)全(quán)社(shè)会的机器人使用、伦理道德(dé)方面的一些(xiē)教育。因为(wèi)我觉得,任何一(yī)个(gè)机器人也(yě)是一(yī)种工具(jù),放在不同人的手上,它的可能有不同的使用方法,然后(hòu)只有(yǒu)加强教育,提升大家对(duì)人工智能对人形机(jī)器人的(de)使用,让大家相对(duì)安全角度去考(kǎo)虑,我觉得才是一个正确的方(fāng)式。

问:您认为 5 年后人形机器人行业会发展到什么程度?哪些经济领域将率先(xiān)使用它(tā)们?

Marc:不(bù),我认为人形机器人的出现让事情变得复杂(zá)。我(wǒ)认为(wèi)机器人(rén)在工业领域的应(yīng)用将取得很大进展。我认为(wèi)机器人的(de)应用非常广泛。人们对此非常关注。正如大家所说,使机器人变(biàn)得越来越好的(de)技术确实正在日趋成熟。我认为工业(yè)将继续取得进步。

我认为人形机器(qì)人本身总体上仍(réng)然非常不成熟。所以我看不到它们。我(wǒ)知(zhī)道你(nǐ)可以看(kàn)看一些人形机器(qì)人公司(sī)与汽(qì)车公司合(hé)作的演示。我认为这在某种程度上是一种炫(xuàn)耀,而不(bù)是一种生产力(lì)。我不知道这是不是题外话。如果你看(kàn)看仓库机器人,你会发现最大的(de)挑战之一是系统集成(chéng),特别是如果它不是围(wéi)绕机器人设计的全新仓库。

我认为许多仓库机器人供应商都在苦苦挣扎,因为他们(men)需要一个系(xì)统集成商,而这(zhè)个系统集成商会消耗掉太多(duō)的预算,因此很难赚钱(qián),这是因为(wèi)运营仓库的 IT 人员并不(bù)想开放他们的系统。在(zài)那里工(gōng)作的(de)人并(bìng)不想改变他们现在做的一切。如果机器人可以处(chù)理每一项任(rèn)务,那就意味着他们仍然(rán)需要一个人来完成任务。使用任何类型的机器(qì)人对行业(yè)来(lái)说(shuō)都具有很大的复杂性。我认(rèn)为这些(xiē)都是重要因素。

说实话,我原本以为 Spot 会取得更大(dà)的成功,但 Spot 的推出只是一次实(shí)验。我们之所以设计 Spot,是因为它能够让你连接自己的传感器,因为我们不知(zhī)道人们想要什么样的传感器。我们之所(suǒ)以设计 Spot,是因(yīn)为它能够让(ràng)你对(duì)它进行(xíng)编程,因为我们不知道现在的(de)用(yòng)户们(men)都有哪些应用程(chéng)序,而我(wǒ)们对它们的使(shǐ)用方式有(yǒu)了更多了解,开发人员正专注(zhù)于巨大机遇(yù),因此 Spot 对人们的接受度确实产(chǎn)生(shēng)了影响。

也许(xǔ)如果我们没有足够的商人,能够提前进(jìn)入并评估(gū)它是什么,我们实际上 是在做一(yī)个实验。也许人(rén)形机器人会有更好的记(jì)录。

王鹤:我觉得我对(duì)人形(xíng)机器人的发展(zhǎn)总体是比较乐观的,那么在未来5年,我们要完(wán)成真正(zhèng)的大(dà)规(guī)模应用,这件(jiàn)事情对于(yú)整(zhěng)个人形机器人仍然是一个先慢后快,其中慢的(de)阶段,那么一个里程(chéng)碑应该是——在5年的时候我们能 达到万台(tái)人形(xíng)机器人级别的应用。

这样的一个市(shì)场大约是对标现在商业清洁(jié)机器人。我们举个例子,在超市(shì)在万达广场在 写字楼一层 ,我们看(kàn)来回(huí)去洗地擦地的机器人,那么领(lǐng)先的这个市场,中国最领先的公(gōng)司(sī)大约是每年出货1万台,那么他(tā)做的事情不(bù)局限做这么(me)简单 的事情,它(tā)能达到在(zài)各种场景,不(bù)管是商超还是写字楼,还是(shì)很多 不同的场(chǎng)景进行清洁,但是当然是平面清洁(jié)。

那么,对于(yú)我们人形机器人来说,我们希望能做到一个立体操作(zuò),但是它的能力可能是局限的,我搬运我就是上货,我就是取货,对吧(ba)?

我(wǒ)没有更多的能力,但是我也要(yào)实现跨场(chǎng)景(jǐng)的应用,可以在超市里、可以在工厂(chǎng)里、可以在服务场景等等。那么能达到(dào)5年1万台的(de)市场规模的话,我相信 后面(miàn)有真(zhēn)实(shí)世界数(shù)据的回流,那时,我们会看到人形机器人应用规模会加快(kuài),从慢时(shí)代进入快时代(dài)。

熊友军:人形(xíng)机器人我(wǒ)对它(tā)的应用可能会更加乐观一点(diǎn),其实大家(jiā)看到这两年人(rén)形机器人的进步非常快,尤(yóu)其在AI驱动下面(miàn),实际上在市场应用方面,你们已经可以看到(dào)国的有一些企业,包括全球(qiú)企业已经开始(shǐ)在一些场景里面做试点(diǎn)应用了。

比如说在汽车厂,比(bǐ)如在一些(xiē)商用服务场景,已经开始做(zuò)试点,随着这个(gè)试点数 据会形成(chéng)一(yī)个 飞轮的效 应,所以试点进展,然(rán)后它会有更多的迭代,然后有(yǒu)更多数据驱动,机器人会在在一些特(tè)定的环境里面提(tí)高效率,它(tā)的(de)速度,它的随(suí)着量的增长,它的价格会大幅的降低,这样我觉得会更快的去促进产业(yè)的应(yīng)用。

我觉得今年年底,大家应该可以看(kàn)到,有一部分的公司(sī)已经能够在一些比如说新能源汽车厂(chǎng),比如说(shuō)在一些特种领域已经开始(shǐ)应用,明年我觉得应该可以(yǐ)看到(dào)一些可能(néng)千台(tái)左右量级(jí)的出货。

问:你能在(zài)我们的年轻观众中“点燃 一把火”,让(ràng)他们(men)也(yě)想 成(chéng)为“机(jī)器人专家”吗?他们应该怎么做?

Marc:我认(rèn)为伊隆·马斯克(kè)本人凭借他的雄心和资源,可能 在几年内推出10000个机器人,不一定是因为(wèi)它们会直接让机器(qì)人(rén)赚 钱,但看(kàn)看他对(duì)电动汽车所做的(de)一切。他们从无人相信到现在(zài),我比(bǐ)这里的(de)任(rèn)何人都更加怀疑,包括我在内波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”,到每家汽车公司都有淘汰内燃机的计划。

我认为这是一件了不起的事情。他似乎对此很认真。所以这在整(zhěng)个人 形机器人领域都是一(yī)个真正不确定性(xìng)的因素。我不确定如果(guǒ)他 没有抓住机(jī)会,是否(fǒu)会有这么多人形机(jī)器人(rén)。

我认为机器人玩得(dé)越有趣(qù),人们就越能与(yǔ)它们互动。我到处走走,我没有带机器人(rén)来这里,但这里(lǐ)有(yǒu)很(hěn)多机器人,但我到处发表演讲,发现(xiàn)机器人在计划中相(xiāng)当无聊。你总是能吸引一群人,只要你愿意让他们与机器人互动(dòng),他们就会(huì)留下来。我认为我们做得越多,公众(zhòng)就会越(yuè)热情。我(wǒ)非常欣慰,参加这次活动最令人兴奋的事情可能是有很多人说你做的工作是我十几(jǐ)岁(suì)时见(jiàn)过的,现在我正在做。我们越能(néng)展示我们(men)的工 作并激励下一代(dài),这就会实现(xiàn)。

陈(chén)建宇:我的一个建议是,因为机会(huì)其实永远是留给有准备的人,那么像(xiàng)Maec做这个事(shì)情做了做(zuò)了好几十年,然后包括我们(men)其实台上我们几位也都是多年深耕在 机器人或者相关领域,所以说,因为人形机器(qì)人它其 实也是一个非常长周期的事情,同(tóng)时它也包罗万象,从(cóng)技术上的软 件、硬(yìng)件、AI再到商(shāng)业、产品等等(děng),其实各方面(miàn)都有,所以说大家应该去问一(yī)问(wèn)自己的(de)内心在这一步范围内到底自己最有(yǒu)激情,最(zuì)喜欢的最(zuì)热爱的是什么?然后从此刻(kè)开始就去积累它 。最后,要么等待未来,要么总有(yǒu)时刻你有施展自 己的机会。

王兴兴:对于我觉得对(duì)于所有年(nián)轻人(rén),包括(kuò)我们其实这个时代都是非常精彩的,而且想象一下,大(dà)家也知道AI、机器人都(dōu)是阶(jiē)梯(tī)性(xìng)发展,就像GPT没有出来之前,大家觉得语言模型没什么(me)用,基本上是 非常差,但突然就是(shì)发生了巨(jù)大进步,非常好,其实机(jī)器人、AI也(yě)会遵循这种规律,所以大家 现在可能看 到机器人(rén)的 AI 能(néng)力都比较弱,但实际上这是好事,为什么?因为大(dà)家都有机会去做的更好,可以真正的把(bǎ)这种(zhǒng)人类目前可以预估的最伟大技(jì)术(shù),就在当(dāng)下,就在未来几(jǐ)年,所以这个事情都是非常值得做的,

而且,在机(jī)器人和 AI 另外一个比较适(shì)合年轻的点,它没有那么多历史包(bāo)袱,不像数学领域,有几(jǐ)百上千年的(de)非常天才的数学家,你(nǐ)一(yī)定要比他们(men)做得好,你(nǐ)才可以做(zuò)技术,但是当(dāng)下,AI 和机器(qì)人它都非常(cháng)年轻,尤其(qí) AI 技术就最近几年的东西,所以非常适合年轻人。我一直感觉在如果在(zài)未来5年到10年或者几十年(nián)回看我们现在这个时代,所以想想这种(zhǒng)感觉,真的非常激动人心。

王(wáng)鹤(hè):我觉得其(qí)实(shí)未(wèi)来的15年,在我心目中会是人形机器人,从当下在产业中没有规模化应用(yòng),到可能成长到跟今天汽车的产(chǎn)量(liàng)一个万亿(yì)市场(chǎng)的过(guò)程。那么(me)在这(zhè)个过程中,其实对年轻人(rén)来说,那么我觉得大(dà)家就是做好自己就可以了,因(yīn)为15年之 后很多工作都是跟人形机器人相关的,今(jīn)天可能(néng)你负(fù)责卖(mài)车,那么15年后,你可能岗位就(jiù)调到卖人形 机(jī)器人对吧?今天你(nǐ)是班级里头的佼佼者,那么(me)你学 AI ,那么你可能发现你的职业生(shēng)涯就是围绕着进一步提升(shēng)人形机器人(rén)的能力展开的,所(suǒ)以大家做好(hǎo)自己,我们一起共享光 明、人形机器人的未来。

熊友军(jūn):其实我是经(jīng)历过个人电脑时代(dài),我经历智(zhì)能手机时代,我(wǒ)经历(lì)过移动互联网的时代,现在其(qí)实我们正在经历智能汽车的时代,电动汽车的时代,我觉得下一个时代实际上就是聚生智能(néng)的时代,而聚生智(zhì)能时代的典型代表其(qí)实就(jiù)是(shì)人性机器人,所以我给现在(zài)的年轻人建议就是说保持野心,怀揣(chuāi)大梦想。

问:让我们在小组成员之间(jiān)花(huā)几分钟时间讨论一下:你们(men)想(xiǎng)要互相问什么问题(tí)?

陈建宇:所(suǒ)以我想问Marc,你认(rèn)为对于机器人和人(rén)工 智能来说最重要的研究问题是什么,例如,如果(guǒ)你 只能选择一个研究项目,那(nà)么你选择哪一(yī)个(gè)?

Marc:让我从侧面回答一下,这也(yě)是一种回避你的问题的方式。最后我没有展示我的最后一张幻灯(dēng)片。我(wǒ)的最后一张幻灯片是一(yī)个(gè)展示机器人故(gù)障的视频。它展(zhǎn)示了,我不知道它大概有 2 分钟长,可能有 25 种不同的故障。我(wǒ)认为故(gù)障 是工作中 最有趣、最有意思、最有用(yòng)的部分,关(guān)注它们,然后在你的工 作不工作的时候(hòu)继(jì)续(xù)前进,这真的很(hěn)重要。这不是研究的主题(tí),但它是一种工作精(jīng)神。所以(yǐ)如果我要问你们(men)所(suǒ)有人这个问题的话,那就是(shì)我还没看到任何(hé)人在(zài)演讲中提到过事(shì)情无法正常运 转,而且我敢肯定,单一机器人不会在不发(fā)生碰撞的情(qíng)况下完成那些后空翻以及它们所做的所(suǒ)有很酷的事(shì)情。你喜 欢碰撞吗?

王兴兴:Marc先生(shēng),很荣幸今天见到(dào)您,我其(qí)实想有好奇(qí)想问一下,您觉得对于人形机器人的手,您觉得未来几年比较合适的有(yǒu)几个手指,或者几(jǐ)个电机,这会是比较好的一(yī)个(gè)方向?

Marc:再次,我 要(yào)回答一个略(lüè)有不同的问题。我们(men)研究所最近举办了一场研讨(tǎo)会,名为“对操纵的反向观点”。我认为(wèi)灵巧性确实很重要,但基(jī)本上它并没有(yǒu)取得很大进展,尽管人们至少已经为此努力了 50 年(nián)。我认为我们必(bì)须以不同的方(fāng)式思考,再次(cì)尝(cháng)试不同的 东西,就像我今天在演讲中开始的那样(yàng),也许我(wǒ)们需(xū)要更多的动态操纵,而不是所有的静态(tài)抓握(wò)。我认为很多学习界的人在提出他(tā)们正在学(xué)习的灵巧(qiǎo)性(xìng)的要(yào)求时对自己要求不够。他(tā)们做的事情很简单,很(hěn)容易。

我认(rèn)为那里是有机会的,有多少只手我不(bù)知道有多(duō)少根手(shǒu)指。我认为(wèi)五个已经很多了。但也许有一天我会觉得更有(yǒu)趣的问题是手掌(zhǎng)怎(zěn)么样?我们的手掌功能非常强大,它们不仅仅是(shì)静态(tài)的块。而且你看到的几乎每个机器人手都(dōu)有许多手指(zhǐ)在做这件事,但仅此而已 。

王鹤(hè):之前我提到过,大概 15 年后,世界上会有数(shù)百 万、一千万个人形机器人。如果人(rén)形机器人(rén)具有(yǒu)通用(yòng)目 的,那么人形机器人(rén)是终极体现,那么这种通用目的的终极技术是什么?对于人类噪音,您是否认为视觉、语言、动作模型(xíng),这些端到端模(mó)型是人类噪(zào)音的(de)终极技术或(huò)方 法?

Marc:我很难相信,端到端是取得进步的方 法。也许最终在渐近线上端(duān)到端是正确的方(fāng)法,但 我认为我们知道的太多了。

说实话,我认为人(rén)们过分看重(机器)学习。我知道应该对学习持乐观态(tài)度,但如(rú)果你看看当今存在的解决方案,你会发现最好的解决方案中学(xué)习所起的作用微不足道或微不足道。当(dāng)然,在波士顿动力(lì)公司,今天(tiān)学习很少,尽管人们(men)正在努力(lì)。我认为控制 系(xì)统、控制理论、观察器,这(zhè)些在(zài)过去 20 或(huò) 30 年建立起来的东西仍然发挥着巨大的(de)作用。

我不想就(jiù)这样把它抛弃(qì)。我希望我们能真正拥抱学习,但要把它与我们已经知道的东西结合起来,找到一(yī)种方法把它们结合起来,至少在(zài)接(jiē)下来的5年(nián)或(huò)10年里,也许在渐近线上(shàng),情况会有所不同。

熊友军(jūn):我的一个问题(tí)是,Marc作为波士顿动力 的创始人,您之前开发了像Atlas这样的非常令人(rén)惊(jīng)奇的这种产品,但是(shì)我 们(men)前(qián)不久我们看到(dào)波(bō)士顿(dùn)动力终止了这个机器的研发,然后(hòu)由原来的液压驱动,转向纯电驱动的这种方式。对这方面是出于什么样的考虑?是因为成本的 考虑(lǜ),还 是因为出于商业化的考虑?同(tóng)时我还想知道,波士顿动力未(wèi)来5年的一些这种计划,对商(shāng)业(yè)化的一些计划。

Marc:我认为,如果你问为什么要进(jìn)行转变,我认为有(yǒu)两个关键因素:一个是液压机(jī)器人,我喜欢液压技术,我会(huì)用液(yè)压技术制造很多(duō)机器人。我认为,建造人形机器人(rén)或类似(shì)人形机器(qì)人仍有空间(jiān),它们将继续(xù)使用液压技术,因为重量和强(qiáng)度等因素。

但我认为(wèi)有两点。一是它们很麻烦,至少对于像 Atlas 这样的高性能机器(qì)人来说,尽管我们付出了无尽的(de)努力 ,也永(yǒng)远无法让它们完全不漏油(yóu)。当(dāng)你把(bǎ)石油机器人放到工(gōng)厂和(hé)家里时,它们就不能滴油;同时,很难找到精通(tōng)液压技术的人,因为人们认为这是非(fēi)常(cháng)古老的(de)东西,尽管 Atlas 在液压(yā)工作原理方面有很多创新,从服务器阀门到 HPU 液压(yā)动力装置,一直都是如此(cǐ),确实有创 新的东西在进行;最后,我认为电动汽车(chē)在规模上已经足够强大,它们(men)可(kě)以参与竞争(zhēng)。我不(bù)想代(dài)表波士顿动力发言,尽管我(wǒ)是创始人之一(yī),并(bìng)且(qiě)仍(réng)然是(shì)董事会成员,但我认为他们必须(xū)有自己的计划,说明未来的计 划以及技术(shù)的(de)所有细节。我想随着事情的发展,你会(huì)发(fā)现(xiàn)更多这方面的内容。

主持人:非常感谢。我想观众肯定会(huì)有更多问题,也许吧,但(dàn)我 们的时间(jiān)真的不多了(le)。所以非常感谢各(gè)位小组成员(yuán)。非常感(gǎn)谢(xiè)观众的到来和聆听。我认为这是一场非常精彩的会议,尤其是小组讨论。我对组织者的建议是,我(wǒ)们明年再(zài)举办一次类似的会议,然后我(wǒ)们可以回(huí)顾(gù)进展和未来的步骤。

未经允许不得转载:橘子百科-橘子都知道 波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

评论

5+2=