波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”

8月(yuè)24日(rì)下午，2024世界机器(qì)人大会上，举行了一场期待(dài)已久的(de)中国、美国(guó)“具身智能”与(yǔ)人形机器人领(lǐng)域(yù)学者的(de)“世界对谈”。

大名鼎(dǐng)鼎的“机器狗之父”、美(měi)国波士顿动力(lì)创始人Marc Raibert（马克·雷伯特）首次来到北京(jīng)。他说，“我简直(zhí)不敢相信，不仅是机器人的数量，难以置信(xìn)，还有这么多热(rè)情(qíng)的人参加(jiā)了展览(lǎn)。中国对机器人的兴奋和(hé)热情很高。”

而此次与Marc对谈的四位CEO所(suǒ)在的公司(sī)也不寻常：除(chú)了宇树(shù)科技之外，星动纪元、银河通用、北(běi)京具(jù)身智能机(jī)器人创新中(zhōng)心都成立不足2年(nián)，一(yī)出道就是具身智能和(hé)人形机器人行业的“顶流”。

而且(qiě)，星动纪元、银河通用背后也站着中国最(zuì)高学府：北大和清华，代表着中国前沿(yán)科技创新的重要来源。

其中，星动纪元(yuán)由(yóu)姚期智带领(lǐng)的清华大学交叉信息研究院孵化成立的，星动纪元(yuán)创始人(rén)陈建宇现在还(hái)是清(qīng)华大(dà)学交叉信息研(yán)究院助理教授，公司融资超亿元，联想创投已加入其中。

银河通用机(jī)器人创始人的王鹤则是北京大学助理教授，也是北京(jīng)智源人(rén)工智能研究院(yuàn)具身智能研究(jiū)中心(xīn)主(zhǔ)任，过去半年，银河通用完成天使轮融资共(gòng)计7亿(yì)元人民币，刷新了国内人(rén)形机器人领域单轮(lún)融(róng)资规模，美团战投、北汽产投、商(shāng)汤国香基金、讯飞基金、启明创投、蓝驰(chí)创投、经纬创投、源码资(zī)本、IDG资(zī)本等头部财务机构都(dōu)参与(yǔ)其中。

而北京具身智能机器人创新中心(xīn)则是北(běi)京市(shì)发起成立的机器人“国家队”机构。北京具身智(zhì)能机器人创新(xīn)中心总经(jīng)理熊友军(jūn)，目前还是“人形(xíng)机器人第(dì)一股”优(yōu)必选科技CTO。

Unitree Robotics（宇树科技）也是当下人形(xíng)机器人行业的明星企业。公司创始人、CEO、CTO王兴兴毕(bì)业于上海大学(xué)，取(qǔ)得了机械(xiè)工程(chéng)硕士，具有近10多年足式机(jī)器人研(yán)发(fā)经验(yàn)，拥(yōng)有产品从0-1-100的研发(fā)与商业化落地能力，100+项机器人相关专(zhuān)利。

此次圆桌由(yóu)德(dé)国慕尼黑工业大学(xué)教授 Alois.C.Knoll主持，美国波士顿动力创始人Marc Raibert（马克·雷伯特），与中国四大AI机器人企(qǐ)业领军者——陈建宇、王兴兴、王鹤、熊(xióng)友军(jūn)，五人围(wéi)绕机器人行业(yè)、AI 大模型(xíng)驱动机器人发展等议题展开讨论。

一个多小时的圆桌当中(zhōng)，Marc表示，未来(lái)5年，机器人硬件发(fā)展仍将(jiāng)非常重要，但同时，能够打破语义理解(jiě)障碍的基础模型或(huò)其他 AI 方法也将(jiāng)对机器人技(jì)术(shù)产生更大(dà)的影响。不(bù)过，要想(xiǎng)取得机器人领域真正的进步，就需要更高的可靠性和安全性，未来(lái)人(rén)们需要投入大量资源努力解决此(cǐ)类问题。

Marc非常不看好人形机器人行业。他认为，工业机器(qì)人已经非常成熟，而且能够商业(yè)化，目(mù)前人形机器人“在某种程度上是(shì)一种炫耀，而不是一种生产力”。

陈建宇(yǔ)表示，过去10年AI发(fā)展(zhǎn)很快，从简单的图像处理，到(dào)深度(dù)学习、强(qiáng)化学习，再到ChatGPT技术，这对(duì)于未来“具身智能”产生很大(dà)的影响。未来几年，AI、具身智能会与(yǔ)人形机器人不断(duàn)融(róng)合，去训练一个通用模型。他相信未来(lái)5年，我们将迎来“机器人的ChatGPT时刻”。

王鹤指出，当前 AI 大(dà)模型在机器人上仍有巨大的局(jú)限，尤其是“泛化的(de)开瓶盖(gài)”技能还(hái)没有训练出来，但同(tóng)时，这也是大模型带来了重要机会，一旦(dàn)大模型涌现能力不断加强，他认为未来5年，依然有一个至少(shǎo)做(zuò)操作任务的通用机器人机会。

熊(xióng)友(yǒu)军表示，当前关节性能(néng)提升、高的能量和电池密度的提升非(fēi)常快，使得机器人的(de)运动控(kòng)制能力、电机等方面提升非常快(kuài)。未来5年(nián)，机器(qì)人关节和能量密度会持续提升。毕竟和人类相比，现在机器人的(de)能量执行效率还是有非常大的差距(jù)。

以下(xià)是(shì)钛媒体AGI编辑(jí)对(duì)此次圆桌全文(wén)整理：

问：您能否向观众简单介绍一下您的工作：您为什么以及什么时候开始对人(rén)形机器人感兴趣的？

Alois：我从 2001 年开(kāi)始担任慕尼黑大学的教授。我对人类(lèi)噪音的一个方面产(chǎn)生了兴(xīng)趣，那(nà)就是(shì)具象化，对吧？我的(de)朋友 Pfeiffer 和我们一起(qǐ)从大(dà)学毕业。苏(sū)黎世退休了，不幸(xìng)的是，我们坚信具象化。所以我(wǒ)们认为，在我们的人类类型中，智力只会在(zài)以非常自然的方式与世界(jiè)相连的人类类型身体中(zhōng)发展。所(suǒ)以身体(tǐ)应该有(yǒu)同样的动力，同样的尺寸，等等。否则，就很难做到这(zhè)一点(diǎn)，你在这里(lǐ)看到(dào)的 Kronos 系列机器人，左边，左下角的 Roll Boy2024 就是这种信念的结(jié)果(guǒ)之一。

Marc：我认为你贴出的(de)那张图(tú)片对我回答这个问题很有帮助(zhù)。如果(guǒ)人形(xíng)机器人意味着两只胳膊、两条腿直立向前，那么直到最(zuì)近我才(cái)对(duì)此感兴趣。事实上，我一直认为现在(zài)的公司注重功能性，作(zuò)为一名教授，我认(rèn)为(wèi)功(gōng)能性才是最重要的，机动性、灵巧性、感(gǎn)知力和智能，而外形(xíng)和外(wài)观则是次要的。另一(yī)方面，如果(guǒ)人形机器人意味着像腿一样的(de)动态生命，我会把它与世界互动。我一(yī)直是人形机器人(rén)的粉(fěn)丝，尽管我(wǒ)建造(zào)的第一个机器人是弹簧单高跷的东西。我认为人(rén)形机(jī)器人的许(xǔ)多基本要素都在那(nà)些弹簧单高跷的东西中。确实，当我们开始建造机器(qì)人时，波士顿动力公司是直立(lì)的，有两(liǎng)条腿，两(liǎng)只胳膊。有时领先。如果你看看公众的反应，你会(huì)发(fā)现 YouTube 点击量增加了 10 倍，我非常关注这些点击量或评(píng)论(lùn)，或者只是人(rén)们的态度。人们非常感兴趣。普通的非(fēi)科学家，比如说，非工程师，他们对人形(xíng)机器人很感兴趣(qù)，而狗惹(rě)恼机器人却得不到同样的赞誉。

熊友军：我是从读博士的时候，2000年开始做(zuò)机器人的研发(fā)，当时读博士(shì)的时候，那时候更多(duō)的是做工(gōng)业(yè)领域、特种领域的(de)一(yī)些机器人，用在一些危险的环境里面(miàn)，因为那(nà)时候机器人技术(shù)还是非常不成熟，但在很多特种领域和危险场景里面，是需要用机器人去完成工作了(le)，然而那时(shí)候机器智(zhì)能实际上是很差的。所以我们当时想的办法，是将机器人的智能跟人的智能结(jié)合起(qǐ)来，所以做(zuò)了一些机器(qì)人(rén)要操作的一些事情。

但在遥控操作完成这些工作的过程中(zhōng)，我们发现有很多的场景，实际上用轮式的工业机(jī)械手臂是解决不了的，尤其是有时候在一(yī)些(xiē)特种场景环境比较狭小，然后(hòu)环境比较复杂的轮式，然后履带式实际上根本就进不去，但是人是可以进去。还有(yǒu)一种，是要试用(yòng)很多工具(jù)去完成那(nà)些工作。

所以当时我们就觉得，如果说有微型机器人的话，实际上应该是能够提供(gōng)很好(hǎo)的解决工具，或者一种解决方(fāng)案，但(dàn)是(shì)我们当时那时候(hòu)也看到了日本(běn)本田ASIMO，给我们提供了很多的一些启发，所以(yǐ)那时候我就(jiù)对人形机器人非常(cháng)感兴趣。后面毕业之后，一直在做(zuò)机器人相关的工作(zuò)，

2012年，我跟优必选科技CEO周剑先生创立了公司，做人形机器人研发(fā)工作，去年从深圳到北京开始筹建(jiàn)具身智能机器人创新中心(xīn)，现在也是一直在聚焦人形机器人方面的研发，主要的想法是希(xī)望(wàng)说能够解决(jué)人形机器人方面的一些共性(xìng)、关键的技术(shù)问题(tí)，比如本(běn)体的(de)一些(xiē)基础研发不足，其实我们现在微(wēi)型(xíng)机器人(rén)在本(běn)体在关键的核心器(qì)件，然后在一些传感器方面其实上有非常多要攻克的地方。另外在运动控制，实际(jì)上我们也(yě)做了非常多的运动控制的技术(shù)研发，采用深度(dù)学习强化学习的这种运动控制的方式，包括现在也用一些融神经网络的一些方式用去做(zuò)运动控制，同(tóng)时其实我们现在还(hái)在做关于智能方面(miàn)的一些研发，比如(rú)说把用现在具身智能的方式，做一些(xiē)基础性工作，比如建(jiàn)它(tā)的数据集，研发机器人大模型框架等(děng)。所以这(zhè)就是现在我在做的一些事情。

陈建宇：其实这个兴趣是很小的时(shí)候，就一直对智能机器人非常感兴趣，我印象很深刻，刚刚兴兴说她10岁的时候，我估计也是差不(bù)多(duō)类似的(de)时间，不过当时看的不是波士顿动力，当时关注的是ASIMO系列机器人，当时我就非常的去着迷。然后我觉得(dé)，创业这件(jiàn)事(shì)其实(shí)是充满了挑战性的(de)，marc创办(bàn)了波士顿动力做了40多年，其实我是非常尊敬的，就是说你没(méi)有一个发自内心的、天(tiān)生热爱的话(huà)，其实(shí)很难去坚持下来的。所以对我来说，对这类机器(qì)人的热爱，我觉得某种程度上是从(cóng)小就具备就拥(yōng)有的。

那么(me)真正开始做机器人其实是本科的时候。当时在学校里面，我就接触真正(zhèng)意(yì)义上的机器人的研究，当时接触了双(shuāng)足机器人，主要(yào)是做的就是捕获点步态规划相关的研究。后来，博士阶段继续做机器人，虽然不是(shì)人形机器人，但是(shì)也是相(xiāng)关的一些机器人(rén)的(de)领域，控制它的学(xué)习，包括无人(rén)车和机械臂。而真正(zhèng)的去(qù)全力做人形(xíng)机器人，是在我(wǒ)回国之后，然后在现在清华正式投入(rù)去做(zuò)人形机器人，还孵化了星动纪元公司，如今我们已经做了最新一代、第六代机器(qì)人了，然后我们也在展(zhǎn)会上面带来了我(wǒ)们机器(qì)人的实物，欢迎(yíng)大家去关注(zhù)。

王兴(xīng)兴：大家好，我是宇树科(kē)技(jì)创始人王兴兴，刚才有提到我大概可能10岁的(de)时候(hòu)就看过marc先生在MIT实验室做的双足，还有(yǒu)单条腿的机器人(rén)，然后印(yìn)象非常深，在09年、10年的(de)时候，大概大一寒假，我就做过(guò)一个小的人形机器人(rén)，然后当时做的不是特别满(mǎn)意，然后后来的话，就在(zài)研究生期间做了XDog这款机器人，差(chà)不多(duō)在13年到(dào)15 16年，这款机器人的话又采用了比(bǐ)较低成本的硬件，然后运动性能非常好，可以直接实(shí)现关节的力控以及整机的力控(kòng)。

后来的话，一开始我对人体(tǐ)机器人的技术还(hái)是跟相(xiāng)对来说(shuō)比较悲观的，但是后来的话在(zài)2022年左(zuǒ)右，整个的(de)机器(qì)人、AI技术的进步，然后再加(jiā)上(shàng)ChatGPT出来(lái)以后(hòu)，大家都看到人形机器人和AI结合的可能性(xìng)，所以说我们公司(sī)又重新开始做人形(xíng)机器人。说(shuō)实在的，其实(shí)我真正感兴趣的并(bìng)不是说人形(xíng)机器人，而是新(xīn)的一个(gè)智能(néng)体机(jī)器人的形态。而(ér)人形机器人可能只是说(shuō)目(mù)前大家比较公认的、一(yī)个最有(yǒu)可能性的通用机器人和通用(yòng)AI的结合体(tǐ)，但是这可(kě)能并不是个唯一的，我真正(zhèng)希望(wàng)能诞生甚至更(gèng)比人(rén)更(gèng)高(gāo)级(jí)的一个智能体形(xíng)态，可以大(dà)大推动整个人类工业的变革，推动新的工业革(gé)命。

王鹤：我是北京大学计算机学(xué)院(yuàn)助理教授，也是北大银河通(tōng)用具身智能联合实(shí)验室的主任王鹤，那么，我(wǒ)跟(gēn)人形机器人、具身(shēn)智能结缘，主要是从我在斯坦福大学(xué)开始读博的时(shí)候。那么2016年的时候(hòu)，当时深度学习技术已经出来了(le)，也应用在很多图像识别分类这些任(rèn)务当中。那么当时作为一个(gè)前沿研究，我们试图去理解人类是如何把感知思考还有交互的能力融合在(zài)一起的。

所以我博士期间的第一个工作(zuò)，就用一个视觉模型来看桌面上人的动作和物体的一个(gè)运动，然(rán)后推(tuī)理人下一步想要什么，这是一个语言模型。

最后(hòu)再用一个简单(dān)的机器人，智能的(de)马克杯去响应(yīng)人的动作，那么(me)这个工作获得(dé)了欧洲图形学的(de)最佳论文(wén)提名，但是我们认(rèn)为它非常的(de)不(bù)足，就是我(wǒ)们的一个马克杯只能在桌面上(shàng)移动响应人的动作，它没有跟人交互的能(néng)力，我们的视觉只能看有限的几一种物体，那么我(wǒ)们的语言模(mó)型(xíng)只能(néng)根据这(zhè)个人跟这些桌面东西的一些动作来做简(jiǎn)单的推理。

那么通过过(guò)去8年我们的研(yán)究，在怎么样把机器(qì)人的(de)操作(zuò)能力搞得更泛化，什么东西都能抓(zhuā)，都能够放置，那么还有跟现在的多模(mó)态大模型技术结合(hé)，真(zhēn)的明白人类(lèi)想让你干什么，那么(me)言出法随的去执行，所以去年我(wǒ)们就孵化了北京银河通用这(zhè)家人形机器(qì)人公司，我们现在也是把视觉、语言、动作这三种不同的模态融合到大模型当中，真正的赋能人形机器人，让人形机器(qì)人能够走进千行百业、千家万户，这是我(wǒ)们的愿(yuàn)景。

问：你认为，我们今(jīn)天拥有(yǒu)的哪(nǎ)些(xiē)重要技术是 10 年前没有的(de)，但对于实用的人形(xíng)机器人来(lái)说却至关重(zhòng)要？它(tā)们在未来(lái) 5 年将如何发展(zhǎn)？

Marc：我认为硬件开发仍将非常重(zhòng)要。如果我们谈论未来 5 年，毫(háo)无疑问，能够打(dǎ)破(pò)语义理解障碍的基础模型或其他人(rén)工智能方法(fǎ)将产生最大的影响。

我认为，人(rén)类可以做的就是，概(gài)括和理解他们所看(kàn)到事物的含义，而目前还无法真正(zhèng)捕捉到这些含义。我相信，如果人工智能能够在这方面取得进展，我认为它(tā)将产生巨大的(de)影响。

实际上，过去十(shí)年来，每个人都在计算机、传感器、感知、控(kòng)制等方面取得了巨大进步。电池，我认为人们忘记了电(diàn)池。虽然电池是工业时代(dài)的产物，但是它们(men)确(què)实非常重要。是的，所以在电机方面过去 5 年里，人们做得很好，我认(rèn)为电机(jī)已经取(qǔ)得了长足的(de)进步，当然(rán)，我们将看到更多。

陈建宇：我(wǒ)从(cóng)AI的视角来讲一讲(jiǎng)，觉得非常大的一个(gè)不同。如果(guǒ)按照10年前的话，其(qí)实是(shì)2014年左右，当时是DeepLearning刚刚出来不(bù)久，它其实解决了(le)很大一部分，比如(rú)图像(xiàng)处(chù)理等等(děng)一些问题。

那么后面(miàn)，其实有我认为两个最重要的里程(chéng)碑：一个是以16年阿尔法(fǎ)狗为代(dài)表(biǎo)的深度学习，紧接着把它用在了强(qiáng)化学习上面，做(zuò)深(shēn)度强化学习，解决了一些问题；第二个是(shì)以ChatGPT为代表的大语言模型(xíng)，所以这点我认为(wèi)是过去(qù)10年没有的，但(dàn)又对(duì)未来我们人(rén)形机器人，或者是具身智(zhì)能起到非常大的(de)决定性作用的两个因素。

那么可能在接下来的这几年时间，这两项技术会非常深度的跟人形机器人、具身智能融合起来，但(dàn)他们也分别需要经过一定(dìng)程度的(de)训练，从而能训练比(bǐ)较(jiào)通用(yòng)的一个模型，那么我们(men)也能(néng)解决更加丰富的物(wù)理世界的数据程序。那(nà)么我(wǒ)相信，在接下来的5年(nián)，这(zhè)几项技术都能起到非(fēi)常大的一个进展，我们可能会在5年内(nèi)迎来“机器人的ChatGPT时刻”。

王兴兴：对过去10年最大的，还是AI技术带来的各种事情(qíng)有(yǒu)更多的(de)信心。我觉得(dé)除了 AI技术本身最大的点，对于人形机器人，对于整个社(shè)会共识(shí)的增加也是非常关键的，就是目前大家更加相信AI，更加相信人形机(jī)器人可以诞生更多价(jià)值(zhí)，这在10年前是完全不能想象的，那时整个社会基本(běn)上对此都(dōu)完全没有信心。

另外一(yī)点的话，我觉得在未(wèi)来5年，总体上是肯定整个 AI 机器人、AI模(mó)型变化会非常快，因为目前的AI真的是(shì)日新月异，大(dà)家可以(yǐ)用AI集成技术，去搭建(jiàn)各种自(zì)己的模型去做(zuò)训练，这整个已经变成一个非常的扁平(píng)化，以及容(róng)易操作的过程，其实很多人大家都可以(yǐ)参与进来，去做机器人模型并且去做训练，所(suǒ)以我觉得。未来5年这块(kuài)的各种(zhǒng)AI模型创新，包(bāo)括更新的一些(xiē)神经网络模型(xíng)，包括脉冲神经网络(luò)等都有很大的一些机会。

王鹤：我(wǒ)觉得(dé)10年好快，10年前是2014年，其实我们已经看到inbody的AI，甚至不是一个(gè)在西(xī)方的学术界比较popular的词(cí)汇，那么过去的十年，我觉得一大技术(shù)的进展，就是我们在具(jù)身智能里头已经(jīng)有一些技能实现了非常强的泛化性。

那(nà)么以我个人的研究(jiū)举例，在抓取问题上，我们取得(dé)了比较长足的进步，那么我们从只能抓方块圆(yuán)的这些特定形状的物体，到基于三(sān)维视觉传感器，我们可以抓不透(tòu)明(míng)、不反光(guāng)，也就是在深度传感器里头能完美成像的(de)这些物体，到我(wǒ)们最近的技术能够预测透(tòu)明、高反光(guāng)、金属(shǔ)、吸光这些(xiē)非常有挑战材质的物体，基(jī)于它去做泛化抓取操作(zuò)。

那么在今天(tiān)的展厅，我们(men)都接(jiē)受观众给我们的各种形状，各种材质(zhì)随便堆叠乱(luàn)七八糟(zāo)的物(wù)体(tǐ)，我们(men)的机器人(rén)都(dōu)展(zhǎn)示了非常泛化和高成功率的抓取能力，那么现在的问(wèn)题是，像这样的每一个技能，大家都(dōu)在分分别的(de)去做开(kāi)发，那么很多人会提(tí)问你能帮我抓水瓶，你能不能(néng)帮我把瓶盖给拧(níng)开？我非常不好意思的(de)说，现在泛(fàn)化的开瓶盖技能我们还没有训练出来，这个就是大模型能够带给我们(men)的机会，那么大(dà)语言模型涌现，也就是这种紧急行为紧急行为，他(tā)能够在只见(jiàn)一次(cì)或者是第一次零次的演示的情况下，他都理解(jiě)你要生成什么样的(de)文字，我们相信未来的5年给我们的机会就是发展机器人基础大模型，它能够实现涌现能力，它吞吐足够量的数据后，有灵巧手，它能够抓(zhuā)能(néng)够加(jiā)、能够拧，能够掰各种基本的手的(de)各(gè)种运动能力都有了以后，他能涌现，我们给他看一个视频，他就能理解(jiě)这个(gè)活怎么干，到那(nà)个时候我们真正的就有一(yī)个通用的、至少做操作任务(wù)的的机器人了，这是我认为未来5年的一个机会(huì)。

熊友军(jūn)：我觉得这一轮的机器人(rén)技术的进步(bù)主要是(shì)由AI来驱动的。毫(háo)无疑问， AI驱动我觉得体现在几个方面。

第一个(gè)就是它人机交互性能得(dé)到了极大的提升。我记得(dé)10年前我们做(zuò)人工智能、做机器人的时候(hòu)的(de)那些交互，如果说我要加语音加视觉，第成本非常高，第二个我们要(yào)做大量(liàng)的研发的工作，我们需(xū)要(yào)几个博士、硕士带着一个团队，花很长的时间才能够完成一些物体(tǐ)识别、语音合成，自然语言理解NLP，还有甚至是TTS、语音合成等方面的(de)一些工作，甚(shèn)至包括导航，但是我觉得，现在随着技术的进步，我们现在做人形机器人的(de)大模型，我们直接一个端到端(duān)的直接语音给指定给他，然后很快他就可以有比较好的行为输出，有(yǒu)很好(hǎo)的(de)意图理解，然后做任务规划等。这是一方面，我(wǒ)觉得这一轮对(duì)人机(jī)交互、对动物的规划(huà)、对执行(xíng)等方面(miàn)都有巨大提升，在10年(nián)前(qián)基本上都很难去想象。

然后第二个(gè)现在的这些硬件方面也有极大的提升(shēng)，体现在两个方向，第一个现在关节的性能的(de)提升是非常(cháng)快的，大家可(kě)以看到很多公(gōng)司机器人可以开(kāi)始去做一些非(fēi)常动态(tài)的(de)、剧烈的运动，实际上离不开关节性能的提升、高能量密度比，然后高的转速、高性能(néng)等这些技术的提升，实际上，在10年前我觉得是很难去做到(dào)的。当然(rán)了这也有运动控制能力的提升、电机的提升，现在其实也有采用更多结构设计的方(fāng)式，更适合它的布局等方面都有非常(cháng)大的进(jìn)步，包括把腿(tuǐ)的转成(chéng)惯(guàn)量、把电机往上提等等，有各种各样的结(jié)构设计(jì)的技术的变化。

另外，刚才还提到能(néng)量，其实早前(qián)我觉得10年前我们做机器人的(de)时候(hòu)，一个电池就像我们背后要背一个非常巨大的电池包能源包，而且能够持续的时间(jiān)很短。但是这几年(nián)随(suí)着(zhe)新能(néng)源汽车对电池技术的推动作用，其实(shí)我(wǒ)们看到它的电池(chí)能量密度大(dà)幅提升，我现在一个比较(jiào)小的电池，可以支持比较(jiào)长的时间，我觉得(dé)这是一个非常重要的技术突破。

未来，我觉得5年之后(hòu)，这几个可能还是一个重大、要突破(pò)的方向，像刚才说的人机交互方面，我们(men)希(xī)望大模型(xíng)能提供更长(zhǎng)期的(de)任务规(guī)划，然后做意图理解等等方面，我觉得我们能只要给他一个非常模糊(hú)的(de)指(zhǐ)令，他就可以给我们输(shū)出我们(men)很标准的很(hěn)自然的这种交(jiāo)互的结果。第(dì)二方面(miàn)，可能就是在(zài)规划实施任务(wù)方(fāng)面是一个非常重大、要攻克的方向(xiàng)，我们环境会经常变，面对的是(shì)一个动态环境，然后机器人能够(gòu)根据环境变化，能够实时(shí)去改变它的一些执行策略等(děng)。当然，像能量方面我(wǒ)觉得是一个持续要提升的，它毕竟现在能量(liàng)执(zhí)行效率和我们人(rén)相(xiāng)比，还是有非(fēi)常大的一个差距。

问：大规模(mó)部署人形机器(qì)人需要完成哪(nǎ)些任务？

Marc：但是如果你现在从更宏观的(de)角度来看，我刚才说了如果你想致富你现在就不会着(zhe)手开公(gōng)司，但是如果你想生(shēng)存下去。你至少也得收(shōu)支平衡。

我想这(zhè)是一个更长远的计划，我认为(wèi)要想取得(dé)真正的进步，你必须暂停，或者我(wǒ)不是说你必须暂停，我们在我的研究所暂(zàn)停，让机(jī)器人(rén)更可靠的(de)本地目标将是一件(jiàn)关键的(de)事情，如果我能指出旧金山的(de)自动驾驶汽车，他们杀死了一个人，这实际上甚至不是自动驾驶汽车的坠落。然后(hòu)克鲁兹完全退出了旧金山。我知道现在(zài)还有很多事情在(zài)进行(xíng)，但这(zhè)在机器(qì)人(rén)领域(yù)很容易(yì)发生。因(yīn)此，可靠性是一(yī)个关键因素，这是人们投入大量资(zī)源努力解决的问题之一。但这无助于解决，将(jiāng)我们带入下一代的(de)更大问题。当我说我不认(rèn)为(wèi)每个人(rén)都必须专注于你所说的(de)真正有用的(de)东西时。

陈建宇：要做到大规模应用的话，有非常重要两个事情(qíng)：一(yī)个是能不能找到大规模的需求，另一个能(néng)不能有(yǒu)我们技术，足够去(qù)实现、满足需求。

其实现在有很多零散的(de)表演需求(qiú)，如果需要真的达到max（大规模）的话，我觉得主(zhǔ)要(yào)还是看劳动力，非常密集的一(yī)些产业，比如三个阶段(duàn)，一个是工业、商用和服务。

大体我认(rèn)为(wèi)，技术(shù)也基本上是按照这样一个方向去成(chéng)熟发(fā)展，其(qí)中我(wǒ)觉得给我的感受，我(wǒ)认为工业的话(huà)可能会比较快就能够去(qù)用上了。其实(shí)刚才Marc的报告中里(lǐ)面也已经展现(xiàn)出来了，不管是人形(xíng)，还是一些轮(lún)式的机(jī)器人，在工厂搬运的这一类的环境里面，已经是达到了非常接近(jìn)人类的一个节点，那么(me)在未来(lái)，它可(kě)能会更快更强大，然后以及成本更低，达到这个时候的话，其实它的第一个大规模应用的点就到了。

王鹤：我觉(jué)得具(jù)身智能今天不能讲完全成熟，但(dàn)是我们今天GPT能力搭配人形机器人，其实已经能(néng)够(gòu)在很多(duō)场合(hé)干事情了(le)。

像我们今天在展台展(zhǎn)示了就是在一个零售的场景，那(nà)么用(yòng)户可以下单，我们的机器(qì)人可以(yǐ)根据你的具(jù)体下单的内容，是拿一个冰(bīng)红(hóng)茶(chá)，还是拿一个巧克力，那么我们从货架把它取下(xià)来，同时我们也可以从地面的篮子里(lǐ)头把这些货不断的上到(dào)货架上，我们(men)也可以从更大的一(yī)个仓储的料架上，抱着一箱东西放到传送带上。

这些(xiē)场景其实都展示(shì)了，目前具身智能对于比较糙的活，就是抓取放置和双手抱持这(zhè)样(yàng)的能力已经(jīng)走(zǒu)向成熟(shú)。

在这种情况下，我们还(hái)要问一个问题，为什么(me)是这个人形对吧？有很多人现场问我，你们为什么要做成人形？因为你(nǐ)想如(rú)果货架上的一个商(shāng)品掉在地上了，我的机器人得有能力(lì)去够地面这么低的东西，我的货(huò)架可能两米高(gāo)，我要能(néng)够抓到两米那么高的东西(xī)，同时我还能还得(dé)来回走动，还要得有两只手才能抱住一个箱子，又有两只手又能高又能低又能够来回走，那么(me)它基本上(shàng)就把形(xíng)态往人(rén)基本上非常的靠拢了，那么(me)我们目(mù)前用的是一个轮式(shì)底盘，没有腿，那么(me)也已(yǐ)经达到这样的一(yī)个能力了。那么我们认为(wèi)像这(zhè)样(yàng)的抓(zhuā)取放置搬运的能力(lì)，在很多行业，比如说零售，比如说工厂(chǎng)，比如说一些服务(wù)的场景全都可以用起来(lái)。

所以我判断，人形机(jī)器人的大规(guī)模应用，2025年、2026年我们将(jiāng)见到从百台(tái)级到千台级的一个快速的增长，

王兴兴：我个人的话，总体来说，对目前整个人形机(jī)器人应用落地还(hái)是需要一些时间，但(dàn)当下，包括今年和明年对一些简单场景，像特斯拉场景里面把一个电池从什(shén)么(me)地方装到什么地方里(lǐ)面，这种简单的，用模仿(fǎng)学习能做的事情，目(mù)前的AI技(jì)术其实成功率还是做的比较高了，今年或明年可以做一些应用，包括(kuò)把整(zhěng)个的GPT速度也提升。

但是我觉(jué)得，真正(zhèng)要提升人形机器人大规模应用，确实(shí)还需要更多的时间，把机器人的模型本身做得更好一点，让它更通用，基本上无论是更精细化的或者更泛用心的一些事情都可以(yǐ)做一起来(lái)，所以我还是希望社会大众对AI和(hé)机器(qì)人能更多一些耐心。但实(shí)际上可能中国其实(shí)还是有很多人比较心急的(de)，我觉得还是大家可以再(zài)多给(gěi)一点耐心。谢谢。

熊友军：我觉得人形经济和大规模的应用，其实上这个(gè)就涉及到一个商业化场景选择的问题，实际上，并不是说现在人形机器人不能够(gòu)应用，而(ér)是说(shuō)要再(zài)看什么场景(jǐng)。我(wǒ)觉得在(zài)有一些刚需的(de)场景，或者(zhě)对人不(bù)可达到(dào)的这种场景，还是有一些(xiē)可以(yǐ)用的，尤其是这种刚性(xìng)需求的，比如抢险救灾，特种的对核(hé)辐射，或者是说有毒有害气体环境等(děng)等，这些(xiē)我觉得(dé)现在实际上是可(kě)以(yǐ)用的。

大家其实想的更多是，技术怎么去(qù)提(tí)升，然后怎么(me)它能够让人形机器人能够快速适应(yīng)更多的场景，然(rán)后把(bǎ)成本快速的降下来(lái)，只有这样通(tōng)过一方面通过技术的提升，提高(gāo)有更多工作效率，让人有(yǒu)更好的体验感，然后更多人愿意用它。

第二方面，就是把成本继续往下降(jiàng)，我觉得让大家(jiā)更买得(dé)起，这个我觉得要是要想的这个方式。

另外我觉得还有一种，就是商业模式(shì)上的探索，实际上人形机器人是我觉得是一个集大成者(zhě)，它(tā)基本上涵盖(gài)了机器人(rén)和人工智(zhì)能的绝大部分的技术领域，然后在人体技术上(shàng)的研究能够大(dà)大的推进这(zhè)些技(jì)术的成熟，然后技术甚至技术(shù)的(de)市场化，我们(men)可以采用“沿途下蛋”方式(shì)获得这个商(shāng)业的利润。通过这些其他的一些技术，人形机器人产品上孵(fū)化的其(qí)他技术商业化、产(chǎn)业化来推(tuī)动人形机器人研究。一个典型的例子，就是我们(men)现在有一些人形机器人公司已经(jīng)在其他产品(pǐn)上实现盈(yíng)利，然后已经实现了一(yī)个很好的商(shāng)业化，这我觉得是一种非(fēi)常好的模式。

问：作为技术人员，我们是否意识到(dào)有很多机器人都有道德伦理方面的顾虑——我们如何才能消(xiāo)除这些顾虑？

Marc：我认为，从最(zuì)高层(céng)面(miàn)来说，理(lǐ)解所有技(jì)术都涉及一些风险和机遇是很重(zhòng)要的。我参加了(le)一(yī)个政府会议，但我(wǒ)听到许(xǔ)多政府(fǔ)的人都在谈论监管人(rén)工智能(néng)，而压倒性的(de)感(gǎn)觉是关注最糟糕的结果(guǒ)，对吗？

比如在欧(ō波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”u)洲，来自(zì)英(yīng)国一位人(rén)士在发言，让我印象深刻的是，人们几乎陷入恐慌，担心最(zuì)糟糕的事(shì)情会(huì)发(fā)生，并(bìng)且不惜一切代价想要(yào)阻止这种事情发生。但我认为，不利(lì)用机会的风险与让坏事(shì)发生的风险一样大。

所以我认为，正如开发人员指出(chū)的那样，我们需要找到一种平衡，当我们撰写论(lùn)文时，我们会在开头列出这些内容。这些都是(shì)我(wǒ)们工作可能产生的巨大影响，但我(wǒ)们从(cóng)不谈论我们的工作，可能(néng)产生的坏事是什么。

我们需要(yào)诚实和开放，更加公平地对待这个(gè)问题，但随后(hòu)继续(xù)强调这种平衡，并以某种方式防止我(wǒ)们错过机会，我认为由于公众的恐(kǒng)惧，这种机会很容易发生。

陈建宇：我觉得人(rén)们对这个人形(xíng)机器人、或者(zhě)相应的具(jù)身智能机器人技术的担忧，其(qí)实核心来自于对自身安全性的(de)一个担忧。

安全(quán)其(qí)实有几个不同的(de)层次，最(zuì)底层的层次(cì)是物理的安全，大(dà)家担心机器人会不会(huì)在工作(zuò)的时候去伤害到人，那么这是一(yī)个层次；当(dāng)然其实在它波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”分情况，那(nà)么比如说我们刚才说的如果(guǒ)是工厂(chǎng)里面的话，其实如果我们把它跟人工作环境隔开，其实一定程度上能解(jiě)决这个问题；同时，我(wǒ)们也需要(yào)从我们的算法硬件等等(děng)上(shàng)面做的更鲁棒来去优化这个(gè)问题。

那么(me)第(dì)二个层次，其(qí)实也是生(shēng)存上面(miàn)的(de)问题，但是不是说物理层面的，那么也是不是说全人类的一个担(dān)忧，而是说有一(yī)部(bù)分(fēn)人一个担(dān)忧，他担心这个会替代咱们的某一些工(gōng)作，大家会有担忧，我(wǒ)觉得这个事(shì)情可(kě)能需要政府或者商(shāng)号进行有一些引导，我们尽量的开始去(qù)做(zuò)一些确实劳动力非常紧缺的这样的一些产业，比(bǐ)如说(shuō)我(wǒ)们一些非常恶劣环境工业环境(jìng)，或者是比如说(shuō)养老等。

当然第三个层面，如果未来我们的具身智能(néng)机器人真正拥(yōng)有了意识，那么这个会对人类的自我存在的价值可能产生一些担忧，我觉得这个事是更远的和更大的topic。

王兴兴：我觉得机器人的伦理(lǐ)道德(dé)和安全性问题，是(shì)非常重要的一件事(shì)情，而且我(wǒ)觉得(dé)，要希望(wàng)是在场所有的人都(dōu)大家需要共同去维护的一件事情，就有点像(xiàng)现在新能源汽车以及(jí)无人驾驶，它其实还是有(yǒu)很多安全(quán)性问(wèn)题，并且比如说有(yǒu)一辆早些年新能源汽车起火了，或(huò)者有一家新能源汽车无人(rén)驾驶出了交通事故，这(zhè)个对(duì)整个行业影响是非常大的，会降低普通老百姓对技术行业的(de)认可(kě)度以及信心。

这个事情(qíng)很容易发生在人形机器(qì)人和AI这个领域(yù)。所以我一直觉(jué)得。当下(xià)以及未来大家都应该在机器(qì)人安全性上，无论(lùn)是出台一些规章政策，或者做(zuò)一些更好的引导，或者需要全世界政府出台一些(xiē)相关的政策，都共同推动整(zhěng)个行业的健(jiàn)康发展。

王鹤：所以(yǐ)我就从技术的角度，人形机器(qì)人它的一个面(miàn)向终局的技术必然是大模型，那么其实只有大模型才(cái)可能实现非常高的通用性，把很多能(néng)力全部汇集在一起，把很多模态(tài)，从视觉感知，到(dào)语言理解，到动作执行，那么(me)融(róng)会贯通，那(nà)么今天我们在技术上其实是有方(fāng)法对大模型(xíng)的行为进行限制，就是“对齐”，我(wǒ)们(men)在大模型内部已经进行了深入研究，那(nà)么未来，我们会对语(yǔ)言模型、多模态模型进行更深入的对齐(qí)，让它不会伤害到(dào)我(wǒ)们(men)的人类，并且他的技能会被局限在服务的(de)范畴内，那么这一些(xiē)是(shì)我们技术上能做(zuò)的，在技术上之外，必然还需要政府(fǔ)社会(huì)和国际的合作。

熊友军：我觉得前面几位(wèi)都说的(de)都挺好的，我就补充(chōng)一点，就是说我觉得应该是有(yǒu)一些行业组织或者是政(zhèng)府(fǔ)出来，更多在法律(lǜ)法规这方面更多的(de)立法，包括更(gèng)多的是做全社(shè)会的机器(qì)人使用(yòng)、伦理道德方(fāng)面的一些(xiē)教育。因为我觉得，任何一个机(jī)器(qì)人也是一种工具(jù)，放在不(bù)同人的手上，它的可(kě)能有不同的使用方法，然后只有加强教育，提升大家对人工智能对人(rén)形(xíng)机器人的(de)使用，让大(dà)家相对安全角度去考虑，我觉得才是一个正确的方式。

问：您认为 5 年后人形机(jī)器人行业会发展到什么(me)程度？哪些经济(jì)领域将率先使用(yòng)它们？

Marc：不，我认为人形机器人的出现让(ràng)事情变(biàn)得复杂。我认为机器人在工业领域(yù)的应用将取得(dé)很大进展。我认(rèn)为机器人的应用非常广泛。人们对此非常关注。正如大家所说，使机(jī)器人变得越来(lái)越好(hǎo)的技术(shù)确实正在日趋成熟。我(wǒ)认为工业(yè)将继续取得进步。

我认为人形机器人本(běn)身总体上仍然(rán)非常不成熟(shú)。所以我看不到它们。我知(zhī)道你可以看看一些人形机器(qì)人(rén)公司与汽车公司(sī)合(hé)作的演示。我(wǒ)认为这在某种程度上是一种(zhǒng)炫耀，而不是一种生产力。我不知道这是不是(shì)题(tí)外话(huà)。如果你看看仓库机器人(rén)，你会发现最大的挑战之一是系统集成，特别是如果它不是围绕机器人设计的全新仓库。

我认为许多仓库(kù)机(jī)器人供应商都在苦苦挣扎，因为他们需要一(yī)个系统(tǒng)集成商，而这个系(xì)统集成商会消耗掉太(tài)多(duō)的预算，因(yīn)此很难赚钱，这是因为运营仓库的 IT 人员并不想开放他们的系统。在那里工作的人并不(bù)想改变他们现在做的(de)一切(qiè)。如(rú)果机器人可(kě)以处理每一项任务，那(nà)就意味着他们仍然需要一个人来完成任务。使用任何类(lèi)型的机器人对(duì)行业来说都(dōu)具有很大(dà)的复杂(zá)性。我认为这些都是重要因素。

说实话，我原本以为 Spot 会取得更大(dà)的(de)成功(gōng)，但 Spot 的推出(chū)只是一次实验。我们之所以设计 Spot，是(shì)因为它能够让你连接自己的传感(gǎn)器，因为我们不知道人们想要什么样的(de)传感器。我们之所以设计 Spot，是(shì)因为它能够(gòu)让你对(duì)它进行编程，因为我们(men)不知道现(xiàn)在的用户们都有哪些应用(yòng)程序，而我(wǒ)们对它(tā)们(men)的使用方式有了更(gèng)多了解，开发人员正专注于巨大机遇，因(yīn)此 Spot 对人们的接受度确实产生了影响。

也许如果我们(men)没有足够的(de)商人，能够(gòu)提前进入并评估它是什么，我们实际上是在做一个实验。也许人形机器人会有更好的记录。

王鹤：我觉得我对人形机器人的发(fā)展总体是比较乐观的，那么在未(wèi)来5年，我们要完成真正的(de)大(dà)规模应用，这件事情对于整个人形机(jī)器人仍然是一个先(xiān)慢后快，其中慢的阶段，那么一个里程碑应(yīng)该是(shì)——在5年的时候我们能达到万台人形机器人级别的应用(yòng)。

这样的一个市场大约是对标现(xiàn)在商业清洁机器(qì)人。我们举个例子(zi)，在超市在万达广场在写字楼一层(céng)，我们看来回去洗地擦地的机器人，那么领先的这个市(shì)场(chǎng)，中国最领先的公司大约是每年出货1万台，那么他做的事情不局限做这么简单的事情，它能达(dá)到在各种场景，不(bù)管是商(shāng)超还是写字楼，还是(shì)很多不同的场景进行清洁，但是当然是平面清洁。

那么，对(duì)于我们人形机(jī)器(qì)人来说(shuō)，我们希望(wàng)能(néng)做到一个立体操作，但(dàn)是它的能力(lì)可能是(shì)局限的(de)，我搬(bān)运我就(jiù)是上货，我就是取货，对吧？

我没有更多的能力，但是我(wǒ)也要实现跨场景的应用，可以在超市里、可以在工厂(chǎng)里、可以在服务场景等(děng)等。那么能达到5年1万台(tái)的市场规模(mó)的(de)话，我相信后面有真实世界数据的回流，那时，我们会看到(dào)人形机器人应用规模会(huì)加快，从(cóng)慢时代进入快(kuài)时代。

熊友军：人形机器(qì)人我对(duì)它的(de)应用可能会更加乐观(guān)一点，其实大家看到这两(liǎng)年人形机器人的进步非常(cháng)快，尤其在AI驱动下面，实(shí)际上(shàng)在市场应用方面，你们已经可以看到国的有(yǒu)一些企业，包括全球企业已经开始在一些场景里面做试(shì)点应用了。

比(bǐ)如说在汽车(chē)厂，比如在一些商用服务场景，已经开始做试点，随着这个试(shì)点数据会形成一个飞轮的效应，所以试(shì)点(diǎn)进(jìn)展，然后它会有(yǒu)更多的迭代，然后有更多(duō)数据驱(qū)动，机器人会(huì)在在一些特定的环境里面(miàn)提高(gāo)效(xiào)率(lǜ)，它的速度，它的随着量的增长(zhǎng)，它(tā)的价格会大(dà)幅的降低，这样我(wǒ)觉得会更快的去(qù)促进产业的应用。

我觉得今(jīn)年年底(dǐ)，大家应该可以看到，有一部分的(de)公司已经能(néng)够在(zài)一些比如说新能源汽车厂，比如说(shuō)在一些特种领域(yù)已经开始应用(yòng)，明年我觉得应该可以看到一些(xiē)可能千台左右量(liàng)级的出货。

问：你(nǐ)能在我们的年轻观(guān)众(zhòng)中“点燃(rán)一把(bǎ)火”，让他(tā)们也想成为“机器(qì)人(rén)专家”吗？他们应该怎么做？

Marc：我认为伊隆·马斯克本人凭借他的雄心和资(zī)源，可(kě)能在几年(nián)内推(tuī)出10000个机器(qì)人，不一定是因为(wèi)它们会直(zhí)接让机器人赚钱(qián)，但看看他(tā)对电动汽车(chē)所做的一切。他们(men)从无人相(xiāng)信到现在，我比这里(lǐ)的任何人都更加怀(huái)疑(yí)，包括我在内，到每家汽车公(gōng)司都有淘汰内(nèi)燃机的计划。

我认为这(zhè)是一件了(le)不起的事(shì)情。他似乎(hū)对此很认真。所以这在整个人形机器人领(lǐng)域都(dōu)是(shì)一个真正不确定性的因素(sù)。我不确定如果(guǒ)他没有抓住机(jī)会，是(shì)否会有这么多人(rén)形(xíng)机器人(rén)。

我认为机器人玩得越有趣，人们就越能与(yǔ)它们互动。我(wǒ)到处走走，我没有带机(jī)器人来(lái)这里，但这里有很多机(jī)器(qì)人，但我(wǒ)到处发表演讲，发现机器人在计划(huà)中相当无聊。你总是能吸引一群人，只要你愿意让他们与机(jī)器人互动，他们就会(huì)留(liú)下(xià)来。我认为我们做得越(yuè)多，公众就会越热情。我非常欣慰，参加这(zhè)次活动最令人兴奋的事情可能是有很多人说你做的工作是(shì)我十几岁时见过的，现在我正(zhèng)在做。我们越能展示我们的工作并激(jī)励下一代，这就会实现。

陈建宇(yǔ)：我的一个建议是，因为机会其实永远是留给(gěi)有准备的人，那么像(xiàng)Maec做这个(gè)事情做了做(zuò)了好几十年，然后(hòu)包括我们其实(shí)台上我们几位也(yě)都是多年深耕在机器人或者相关领域，所(suǒ)以说，因为人形机器人(rén)它其(qí)实也是一(yī)个非(fēi)常长(zhǎng)周期的事情，同时它(tā)也包罗万象，从技术上的软件、硬件、AI再到商业、产品(pǐn)等(děng)等，其实(shí)各方面都有，所以说大家应该去问一问自(zì)己的内心在这一步范围内到底自己最有激情，最喜欢的最热爱的是什么？然后从此刻开始就(jiù)去积累它。最后，要么(me)等待未来，要(yào)么总(zǒng)有时刻(kè)你有施展自己的机会。

王兴兴：对于我觉得(dé)对于所有年轻(qīng)人，包括我们其实这个时代都是非常精彩的(de)，而且(qiě)想象一下，大(dà)家也知道AI、机器人都是阶梯性发展，就像GPT没有出(chū)来之前，大(dà)家觉得语言模型没(méi)什么用(yòng)，基本上是非常(cháng)差，但突然就是发生了巨大进步，非(fēi)常好，其实机器人、AI也(yě)会遵循这种规律，所以(yǐ)大家现在可能看到机器(qì)人的 AI 能力(lì)都比较弱，但实际上这是好(hǎo)事，为什么？因为大家(jiā)都有机会去做的更好，可以(yǐ)真正的把(bǎ)这种人类目前可以(yǐ)预估的最伟大技术，就在当下，就在未来几年，所以这个事(shì)情都是非常(cháng)值得做的，

而且，在机(jī)器人和 AI 另外一个(gè)比(bǐ)较适合年轻的点，它没有那么(me)多历(lì)史包袱，不像数学领域，有几百上千年的非常天才的数学家，你一定要(yào)比他(tā)们做得好，你(nǐ)才可以做技术，但(dàn)是当下，AI 和(hé)机器人它都非常年轻，尤其 AI 技术就最近几年的东西，所以(yǐ)非常适合年轻人(rén)。我一直(zhí)感(gǎn)觉在如果在(zài)未来5年到10年或者几十年(nián)回看我们现在这个时代，所以想想这(zhè)种感觉，真的非(fēi)常激动人心。

王鹤：我觉得(dé)其实(shí)未来的15年，在我(wǒ)心目中会(huì)是人形机器人，从(cóng)当(dāng)下在(zài)产业(yè)中没有(yǒu)规模化应用(yòng)，到可能成长到跟今天汽车的产量一(yī)个万亿市(shì)场的过程。那么在这个过程中，其(qí)实对年轻人来(lái)说，那么我觉得大家(jiā)就是做好自己就可以了，因为15年之后很多工作(zuò)都是(shì)跟人形机器(qì)人相关(guān)的，今天可(kě)能你负责卖车，那么15年后，你可能岗位就调到(dào)卖人形机(jī)器人对吧？今天你是班(bān)级里头的(de)佼佼者，那么你学 AI ，那么(me)你可能发(fā)现(xiàn)你的职业生涯(yá)就是围(wéi)绕着进一步提升人形(xíng)机器人的能力展开的，所以大家做好自己，我们一起(qǐ)共享光明、人形机器人的(de)未来。

熊友军(jūn)：其(qí)实我(wǒ)是经历过个人电(diàn)脑时(shí)代，我经历智(zhì)能手机时代，我(wǒ)经历过移动互联网的时代(dài)，现在其实我们(men)正在经历(lì)智能汽车的时代，电动汽(qì)车的时代，我觉(jué)得下(xià)一个时代实际上就(jiù)是聚生(shēng)智能的时代，而聚生智能时代的典型代表其实就是人性机器人，所以我(wǒ)给现在的年轻人建议就是说保持野心，怀(huái)揣大梦想(xiǎng)。

问：让我们在小组成员之间花几分钟时间(jiān)讨论(lùn)一下：你们想要(yào)互相问什么问题？

陈(chén)建(jiàn)宇：所以我想问Marc，你(nǐ)认为对于机器人和人工智能来说(shuō)最重要的研究问题是什么，例如，如果你只能选(xuǎn)择一(yī)个研究项(xiàng)目，那么你选择哪一(yī)个？

Marc：让(ràng)我从(cóng)侧面回答一下，这也是一种回避你的问题的方式。最后我没有展(zhǎn)示我的最后(hòu)一张幻灯片。我的最后一张幻灯片是一个展示(shì)机(jī)器人故(gù)障(zhàng)的视频。它展示了，我不知道它大(dà)概有 2 分钟长，可能有 25 种不同的故障(zhàng)。我认为(wèi)故障是工作中最有(yǒu)趣、最有意(yì)思、最有用的部分(fēn)，关注它(tā)们，然后在你(nǐ)的工作不工作的时候继(jì)续前进，这(zhè)真的很(hěn)重要。这不(bù)是(shì)研究的主题，但(dàn)它是一种工作精神。所(suǒ)以如果(guǒ)我要问你们所有(yǒu)人这个问题(tí)的话，那就是我还没看到任何人(rén)在演讲(jiǎng)中提到过事(shì)情无法正常运转，而且我敢肯定，单一机器(qì)人不会在(zài)不(bù)发生(shēng)碰撞的情况下完成那些后空翻以及(jí)它们(men)所做的所有很酷的事情。你(nǐ)喜(xǐ)欢碰撞吗？

王兴兴：Marc先生，很荣幸今天见到您，我其实想有好奇想问一下(xià)，您觉得(dé)对于人形机器人的手，您觉得(dé)未来几年比较合适的(de)有几个手指，或者几个电机，这会是比(bǐ)较(jiào)好的一个方(fāng)向？

Marc：再(zài)次(cì)，我要回答一个略有不同的问题。我们研究所(suǒ)最近举办了一场研讨会，名为“对操纵的反向观点”。我(wǒ)认为灵巧(qiǎo)性确实很重要，但基本上它并没有取得很大进展，尽管(guǎn)人们至少已经为(wèi)此努力了 50 年。我认为我们必须以不同的方式思考，再次尝试不同的东西，就像我今天在演讲中(zhōng)开始(shǐ)的那样，也许(xǔ)我们需要更多的(de)动态操纵，而不是所(suǒ)有的静态抓握。我(wǒ)认为很多学习界的人在提出(chū)他们正在学(xué)习的灵巧性的要求时对自(zì)己要求(qiú)不够(gòu)。他们做(zuò)的事情很简单(dān)，很容(róng)易。

我认(rèn)为那里是有机会的，有多(duō)少只手我不知道(dào)有多少根手(shǒu)指(zhǐ)。我认(rèn)为五(wǔ)个已(yǐ)经很多了。但也许有一天我会觉(jué)得更有趣的问题是手掌怎么样(yàng)？我们(men)的(de)手掌功能非常强(qiáng)大，它们不仅(jǐn)仅是静态(tài)的块。而且你看到的几乎每(měi)个机器(qì)人手都有(yǒu)许多手指在做这件事，但仅此而已。

王鹤：之前我提到过，大概 15 年后，世界上会有数百万、一千万个人形(xíng)机器人。如果人形机器人具有通用目的(de)，那么人形(xíng)机器人是终极体现(xiàn)，那么这种通用目的(de)的终极技术(shù)是什么？对于人类噪音，您是否认为视觉、语言(yán)、动作模型，这些端到端模型(xíng)是人(rén)类噪音(yīn)的终极(jí)技术或方法？

Marc：我很难相信，端到端(duān)是取得进步的方法。也许最终(zhōng)在渐近线上端到(dào)端是(shì)正确的方法，但我认为我们知道的太多了。

说(shuō)实话，我认为人们过分看重（机器）学习。我知(zhī)道(dào)应该对学习持乐观态度(dù)，但如果你看看当今(jīn)存在的解决(jué)方案，你会发(fā)现最好(hǎo)的解(jiě)决方案中学习(xí)所起的作用微(wēi)不足道(dào)或微不足道(dào)。当然，在波(bō)士顿动力(lì)公司，今天学习很少，尽管人们正在努力。我认为(wèi)控制系统、控制理论、观察器，这些在过去 20 或 30 年(nián)建(jiàn)立起来的东西(xī)仍然发挥着(zhe)巨大的作用(yòng)。

我(wǒ)不想就(jiù)这样把它抛弃(qì)。我希望我们能真正拥抱学习，但要把它与我们已经知道的东西结合起来，找到一种方法把它们结合起来，至少(shǎo)在(zài)接下(xià)来的5年波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”或10年里，也许在渐近线上，情况会有所(suǒ)不同。

熊友军：我的一个问题是，Marc作为(wèi)波士顿动力的创始人，您之前开发了像Atlas这样的(de)非常令人惊奇的这(zhè)种产品，但(dàn)是我们前不久我们(men)看到波士顿动力终止了这个机(jī)器的研发，然后由原来的液压驱动，转向(xiàng)纯电(diàn)驱动的这种方式。对这(zhè)方(fāng)面是出于什么样的考虑？是(shì)因为成本的考虑，还是因为出于商业化的考虑？同时我还(hái)想知道，波士顿动力未来(lái)5年的一些(xiē)这(zhè)种计划，对商业化(huà)的一些计划。

Marc：我认为，如果你问为什么要进行转变，我认为有两个关键因(yīn)素：一(yī)个是液压机器人，我喜欢液(yè)压技术，我会用液压技术制造很多机器(qì)人。我认为，建造人形机器人或类似人形机器(qì)人仍有空间，它们将继续使用液压技术(shù)，因为重量和强度等因素。

但我认(rèn)为有两点。一是它们很麻(má)烦，至少对于像 Atlas 这样的(de)高性(xìng)能机器人来说，尽管我们付出了无尽的努力，也永远无法让它们完全不漏油(yóu)。当你把石(shí)油机器(qì)人放到工厂和家里(lǐ)时，它们就不能滴(dī)油；同时，很难找(zhǎo)到精通液压技术(shù)的人，因为人们认为这是非常古(gǔ)老(lǎo)的东西(xī)，尽管 Atlas 在液压工作原理方面有很多创新，从服务器阀门到 HPU 液压动力装置，一直都是如此，确实有创新的东西(xī)在进行；最后，我认为(wèi)电动汽车在规模上已经足够强大(dà)，它们可以(yǐ)参与竞争(zhēng)。我不想代表波士顿动力发言，尽管我是(shì)创(chuàng)始人之一，并且(qiě)仍(réng)然是董事会成员，但我认为他(tā)们必须有自己的计划，说(shuō)明未来的计划(huà)以及技术的所有细节。我(wǒ)想随着事情(qíng)的(de)发展(zhǎn)，你(nǐ)会发现更多这方面的内容。

主持人：非常感谢。我想观众肯定会有更多问题，也许吧，但我们的时间真的不多了。所以非常感谢各位小组成员。非常感谢观(guān)众的到来和聆听。我认为这是一场(chǎng)非常精(jīng)彩(cǎi)的会议，尤(yóu)其是小组讨论。我对组织者的建议是，我们明年再(zài)举办一次类似的会议，然后我们(men)可以回顾进展和未来的步(bù)骤。

未经允许不得转载：橘子百科-橘子都知道波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”