波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”

波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”8月24日下午，2024世界(jiè)机器人大(dà)会上，举行(xíng)了(le)一场期待已久(jiǔ)的中国、美国“具身(shēn)智能”与人形机器(qì)人领域学者的(de)“世界对谈”。

大名鼎鼎(dǐng)的“机器狗之父”、美国波士顿动(dòng)力创始人Marc Raibert（马克·雷伯特）首次来到北京(jīng)。他说，“我简直不敢相信，不仅是机器人的数量，难(nán)以置信(xìn)，还有这么多热情的人参加了展(zhǎn)览。中国对(duì)机器人的(de)兴(xīng)奋和热情很高。”

而此(cǐ)次与Marc对谈的四位CEO所在的公司(sī)也不寻常：除了宇树(shù)科技之外，星动纪元、银河(hé)通用、北京具身智能机器人创(chuàng)新(xīn)中心都成立不足2年，一出道就是具身智能和人形机器人行业的“顶(dǐng)流”。

而且(qiě)，星动纪元、银河通用背后也站着中国最高学府：北大和清华，代表着中国前沿科技创新(xīn)的重要来源(yuán)。

其中(zhōng)，星(xīng)动纪元由姚期智带(dài)领的清华(huá)大学交叉信息研究院(yuàn)孵化(huà)成立的，星动纪元创始人陈建(jiàn)宇现在还是清(qīng)华大学交叉信息(xī)研究院助理教授，公司融资超(chāo)亿元，联想(xiǎng)创投已加入其中。

银河通用(yòng)机(jī)器人创始(shǐ)人的王鹤则是北京大学助理教授，也是(shì)北京智源人(rén)工智能研究院具身智能研究中心主任，过(guò)去(qù)半年，银(yín)河通用完成天使轮融资共计7亿元人民(mín)币，刷新了国内人形机器人领域单轮融资规模，美团(tuán)战(zhàn)投、北(běi)汽产投、商汤国香基金、讯飞(fēi)基金、启明创投、蓝驰创(chuàng)投、经纬创投、源码资本、IDG资本等头部财务机构都参(cān)与其中。

而(ér)北京具身智能机器人创新中心则(zé)是(shì)北京(jīng)市发起成立的机器人“国家(jiā)队”机构。北京具身智(zhì)能机器人(rén)创新中心(xīn)总经理熊友军，目前还是(shì)“人形机器人第一(yī)股”优必选科技CTO。

Unitree Robotics（宇树科技）也是当下人形机器人(rén)行业的(de)明星企业。公司创始人、CEO、CTO王兴兴毕业于上海大学，取得了机(jī)械工程硕士，具(jù)有近10多(duō)年足式机器人研发经验，拥有产(chǎn)品从0-1-100的(de)研发与商业化落地能力，100+项(xiàng)机器人相关专利(lì)。

此(cǐ)次圆桌(zhuō)由(yóu)德国慕尼黑工业大学教授 Alois.C.Knoll主持，美国波士顿动(dòng)力创始人Marc Raibert（马克·雷伯特），与中国四大AI机器人企业领军者——陈建宇、王兴(xīng)兴、王鹤、熊友军(jūn)，五人(rén)围绕(rào)机器人行业(yè)、AI 大模型驱动机器人发展等议题展开讨(tǎo)论。

一个多小时的圆桌(zhuō)当中，Marc表示，未来5年(nián)，机器人(rén)硬(yìng)件发展仍将非常重要，但同时，能够打(dǎ)破语义理解障碍的基础(chǔ)模(mó)型或其他 AI 方法也将对机器人技(jì)术产生(shēng)更大的影响。不过(guò)，要想取得机器人领域真正的进步，就需要更高的可靠性和安全(quán)性，未来人们需要投入大量资源努(nǔ)力解决(jué)此类问题(tí)。

Marc非常(cháng)不看好人形机器人行业。他认为，工业机器人已经非常成(chéng)熟，而且能够商业化，目前人形(xíng)机器人“在某(mǒu)种(zhǒng)程度(dù)上是一种炫(xuàn)耀，而不是一种生产力”。

陈(chén)建宇(yǔ)表示，过去10年AI发(fā)展很(hěn)快，从简单的图像处理，到(dào)深度学习、强化学习，再到ChatGPT技术，这对于未(wèi)来“具身智能”产生很大的(de)影响。未来(lái)几年(nián)，AI、具身智能会与人形(xíng)机器人不断融合，去(qù)训练一个通用模型。他相信未来(lái)5年，我们将迎来“机器人的ChatGPT时刻”。

王鹤指(zhǐ)出，当前 AI 大模型在机器(qì)人(rén)上仍有巨大的局(jú)限，尤其是“泛(fàn)化的(de)开瓶盖”技能还没有训练出来，但同时，这也(yě)是(shì)大模型带来了(le)重要机(jī)会，一旦大模型涌现能力不断(duàn)加强，他认为未来5年，依然有一(yī)个至少做(zuò)操作任务的通用机器人(rén)机会。

熊友军表(biǎo)示，当前关节性能提升、高的能量和电池密度的提升非常(cháng)快，使得(dé)机器人的运动控制能力、电机(jī)等(děng)方面提升非常快。未来5年，机器人关节和能量(liàng)密度会持续提升。毕竟和人类相比，现在机器(qì)人的能量执行效率(lǜ)还是有非(fēi)常大的差距。

以下(xià)是钛媒体 AGI编辑对此次(cì)圆桌全文整理：

问：您能否向观众(zhòng)简单介绍一下您的工作：您为什么以及什么时(shí)候开始对(duì)人形机器人感兴趣的？

Alois：我从 2001 年开始担任慕尼黑大(dà)学的教授。我(wǒ)对人类噪音的一个方(fāng)面产生了(le)兴趣，那就是具象化，对吧(ba)？我的朋友 Pfeiffer 和(hé)我们一起从大学毕业。苏黎世退(tuì)休了，不幸的是，我(wǒ)们坚信(xìn)具象化。所以我们认为，在我们(men)的人类类型中，智力只会在以非常自然的(de)方式与世界相连的人类类型身体中发(fā)展。所以身体应该有同样的动力，同样的尺寸，等等。否则，就很难做到这一点，你在这里看到的 Kronos 系列(liè)机(jī)器人，左(zuǒ)边，左(zuǒ)下角的 Roll Boy2024 就是这种信念的结果之(zhī)一。

Marc：我认(rèn)为你贴出的那张图片(piàn)对我回答这(zhè)个问题很有帮助。如果人形机器人意味着两只胳膊、两条腿直立向前，那么直到(dào)最近我才对此感兴趣(qù)。事实上，我一直认为现(xiàn)在的公司注重功能性，作(zuò)为一名(míng)教授，我认为(wèi)功能性才是最重要的，机动性(xìng)、灵巧性、感知力和智能，而外形和外(wài)观则是次要的。另一方面，如果(guǒ)人形机器人(rén)意味着像腿一样的动态生命(mìng)，我会(huì)把它(tā)与世界(jiè)互动(dòng)。我一(yī)直(zhí)是人形机器人的粉丝，尽管我建造的(de)第一(yī)个机器人是弹簧单高跷的东西。我认为人形(xíng)机器人的许多基本要素都在那些弹簧单高跷的东西(xī)中。确(què)实，当我们开始建造机器(qì)人时，波士顿动力公司是直立的(de)，有两(liǎng)条腿，两只胳膊(bó)。有时领(lǐng)先。如果你看看公众的反应，你会发现 YouTube 点击量增加了 10 倍(bèi)，我非常关注这(zhè)些点击量或评论，或者只是人们的态度。人们非常感兴趣。普通的非科(kē)学家，比如说，非工程师，他们对(duì)人(rén)形机器人很感兴趣(qù)，而狗惹恼机器人却(què)得不到同样的赞誉。

熊友军：我是从读博士的时候(hòu)，2000年开始做机(jī)器人的研发，当时读博士的时候，那时候更多的(de)是做工业(yè)领域、特种领域的一些机器人，用在一些危险的(de)环(huán)境里(lǐ)面，因为那时候机器人技术(shù)还是非常不成(chéng)熟，但在很多特(tè)种领域和(hé)危险(xiǎn)场景里(lǐ)面，是需要用机(jī)器人去完成工作了，然而(ér)那时候机器智能实际上是(shì)很差(chà)的。所以我们(men)当(dāng)时想的办法，是将机器人(rén)的智能跟(gēn)人的智能结(jié)合起来，所以做了一些机器人(rén)要操(cāo)作的一些事情。

但在遥(yáo)控操作完成这些工作(zuò)的过(guò)程中，我们发现有很多的场景，实际(jì)上用轮式的工业机械(xiè)手臂是解决不了(le)的，尤其是有时(shí)候在一些特种场景环境比(bǐ)较狭小，然后环境比较复杂的轮式，然后履(lǚ)带式实际(jì)上根本就进不去，但(dàn)是人(rén)是可以进去。还有一(yī)种，是要试用很多工具(jù)去完(wán)成(chéng)那(nà)些工作。

所以(yǐ)当时我们就觉得，如果说有微型(xíng)机器人的话，实际上应该是能够提供(gōng)很好的解决工具，或者一种解决方案，但是我们当时那时候也看到了日本本田ASIMO，给我们提(tí)供了很多(duō)的(de)一些启发(fā)，所以那时候我就对人形机器人非常(cháng)感兴趣。后面毕业之(zhī)后，一直在做机器人(rén)相关(guān)的工作，

2012年，我跟(gēn)优必(bì)选(xuǎn)科技CEO周剑先(xiān)生(shēng)创立了公司，做人形(xíng)机器人研发工作(zuò)，去年从深圳到北(běi)京开始筹建具身智能(néng)机器人创新中心(xīn)，现在也是一(yī)直在(zài)聚焦人形机器人方面(miàn)的研(yán)发，主要的想法是希望说能够解(jiě)决(jué)人形机器(qì)人方面的一些共(gòng)性、关键的技术问题，比如本体的一些基础研发不足，其实(shí)我们现在微(wēi)型机器人在本体在关键的核(hé)心器件(jiàn)，然后在一些传感(gǎn)器方面(miàn)其实上有非常多(duō)要攻克的地(dì)方。另外(wài)在运(yùn)动控制，实(shí)际上我们(men)也(yě)做了非(fēi)常多的(de)运动控制的技(jì)术研发，采用深度学习(xí)强化学习的这种运动控制(zhì)的方式，包括(kuò)现在也用一些融神经网络的一些方式(shì)用去做(zuò)运动控制，同时其(qí)实我们现在还在做关于智能方面的一些研发，比如说把用现在具身(shēn)智能的(de)方式，做一些基础性工作，比如建它的数(shù)据(jù)集，研发机器人大模型框架等。所以这就是现在我(wǒ)在做的(de)一些(xiē)事情(qíng)。

陈建宇：其实这个兴趣是很小的(de)时候，就一直对智能机器人非常感兴趣，我印象很深刻，刚刚兴(xīng)兴(xīng)说她10岁(suì)的时候，我估计也是差不多类似的时间，不(bù)过(guò)当(dāng)时看(kàn)的不是波士顿动力，当时关注的是ASIMO系列机器(qì)人，当时我就非(fēi)常的去着迷。然后(hòu)我觉(jué)得(dé)，创业这件事(shì)其实是充满了挑战性的，marc创办了波士顿动(dòng)力做了40多年，其实我是非常尊敬的，就(jiù)是说你没有一个发自内心的、天(tiān)生热爱的话，其实很难去坚持下来的。所以对我来(lái)说，对这类机器人的热爱(ài)，我(wǒ)觉得某种程度上是从小就具备就拥有的(de)。

那(nà)么真正开(kāi)始做机器(qì)人其实是本科的时候。当时在学校里面，我就接触真正意义上的(de)机器(qì)人的研究，当时接触了(le)双足机器人，主要是做的就是捕获点步态规划相关的研(yán)究。后(hòu)来，博士阶段继续做机(jī)器人，虽然不是(shì)人形机(jī)器人，但是也是相关的一些机器人的领域，控制它的学习，包括(kuò)无人车和机(jī)械臂。而真正的去全力做人形机(jī)器人，是在我回国之后(hòu)，然后(hòu)在现在清华正式(shì)投入去做人形机器人，还孵化了星动纪元公(gōng)司，如(rú)今(jīn)我们(men)已经做(zuò)了(le)最新一代、第六代机器人了，然后我们也在展会(huì)上面带来(lái)了我们(men)机器人的实(shí)物，欢迎大(dà)家去关(guān)注。

王兴兴(xīng)：大家好，我是宇树科(kē)技创始人王兴兴，刚(gāng)才有提到我大概可能10岁的时候就看过marc先生在MIT实验室做(zuò)的双足，还有单条腿的机器人，然后印象非常深，在09年、10年的时(shí)候，大概大一寒假，我就做过一个小的人形机器人，然后当时做的(de)不是特别(bié)满意，然后后来的话，就在研究生期间(jiān)做了XDog这款机器人，差不多(duō)在13年到15 16年，这款机器人的话又采用了比较低成本(běn)的(de)硬件，然后运动性(xìng)能非常好，可以(yǐ)直接实现关节的(de)力控(kòng)以及整机的力控。

后来的话，一开(kāi)始我对(duì)人体机器人的技术还是跟相对来(lái)说比较悲观的，但(dàn)是后来的话在2022年左(zuǒ)右，整个的机器人、AI技术的进步，然后再加上ChatGPT出(chū)来以后(hòu)，大家都看到人形机器人和AI结合的可能性，所以说我们公司又重新(xīn)开始做人形(xíng)机器人。说(shuō)实在的，其实我真正感兴趣的并不是说人(rén)形机器人，而是新的一(yī)个智(zhì)能体机器人的形态。而人形机器人(rén)可能只是说目前大(dà)家比较公(gōng)认的、一个最有可能性的通用机器人和通用AI的结(jié)合体(tǐ)，但是这可能并不是个(gè)唯一的，我真正希望能(néng)诞生甚至更比人(rén)更高级的一个智能体形态(tài)，可(kě)以大(dà)大推动整个(gè)人(rén)类工业的变革，推动新的工业革命。

王鹤：我是北京大学计算机学院助理教授，也是北大银河通(tōng)用具身智能联合实验室的主任王(wáng)鹤，那么，我跟(gēn)人形(xíng)机器人、具身智能结缘，主要是从(cóng)我在斯(sī)坦福大学开始读博的(de)时候。那么2016年的时候，当时深度学习技术已经出来(lái)了(le)，也应用在很多图像识别分(fēn)类这些(xiē)任务当中。那么(me)当时作为一(yī)个前沿研究，我们试图去理解人类是如何把感知思考还有交(jiāo)互的能力融合在一(yī)起的。

所以我博士期间的第一个工作，就用一个(gè)视觉模型来看桌面(miàn)上人的动(dòng)作和物体的一个运动，然后推理人下一步想要什么，这(zhè)是一个语言(yán)模型。

最后再用一个简单的(de)机器人，智能的马克杯去响应人(rén)的(de)动作(zuò)，那么这个工作获得了欧洲图形学的最(zuì)佳论文提名，但是我们认为它(tā)非常的不足，就是我们的一个(gè)马克杯只能(néng)在桌面上移动响应人的动作，它没有跟人交互的(de)能力，我们的视觉(jué)只能看(kàn)有限的几一种物(wù)体，那么(me)我们的语(yǔ)言模型只能根据这(zhè)个人(rén)跟这些(xiē)桌面东西的一些动作来(lái)做(zuò)简单的推理。

那么通过过去8年我们的研究(jiū)，在(zài)怎么(me)样把机器人的操作能力搞(gǎo)得更(gèng)泛(fàn)化，什么东西(xī)都能抓，都能够放置，那么还有跟(gēn)现在(zài)的多模态大模型技术结合，真的明(míng)白人(rén)类想让你干什么，那么言出法随(suí)的去执行，所(suǒ)以去年我们就孵化了北(běi)京银(yín)河通用这家人形机器人公司，我们现在也是(shì)把视(shì)觉、语言、动作这三种不同的模态(tài)融合到大模型当中，真正的(de)赋能人形机器人，让人形机器人能够走进千行百业、千家万户，这(zhè)是我们的愿景。

问：你认为，我们今天拥(yōng)有的哪些重要技(jì)术是 10 年(nián)前没有的，但对于实用(yòng)的人形机器(qì)人来(lái)说却至关(guān)重要？它(tā)们在未(wèi)来 5 年将(jiāng)如何(hé)发展？

Marc：我认为硬件开发仍将非常重要。如果我们(men)谈(tán)论未来 5 年，毫无疑问，能够打破语义理解障碍的(de)基础模型(xíng)或其(qí)他人工智能方(fāng)法将产生(shēng)最大的(de)影响。

我(wǒ)认(rèn)为，人类可以做的就是，概括和理解(jiě)他们所看到事物的含义，而目前还无法真(zhēn)正捕捉到这些含义。我相信，如果人工智能能够在这方面取得进展，我认为(wèi)它将产生巨大的(de)影响。

实际上，过去十(shí)年来，每(měi)个人都在计算机、传感器、感知、控制(zhì)等方(fāng)面取得(dé)了巨大进步。电池，我认为人(rén)们忘记了电(diàn)池。虽然电(diàn)池是工业时代的产(chǎn)物，但(dàn)是它们(men)确实(shí)非常重要。是的，所以在电机方(fāng)面过去 5 年里，人们做得很好，我认为电机已经取得(dé)了长足的进步，当然，我们将看到更多。

陈建宇：我从(cóng)AI的视角来讲一讲，觉得非常大的一个不同。如果按照10年前的话，其实是2014年左右，当时是DeepLearning刚刚出(chū)来不久，它(tā)其(qí)实解(jiě)决了很大一部分，比如图(tú)像处(chù)理等等一些问题。

那(nà)么后面(miàn)，其实有我认为两(liǎng)个最(zuì)重要的里程碑：一个是以16年阿尔法狗为代表的深度学习，紧接着把它用在了强化学(xué)习上面，做深度强化学习，解决了一些问(wèn)题；第二个是以ChatGPT为代表的大语言模型，所以这点我认(rèn)为是(shì)过去10年没有的，但又(yòu)对未(wèi)来我们人形机(jī)器人(rén)，或者是具身智能起到非(fēi)常(cháng)大(dà)的(de)决(jué)定性作用的两个因(yīn)素。

那么可能在接下来的这几(jǐ)年时间，这两项技术会(huì)非常深(shēn)度的跟人形机器人(rén)、具身智(zhì)能融合起来，但他们也分别需要经过一定程(chéng)度的训练，从而(ér)能训练比较通用的一个模型，那么我们也能解决更加丰富的物理世界的数据程(chéng)序。那么我相信(xìn)，在接下来的5年(nián)，这几项技术都(dōu)能起到(dào)非常大的一个进展，我们(men)可能会在5年内迎来“机器人的ChatGPT时刻”。

王兴(xīng)兴：对过去10年最大(dà)的，还是AI技(jì)术带来的各种事情有更多的信心(xīn)。我觉得除了 AI技术本身最大的点，对于人形(xíng)机器(qì)人，对于整个社会共识的增加也是非常关键的，就是目前大家更加相信AI，更加相信人形机(jī)器人可以诞生更多价值，这在10年(nián)前是完(wán)全不能想象(xiàng)的(de)，那时整个社会基本上对此都完(wán)全没(méi)有信心。

另外一(yī)点的话(huà)，我觉得在未来5年，总体上是肯定整个 AI 机器人、AI模型变化会非常快，因为目前的AI真的是日新月异(yì)，大家可以用AI集成技(jì)术(shù)，去搭建各种自己的模型(xíng)去做训(xùn)练，这整个已经变成(chéng)一个非常的扁平化，以及(jí)容易(yì)操作的过程，其实很多人大家都可以参与进来，去做机器(qì)人模型并且去做训练(liàn)，所以我觉得(dé)。未来5年这块(kuài)的各种AI模型(xíng)创新，包括更新的一些神经网(wǎng)络模型，包括脉冲神经网(wǎng)络等都有很大的一些机会。

王鹤：我觉得10年好快，10年前是2014年(nián)，其实我们已经看到inbody的AI，甚至不是一个在西方的(de)学术界比较popular的词汇(huì)，那么(me)过去(qù)的(de)十年，我觉得一大技术的进展，就是(shì)我们在具身智能里头已经有(yǒu)一些技能实现(xiàn)了非常强(qiáng)的泛化性。

那么以我个人的(de)研究(jiū)举例，在抓(zhuā)取问题上，我们取得了比(bǐ)较(jiào)长足(zú)的(de)进步(bù)，那么我们(men)从只能抓方块圆的这些特定(dìng)形状的物体，到基于三维视觉传(chuán)感器，我们可以(yǐ)抓不透明、不反光，也就是(shì)在(zài)深度传感器里头能完美成像的这些物体，到(dào)我们最近的技术(shù)能够预测透明、高反光、金属、吸光这些非常(cháng)有挑战材质(zhì)的物体，基于它去做泛化抓取操作。

那么在今天的展厅，我们都接受观众给我(wǒ)们的(de)各(gè)种形状，各(gè)种材质随便堆叠乱七八糟的物体，我们的机(jī)器人都展(zhǎn)示了非常泛化和高成(chéng)功率(lǜ)的抓取能力，那么现在的问题是，像这样的每一个技能，大家都在分分别的去做开发，那么很(hěn)多人(rén)会提(tí)问你能帮我抓水瓶(píng)，你能不能帮我把瓶盖给拧开？我非(fēi)常不好(hǎo)意思的说，现在泛化的开瓶盖(gài)技能我们(men)还没有训练出来，这个就是大模型能够(gòu)带(dài)给(gěi)我们的机会，那么大语言模型涌现，也就是这种紧急行为紧急行为，他能够在只见一次(cì)或者是(shì)第一次零次的演示的情况下，他都(dōu)理解你(nǐ)要生成什么样的文(wén)字(zì)，我(wǒ)们相信未来的5年给我(wǒ)们的机(jī)会就是发展机器(qì)人基础大模(mó)型，它能够(gòu)实现涌现能力，它吞(tūn)吐足够量的数(shù)据后，有(yǒu)灵巧手，它能(néng)够抓能(néng)够加、能够拧，能够掰各种基本(běn)的手的各种运动能力都有了以后，他能涌现，我们给他看一(yī)个视(shì)频，他就能理解这个活怎么(me)干，到那个时(shí)候(hòu)我们真正的(de)就有一个通(tōng)用(yòng)的、至少(shǎo)做操作任务的的机器人了，这是我认为(wèi)未来5年的一(yī)个机会。

熊友军：我觉得这一轮的机器人技术的进步主要是由AI来驱动的。毫无疑问， AI驱动我觉得(dé)体现在(zài)几个方面。

第一个就是它人机交互性能得到了极大的提(tí)升。我记得10年前我们做人工智(zhì)能、做机器人的时(shí)候的(de)那(nà)些交互，如果说我要加语音加视觉，第成(chéng)本非常高，第二(èr)个我们要做(zuò)大量的研发(fā)的(de)工作，我们需要几(jǐ)个博士、硕士带着一个团队，花很长的时间才能够完成一些物体识(shí)别、语音合成，自然语(yǔ)言理解(jiě)NLP，还有甚(shèn)至是TTS、语音合成等方面的一些(xiē)工作，甚至包括导航，但是我(wǒ)觉得，现在随着技术(shù)的(de)进步，我们现在做人形(xíng)机器人的大模型，我们直接一个端到端的直接语音给指定给他(tā)，然(rán)后很快他就可以有(yǒu)比较好的行为输出，有很好的意图(tú)理解，然后做任务规划等。这是一(yī)方面，我觉得这一(yī)轮对人机交互、对动物的规划、对执行等方面都(dōu)有巨大(dà)提升，在10年前基本上都很难去想象。

然后第二个现在的这(zhè)些硬件方面也有极大的提升，体现在两个方(fāng)向(xiàng)，第一个现在关节的性能的提(tí)升是非常快的，大家可以看(kàn)到很(hěn)多公司机器人可以开始去做一些非(fēi)常动态的(de)、剧烈的运动，实际上离(lí)不开关节性能的提(tí)升、高能量(liàng)密度比，然后(hòu)高的转速、高波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”(gāo)性能等这些技术的提升，实际上，在10年前我觉得(dé)是很难去做到的。当然了这也(yě)有运动(dòng)控制能力的提升、电机的提升，现在其实(shí)也有采用(yòng)更多结构(gòu)设计的方(fāng)式，更适合它的布局等(děng)方面都有非常大的进步，包括把腿的转成惯量、把电机往上提(tí)等等，有(yǒu)各种各样的结构设计的技术(shù)的变化(huà)。

另外，刚才还提到能量，其实早前我觉得10年前我(wǒ)们做机器人的时候，一个电池(chí)就像我们背后要背一个非(fēi)常巨大的电池包能源包，而且能够持续的时间很短。但(dàn)是这几年随着(zhe)新能源汽车对电池(chí)技术的推动作用(yòng)，其实(shí)我们看到它(tā)的(de)电池能量密度大幅提升，我现在一个比较小的电池，可以支持比较长(zhǎng)的时间，我觉得这是(shì)一个非常重(zhòng)要的(de)技术突破。

未来，我觉得5年之后，这几个可能还是(shì)一个重(zhòng)大、要突破的方向(xiàng)，像刚才说的(de)人机交互方面，我们希望大模型(xíng)能提供更长期的任务规划，然后做意图理解等等方面，我觉(jué)得我们能只要给他一个非常模糊的指令，他就可以给我们输出我们很标准的很自然(rán)的这种交互的(de)结果。第(dì)二方面，可能就(jiù)是在规(guī)划实施(shī)任务(wù)方面是一个非常(cháng)重大、要攻克的方向，我们(men)环境会(huì)经常(cháng)变，面对的是一个动态(tài)环境(jìng)，然后(hòu)机器人能够根据环境变(biàn)化，能够实时去改变它的一些执行策略(lüè)等。当然，像(xiàng)能量方面我觉得是一个持续(xù)要提升的，它毕竟现在能量(liàng)执行效率和我们人相(xiāng)比，还(hái)是有非常大的一个差距。

问：大(dà)规模(mó)部(bù)署人形机器人需要完成哪些(xiē)任务？

Marc：但(dàn)是(shì)如果你现在从更宏观的角度来看，我刚才说了如果你想(xiǎng)致富(fù)你现在就不会着手开公司，但是如(rú)果你想生存下(xià)去。你至(zhì)少也得收支平衡。

我想这是一个更长远(yuǎn)的计划，我认为要想取得真正的(de)进步，你必须暂停，或者我不是说你必须(xū)暂停，我们在我的研究所暂停，让机器人更可靠(kào)的本地(dì)目标将是一(yī)件关键(jiàn)的事(shì)情，如果(guǒ)我能指出(chū)旧金(jīn)山的自动驾驶汽车(chē)，他们杀死了一个(gè)人，这实际上甚至不是自动驾驶汽车的坠落。然后克鲁兹完全退出了旧金山。我知道现在还有很多事情在进行，但(dàn)这在(zài)机器人领域很容易发生。因此，可靠性是一个关(guān)键(jiàn)因素，这是人们(men)投入大量资源努力解决的(de)问题之一。但(dàn)这无助(zhù)于解决，将我们带(dài)入下一代的更大问(wèn)题。当我(wǒ)说(shuō)我不认为每个人都必(bì)须专(zhuān)注于(yú)你(nǐ)所说的真正(zhèng)有(yǒu)用的东(dōng)西时。

陈建宇：要做到大规模应用的(de)话，有(yǒu)非常重要两个事情(qíng)：一个是能不能找(zhǎo)到(dào)大规模的(de)需求，另一个能不能有(yǒu)我(wǒ)们技术，足够去实现、满足需求。

其实现在有很多零散(sàn)的表演需求(qiú)，如果需要真的(de)达到max（大规模）的话，我觉得主要还是看劳动(dòng)力，非常密(mì)集的一些产业，比(bǐ)如三个阶(jiē)段，一个是工(gōng)业、商用和服务(wù)。

大体我认为，技术(shù)也(yě)基本上是(shì)按照这样一个方向去成熟发展(zhǎn)，其(qí)中我觉得给我的感受，我认为(wèi)工(gōng)业的话(huà)可能会比较快就能够(gòu)去(qù)用(yòng)上(shàng)了。其实刚才Marc的报告中里面也已经展现出(chū)来(lái)了，不管是人形，还是一些轮式的机器(qì)人，在工厂搬运(yùn)的这一类的环境里面，已经是(shì)达到(dào)了(le)非常接近人(rén)类(lèi)的一个节点，那么在未来(lái)，它可能会更快更强大，然后以及成本更低，达到(dào)这个时候的话，其实它的第一个大规(guī)模应用的点就(jiù)到了(le)。

王(wáng)鹤：我觉得具身(shēn)智能今天不能讲完全成熟，但是我们今天GPT能力搭配人形机器人，其实已经(jīng)能够在很多(duō)场合干事情了。

像(xiàng)我们今天在展台展示了就(jiù)是在一(yī)个零(líng)售的(de)场景，那(nà)么用户(hù)可以下单，我(wǒ)们(men)的机器人可以根据你的具体下单的内容，是拿一个冰红茶，还是拿一个巧克力，那么我们从货架把它取下(xià)来，同时我(wǒ)们也可以从地面的篮子里头把这些货不断的上到货(huò)架上，我们也可(kě)以从更大的一个仓储(chǔ)的料架(jià)上，抱着一箱东西放到传送带上。

这(zhè)些场景其实(shí)都(dōu)展示了，目前(qián)具身智能对(duì)于(yú)比较糙的活，就是抓取放置和双手抱持这样的(de)能力已经走(zǒu)向成熟。

在这(zhè)种情况下，我们还要问(wèn)一个问题，为什么是这个(gè)人形对吧？有很多人现场问我，你们为什么(me)要(yào)做成人形？因为你想(xiǎng)如果货架上的一个商品掉在地上了，我的机器人得有能力去够地面这么低的东西，我的(de)货(huò)架可能两米高，我要(yào)能够抓到两米(mǐ)那么(me)高的东西，同时我(wǒ)还能还得来回走动，还要得(dé)有(yǒu)两只手才能抱住一(yī)个箱子，又有两(liǎng)只(zhǐ)手又能高又能低又能够来回走，那么(me)它基本上就把形态往人基本上非常(cháng)的靠拢了，那么我们目前用(yòng)的(de)是(shì)一个轮式底(dǐ)盘，没有腿，那么也已经达到这样(yàng)的一个能力了。那么我们认为像这样的抓取放置(zhì)搬运的能力(lì)，在很多行业，比如说(shuō)零(líng)售，比如说工厂(chǎng)，比(bǐ)如说一些(xiē)服务的场景全都可以用起来。

所以我判断，人形机器人的大规模(mó)应用，2025年、2026年我们将见到从百台级到千台级的一个快速(sù)的增长，

王兴兴：我个人的话，总体(tǐ)来说，对(duì)目前整个人形机器人应用落地还是(shì)需要一些时间，但当下，包括今年和明(míng)年(nián)对一些简单场景，像特斯拉场景里面把一个电池(chí)从什么地方装到(dào)什(shén)么(me)地(dì)方里(lǐ)面(miàn)，这种简单(dān)的，用模仿(fǎng)学习能做的事情，目前的(de)AI技术其实成功率(lǜ)还是做的比(bǐ)较高了，今年或(huò)明年可以做一些(xiē)应用，包括把整个的GPT速度也提升。

但(dàn)是我觉得，真正要提升人(rén)形机器人(rén)大规模应用，确实还(hái)需要更多(duō)的时间，把机器人的模型本身(shēn)做得更(gèng)好(hǎo)一点，让它(tā)更通用，基本上无论是更精细化的或者更泛用心的一些事情都可以做一起来(lái)，所以(yǐ)我还(hái)是希望社(shè)会大众对AI和机器人能更多一些耐心。但实际上可能中国其实还是有很多人(rén)比较心急的，我觉得还是大家可以(yǐ)再(zài)多给(gěi)一(yī)点耐心。谢谢(xiè)。

熊(xióng)友军(jūn)：我觉得人形经济和大规模的应(yīng)用，其实上(shàng)这个就涉及到(dào)一个商业化场景选择的问题(tí)，实际上，并不是说现在人形机器人不(bù)能够应用，而是说要再看什么场景。我(wǒ)觉得在有一些刚需的场景，或者对人不可达到的这种场景，还是(shì)有一些可以用的，尤其是这种刚(gāng)性需求的，比如抢(qiǎng)险救灾，特种的对核辐射，或者是说有毒有害气体环境等等，这些我觉(jué)得现在(zài)实际上是可以用的。

大家其实想的更多是，技术怎么去提升，然后怎么它能够让人(rén)形机器人能够(gòu)快(kuài)速(sù)适应(yīng)更多的场景，然后把成本快速的降下来，只有这样通(tōng)过一(yī)方面通过技术的提(tí)升，提高有更多工作效率，让人有更好的体验感，然(rán)后更多人愿意(yì)用它(tā)。

第二方面(miàn)，就是把成本继续往下降，我觉得让大家更买得起，这个我觉得要是(shì)要想的这个方式。

另外(wài)我觉得还有一种，就是商业模式(shì)上的探索，实际上人形机器人是我觉得(dé)是一个集大成者，它基本上(shàng)涵盖了机器人和人工智能的绝大部分(fēn)的技术领域，然后在人体技术上(shàng)的研究能够(gòu)大大的推进这些技术的成熟(shú)，然后技术甚至(zhì)技术的市场化，我们可以采用(yòng)“沿途下蛋”方式获得这(zhè)个商业的利(lì)润。通过这些其他的一些技术，人形(xíng)机器(qì)人(rén)产品上孵化的其他技术商业(yè)化、产业化来(lái)推动人形机器人研究(jiū)。一个典型的例子，就是我们现在有一些人形机器人公司已经在其(qí)他产品上实现(xiàn)盈利，然后已经实现了一个很好(hǎo)的商业化，这我觉得是一种非常好的模式。

问：作(zuò)为技术人员，我们是否(fǒu)意识到有很多机器人都有道德伦理方面的顾(gù)虑——我们如(rú)何才能消除这些顾虑？

Marc：我(wǒ)认为，从最高层面来说，理(lǐ)解所有技术都涉及一些风险和(hé)机遇是很重要的。我参加了一个政府会议，但我听到许多政府的(de)人都在(zài)谈论监(jiān)管人工智能，而压倒(dào)性的感觉(jué)是关(guān)注最糟糕的结果，对吗？

比如在欧洲(zhōu)，来自英(yīng)国一(yī)位人士在发言，让我印象(xiàng)深刻的是，人们几乎陷入恐慌，担心最糟糕的事情会发生(shēng)，并且不惜一切代价(jià)想要阻(zǔ)止这种事情发生。但我(wǒ)认为，不(bù)利用(yòng)机会的风险与让坏事(shì)发生的风险一样大。

所以我(wǒ)认为，正(zhèng)如开发人(rén)员(yuán)指(zhǐ)出的那样，我们需要找到一种平衡(héng)，当我们撰写论文(wén)时，我们会(huì)在开头列出这些内容(róng)。这些都是我们工作可能产生的巨(jù)大影响，但我们从不谈(tán)论我们的工作(zuò)，可(kě)能(néng)产生(shēng)的坏事是什么。

我们需要诚实和开放，更加公平地对待这个问(wèn)题，但随后继续强调(diào)这种(zhǒng)平衡，并以某(mǒu)种方式防(fáng)止我们错过(guò)机会，我认为由于公众的恐惧，这(zhè)种机会很容易发生。

陈(chén)建宇：我觉得(dé)人们(men)对这(zhè)个人形机器人、或者相应的具身(shēn)智能机器人技术的担忧，其实核心来自于对自身安全性的一个担忧(yōu)。

安全其(qí)实有几个不同的层次，最底层的层次是(shì)物理的安全，大家担心机器人会不会在工作的时候(hòu)去伤害到人，那么(me)这是一个层次；当然其实在它分情(qíng)况，那么比如说我们刚才说(shuō)的如果是工厂里面的(de)话，其实如果我们把(bǎ)它跟人工(gōng)作环境隔(gé)开，其(qí)实一定程度上(shàng)能解决(jué)这个问题；同(tóng)时(shí)，我们也需(xū)要从我(wǒ)们的算法硬件等等上面做的更鲁棒来(lái)去优化这个问题。

那么第二个层(céng)次，其实也是(shì)生存上面的问题，但是不是说物理层面的，那么也是不是说全人类的一个担忧，而(ér)是说有一部分人一个担忧(yōu)，他担心这(zhè)个(gè)会替代咱们的某一(yī)些工作，大家会(huì)有担忧，我觉得这个事情可能需要政府或者(zhě)商号进行(xíng)有一些引(yǐn)导，我们(men)尽量的开始去做一(yī)些(xiē)确实(shí)劳动力非常紧缺的这样的(de)一些产业(yè)，比如(rú)说我们(men)一些非常恶劣环境工业环境，或者是比如说养(yǎng)老等。

当(dāng)然第三个层面(miàn)，如果未来我们(men)的具身(shēn)智能机(jī)器人真正拥有了意识，那么这(zhè)个会对人(rén)类的自我存在的价值可能产生一些担忧，我(wǒ)觉得这个事是更(gèng)远的和更大的topic。

王兴兴：我觉得机器人的(de)伦理(lǐ)道德和安全性问题，是非常重要的一件事情，而且我觉得，要希望是在场所有的人都大家需(xū)要共同去维护的(de)一件事情，就有(yǒu)点像现在新能源汽车以及无人(rén)驾(jià)驶，它其实还是有很(hěn)多安全性问题，并且比如(rú)说有一辆早些年新能源汽车(chē)起火了，或者有一(yī)家新能源汽车无人(rén)驾驶出了交通事故，这(zhè)个对整个行业影响是非常大的(de)，会降(jiàng)低普通老百姓对技术行(xíng)业(yè)的认可度以及信心。

这个事(shì)情很(hěn)容易发生(shēng)在人形机器人(rén)和AI这个领(lǐng)域。所以我一直觉得。当(dāng)下以及未来大家(jiā)都应该在机器人安全性上，无论是出台一些(xiē)规(guī)章政策，或者做一些更好的引(yǐn)导，或者需要全世界政府出(chū)台(tái)一些相关(guān)的政策，都共同推动整(zhěng)个行业(yè)的健康(kāng)发展。

王鹤：所以(yǐ)我就从技术的(de)角度，人形机器人它的一个面向终局的(de)技术(shù)必然(rán)是大模型，那么其实只有(yǒu)大模型才可能实(shí)现非常高的通用性，把很多能力全部汇集在一起(qǐ)，把很多模(mó)态，从视觉感知，到语言理解(jiě)，到动作执行，那么融会贯通，那么今天我们(men)在技术上其实是有方(fāng)法对大模型(xíng)的行为进行限制，就是“对齐”，我们在大模型内(nèi)部已经进行了深入研究，那么未来(lái)，我们会对语言模型、多模态模型(xíng)进行更深入的对齐，让它不会伤害(hài)到我们的(de)人类，并且他的技能会被局限在服务的范畴内，那么这一些是我们技术上能做(zuò)的，在技术上之(zhī)外，必然(rán)还需(xū)要政府社会和国际的合作(zuò)。

熊(xióng)友军：我觉得前面几位都说的都挺(tǐng)好的，我(wǒ)就补充一点，就是说我(wǒ)觉得应该是有(yǒu)一些行业组织或(huò)者是(shì)政府出(chū)来，更多在法律法规这方面更多的立法，包括更多(duō)的(de)是做全(quán)社会的机器人使用、伦(lún)理道德方面的一些(xiē)教育(yù)。因为我觉得，任何一个机器人也是一(yī)种工具，放在不同人的(de)手上，它的可能有不同的使用方法，然后只有加强教育，提升(shēng)大家(jiā)对人工(gōng)智能对人形机器人的(de)使用(yòng)，让大家相对安(ān)全角度去考虑，我觉(jué)得(dé)才是一个(gè)正确的方式。

问：您认为 5 年后人形机器人行业(yè)会(huì)发展到什么程度？哪些经(jīng)济领域将率先使用(yòng)它们(men)？

Marc：不，我认(rèn)为人形机器人的出现让事(shì)情变得复杂。我认为机器人在(zài)工业领域的应(yīng)用将取得很(hěn)大进展。我认为(wèi)机器人的应用非常广(guǎng)泛。人们对(duì)此非常关注。正如大家(jiā)所说(shuō)，使机器人变得越来越好的技术(shù)确实正在日趋成熟。我认为工业将继续取(qǔ)得进步。

我认为人形机器人本身总体(tǐ)上仍(réng)然非常(cháng)不成熟(shú)。所以我看不到它们。我知道你可以看看一些人形机器人公司与汽车公司合作的演示。我认为(wèi)这在(zài)某(mǒu)种程度上是一种炫耀，而不是一种生产(chǎn)力。我不知道这是(shì)不是题外话。如果你看看(kàn)仓库机器人，你会(huì)发现最(zuì)大的挑战之一是系(xì)统集(jí)成，特别是(shì)如果它不是围(wéi)绕机器人设计的(de)全新仓(cāng)库。

我认为许多(duō)仓库机器人供应商都在苦苦(kǔ)挣扎，因(yīn)为他们(men)需要(yào)一个系统集成商，而这个系统集成商会消耗掉太多的预算，因此很难(nán)赚钱，这是因为运(yùn)营仓库的 IT 人员并不想开放他们的系统。在那里工(gōng)作的人并不想改(gǎi)变他们现在做的一切。如果机(jī)器人可以处理每一项任务，那就意味着他们仍然需要一个人来完成任务(wù)。使用任何类型的机器人对行业来(lái)说(shuō)都具有很(hěn)大的复杂性。我认为这些都(dōu)是重要因素。

说实话，我原本以为 Spot 会取得更(gèng)大的成功，但 Spot 的推出只是一次实验。我们之所以设计 Spot，是因为它能够让你连接自己的传感(gǎn)器，因为我(wǒ)们不知道(dào)人们想要什么样的传感器。我们之所以设计 Spot，是因为它(tā)能够(gòu)让你对它进行编程，因为我们不知道现在的用户们都(dōu)有(yǒu)哪(nǎ)些应用程序，而我们对它们的使用方式有了更多了解，开(kāi)发人员(yuán)正专注于巨大机遇(yù)，因此 Spot 对人(rén)们的接受度确实产生了影(yǐng)响。

也许如果(guǒ)我们没有(yǒu)足够的商人，能够提前进入并评估它是什么(me)，我们实(shí)际上(shàng)是在做一个实验。也(yě)许人形机器人会有更好的记录。

王鹤：我觉得我对人形机器人的发展总体是比较乐观的，那么(me)在未来5年，我们要完成真正的大规模应用，这件事情对于(yú)整个人形机器人仍然(rán)是一个先(xiān)慢后快，其中(zhōng)慢的阶段，那么一(yī)个里(lǐ)程碑应该(gāi)是——在5年(nián)的时候(hòu)我(wǒ)们能达到万台人形机器人级别的(de)应(yīng)用。

这样的一个市场大约是对标现在商业清洁机器人。我(wǒ)们举个例子，在超市(shì)在万达(dá)广场在写字楼一层(céng)，我们看来回去(qù)洗地擦(cā)地的机器人，那么领先的(de)这个市(shì)场，中国最领先的公司大约是每年出货1万台，那(nà)么他做的事(shì)情不局限做这么简单的事情，它能(néng)达到在各种(zhǒng)场景，不管是商超还是写字楼，还是(shì)很(hěn)多不同的(de)场景进行清洁，但(dàn)是当然是平面清洁。

那(nà)么，对于我们(men)人(rén)形(xíng)机器人来说，我们希望能做到一个立(lì)体操作(zuò)，但是(shì)它的能力可能是局限的，我搬(bān)运我就是上货，我就是取货，对(duì)吧？

我没有更多的能力，但是我也要(yào)实现跨场景的(de)应用，可以在超市里(lǐ)、可以在工厂里、可以在服务场景(jǐng)等等。那么能达到5年1万台(tái)的市场规模的(de)话，我相信后面有真实(shí)世界数据的回(huí)流，那时，我们会(huì)看到人形机器(qì)人应用规模会加快，从慢时代进入快时代。

熊友军：人形机器人我对它的应用可能(néng)会更加乐(lè)观一点，其实(shí)大家看到这两年人形机器(qì)人的进步非(fēi)常快，尤其在(zài)AI驱动下面，实(shí)际上在市场应用方面，你(nǐ)们已经可以看到国的(de)有一(yī)些(xiē)企业(yè)，包括全球企业已经(jīng)开始在一些场景(jǐng)里面做试点应用(yòng)了。

比如说在汽车厂，比如在一些商用服务(wù)场景，已经开(kāi)始做试点，随着(zhe)这(zhè)个试点数据会(huì)形成一个飞(fēi)轮的效应，所(suǒ)以试点进展，然后它会有更(gèng)多的迭代，然后有更(gèng)多数据(jù)驱动，机器人(rén)会在在(zài)一些(xiē)特定的环境里面提高效率，它的速度(dù)，它的随(suí)着量的增长，它(tā)的价(jià)格(gé)会大幅的降(jiàng)低(dī)，这样我觉(jué)得会更快的去促(cù)进(jìn)产业的应用。

我觉得今年年(nián)底，大家应该可以看到，有一(yī)部分的公司已经能够在一些(xiē)比如说新能源汽车厂，比如说在一些特种领域已经开始应用，明年我觉得应该可以看到一(yī)些可能千台左右量级的出货。

问：你能在我(wǒ)们的年轻观众中“点燃一把火”，让他们也想成为“机器人专家”吗？他们(men)应该怎(zěn)么做？

Marc：我认为伊隆·马斯克本人凭借他(tā)的(de)雄心和资源，可能在几年内推出10000个机器人，不一(yī)定是因(yīn)为它(tā)们会直接让机器人赚(zhuàn)钱，但看看他对电动汽车所做(zuò)的一(yī)切(qiè)。他们从无人相信到现在，我比这里的任何人都更加(jiā)怀疑(yí)，包括我在内，到每家(jiā)汽车公司都(dōu)有(yǒu)淘汰内燃机的计划。

我认(rèn)为这是一(yī)件了不起的事情(qíng)。他似(shì)乎对此很认真。所以这在整个人形机器人领域都是一(yī)个真正不确定性的因素。我不确定(dìng)如果他没有(yǒu)抓住机会，是(shì)否(fǒu)会有这么多人形机器人。

我认为机器人玩得越有趣，人们就越(yuè)能与它(tā)们互动。我到处走走(zǒu)，我没有带机器(qì)人来这里，但这(zhè)里有很多机器人，但我到处发表演讲，发现机器人在计划中相当(dāng)无聊。你总是能吸引一群人，只(zhǐ)要你愿意让他们(men)与机(jī)器人互动，他们就会留下来。我认为我们做得越多，公(gōng)众就会越热情(qíng)。我非常欣(xīn)慰，参(cān)加这(zhè)次活动最令人兴奋的事情可能(néng)是有很多人说(shuō)你做的工作是(shì)我十几岁时见过的，现(xiàn)在我正在做。我们(men)越能(néng)展示我们的工作并激励下一代，这就会实现。

陈建宇：我(wǒ)的一个建议是，因为机(jī)会其实永远(yuǎn)是留给有准备的(de)人，那么像Maec做这个事情(qíng)做了做了好几(jǐ)十年，然后(hòu)包(bāo)括(kuò)我们其实台上我们(men)几位(wèi)也(yě)都是多年深耕在机(jī)器人或者相(xiāng)关领(lǐng)域，所以说，因为人形机(jī)器人它(tā)其实也是(shì)一个非(fēi)常长周期的事情，同时它也包罗万象(xiàng)，从(cóng)技术上的软件、硬件、AI再到(dào)商业、产品(pǐn)等等，其实各方面都有，所以说大(dà)家应该去问一问自己的内心在这一步范围内到底自己最有激情，最喜欢的最热爱的是什么？然后从此刻开始就去积累它。最后，要(yào)么等待未来，要(yào)么总有时(shí)刻(kè)你有施展自己的机会。

王(wáng)兴兴：对于我觉得对于所有年(nián)轻(qīng)人，包括(kuò)我们其实(shí)这个时代都是非常精彩(cǎi)的，而且想象一下，大家也知道AI、机器人都是阶梯性发展，就像GPT没有(yǒu)出来之前，大家觉得语言模型没什么用，基本上(shàng)是(shì)非常差，但突然就是发生(shēng)了巨大进步(bù)，非常好，其(qí)实机器人、AI也会遵循这种(zhǒng)规律，所以大家现在可能看到机器人的 AI 能力都比较弱，但实际上这是好事，为什么？因为大家都有机(jī)会去做的更好，可以真正的把(bǎ)这种(zhǒng)人类目前(qián)可以预(yù)估的最伟(wěi)大技术，就在(zài)当下，就在(zài)未来几年，所以这个事情都是非(fēi)常值得做的，

而(ér)且，在机器人(rén)和 AI 另外一个比较适合年轻(qīng)的点，它没有(yǒu)那么多历史包袱，不像(xiàng)数学领域(yù)，有几(jǐ)百上千年的(de)非常天才的数学家，你一定要比他们做得好，你才可以做技术，但是当下(xià)，AI 和机器人(rén)它都非常年轻，尤其 AI 技术就最近(jìn)几年的东西，所以非常适合年(nián)轻人。我一直感觉在如果在未来5年到10年(nián)或者几十(shí)年(nián)回看我们现(xiàn)在这个时代，所以想(xiǎng)想这种感觉，真的非(fēi)常激动(dòng)人心。

王鹤：我觉得其实未来的15年，在我心目中会是人形机器(qì)人，从当下在(zài)产(chǎn)业中没有规模化应用(yòng)，到可能(néng)成长到跟今(jīn)天汽车的产量一个万亿市场(chǎng)的过程。那(nà)么在这个过程中，其实(shí)对(duì)年轻人来说，那么我觉得大家就是做(zuò)好自己就可以了，因为15年之后很多工作都是跟人形机器(qì)人相关的，今天可能你负(fù)责卖车(chē)，那么(me)15年后，你可能岗(gǎng)位就(jiù)调到卖人形机(jī)器人对吧？今天你是班级里头的佼(jiǎo)佼者(zhě)，那么你(nǐ)学 AI ，那么(me)你可(kě)能发现(xiàn)你的职业生涯就是围绕着进一步提升人形机器人(rén)的能力展开的，所以大(dà)家做好自己，我们一起共享(xiǎng)光明(míng)、人形(xíng)机器人的(de)未来。

熊友军：其实我是(shì)经历过个人电(diàn)脑时代，我(wǒ)经历(lì)智能手机时代，我(wǒ)经历过(guò)移(yí)动互联网的时代(dài)，现在其实我们正在经历智能汽车的(de)时代，电(diàn)动(dòng)汽车的时代，我觉得下一个(gè)时代实际上就是聚生(shēng)智(zhì)能的时代，而聚生智能时代的典型代表其实就是人性机器人，所(suǒ)以(yǐ)我(wǒ)给现在的年(nián)轻人建(jiàn)议就是说保持(chí)野心，怀揣大梦想。

问：让(ràng)我们在小组成(chéng)员之间(jiān)花几分钟时间讨论一(yī)下：你们想要互相问什么问题？

陈建宇：所以我想(xiǎng)问Marc，你(nǐ)认为对于机(jī)器人和(hé)人工智能来说最重要的研究问题是什么，例如，如果你只能选择一个研究(jiū)项目(mù)，那么你选择(zé)哪一个？

Marc：让我从侧面回答一下，这(zhè)也是一种回避你的问题(tí)的(de)方式。最后我没(méi)有展示我的最后一张(zhāng)幻灯片。我的最后一(yī)张幻(huàn)灯片是一个(gè)展示机器人故障的(de)视频。它(tā)展示(shì)了，我不知道它大概有 2 分钟长，可(kě)能有 25 种不同的(de)故障。我认为故障是工作中最有趣、最(zuì)有意思、最有用的部分，关注(zhù)它们，然后在你的工作不工(gōng)作的时(shí)候继续前进(jìn)，这真(zhēn)的很重要(yào)。这不是研(yán)究的主(zhǔ)题，但它(tā)是(shì)一种工作精神。所(suǒ)以(yǐ)如果我要问你们所有人这个问题的话(huà)，那就是我还没看到任何人在演讲中提(tí)到过事(shì)情无法正常运转，而且我敢肯定，单一(yī)机器人不会在不发生碰撞的(de)情况下完成那些后空翻(fān)以及(jí)它们所(suǒ)做的所有很酷的事情。你喜欢碰撞吗？

王(wáng)兴(xīng)兴：Marc先生，很荣幸今天见到您，我其实想有好奇想问一下，您觉得对于人形机器人的手，您觉得未(wèi)来几年比较合适的有几个手指(zhǐ)，或者几个电机，这会是比较好的一个方向(xiàng)？

Marc：再次(cì)，我(wǒ)要回(huí)答一个略有不同的问题。我们研究所最近举办了一场研讨会，名为“对操纵的反(fǎn)向观点”。我认为灵巧性确(què)实很重要，但基本上它并没有取得很大进展，尽管人(rén)们至少已经为此努(nǔ)力(lì)了 50 年。我认为我们(men)必须(xū)以不同的方(fāng)式思考，再次尝试不同的(de)东西，就像我今天在演讲中开始的那样，也(yě)许我们需要更(gèng)多的动态操纵，而不(bù)是所有的静态抓握。我认为很多学习界的人在提出他们正在学习的灵巧性(xìng)的要求时对自己要求不够。他们做的事情很(hěn)简单，很容易。

我认为那里是有机会(huì)的，有多少只手我不(bù)知道(dào)有多少根手指。我认为(wèi)五个已经很多了。但也(yě)许有一天我(wǒ)会觉得更有趣的问题是手掌(zhǎng)怎么样？我们的手掌功能非(fēi)常强大，它们不仅仅(jǐn)是静态的(de)块。而且你看到(dào)的几乎每个机器人手都有许多手指在做这件事，但(dàn)仅此而已(yǐ)。

王鹤：之前我提到过，大概 15 年后，世界上会有数百万、一千万(wàn)个人形机器人。如果人形机(jī)器(qì)人具有通用目的，那么人(rén)形机器人是终极体现，那么这种(zhǒng)通用目(mù)的(de)的终(zhōng)极技术是什么？对于人类噪音，您是否认为视觉、语言、动作模型，这些端到端模型(xíng)是人类噪(zào)音的终极技(jì)术或方法？

Marc：我很难相信，端到端是取得进步的方法。也许(xǔ)最终在渐近(jìn)线(xiàn)上端到(dào)端是正确(què)的方法，但我认(rèn)为我们知(zhī)道的太多了。

说实话，我认为人们过分看重（机器(qì)）学习。我(wǒ)知道应(yīng)该对(duì)学习持乐观态度，但如果你看看当今存在(zài)的解决(jué)方案，你会发现最好的解(jiě)决(jué)方案中学习所起的作用微不足道或微不足道(dào)。当然，在波(bō)士顿动力公司，今天学习很少，尽管人们正在(zài)努力。我认为控制系统(tǒng)、控制理论、观察(chá)器，这些在过去 20 或 30 年建立起来(lái)的(de)东西仍然发(fā)挥着巨大的作用。

我不想(xiǎng)就这样把它抛弃。我希望我们能真(zhēn)正拥(yōng)抱学习，但要把它与我们已经知道的东西结合(hé)起(qǐ)来，找到一种方法把它们结合起来，至少在接下来的(de)5年(nián)或10年(nián)里，也许在渐近线(xiàn)上，情况会有所不同。

熊友军：我的一个(gè)问(wèn)题是，Marc作为波士顿动力的创始人，您之前开发(fā)了像Atlas这样(yàng)的非常令人惊奇(qí)的这种产品(pǐn)，但是我们(men)前不久我们看到波士顿动力终止(zhǐ)了这个机器的研发，然后由原来的(de)液压驱动，转向(xiàng)纯电(diàn)驱(qū)动的这(zhè)种方式。对这方面是出于什么样的考虑？是因为成本的考虑，还是因为出(chū)于商业化(huà)的考虑？同(tóng)时我还想知道，波士顿动力未来5年的一些这种计(jì)划，对商业化的一些计划。

Marc：我认为，如果你问为什(shén)么要进行转变(biàn)，我认为有两个关键因素：一个是液压机器人(rén)，我喜欢液压技术，我会用液压技术制造很多机器人。我认为，建(jiàn)造(zào)人形机器人或类似人形机器(qì)人仍有空(kōng)间，它们将继续使用(yòng)液压技术，因为重量和强度等因素。

但我认为有两点(diǎn)。一是它们很麻(má)烦，至(zhì)少(shǎo)对于像 Atlas 这样的高性能机器人来说，尽管我们付出了无尽的(de)努力，也永远无法让它们(men)完全不(bù)漏油。当你把石油机器人放到工厂和家里(lǐ)时，它们就不能滴油；同时，很难找(zhǎo)到精通液压技术的人，因为人们认为(wèi)这是非常古老的东西，尽管 Atlas 在液压工作(zuò)原理方面有很多创新，从服务器阀门到 HPU 液压动力装(zhuāng)置，一直都是如此，确实有创新波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”的(de)东西在进行(xíng)；最后，我(wǒ)认为电动汽车在规模上已经(jīng)足够(gòu)强大，它们可以参与竞争。我不想代表波士顿动力(lì)发言，尽管我是创始(shǐ)人之一，并且(qiě)仍然是董事会成员，但我认为他们必须有自己的计划(huà)，说明未来的计划以及技术的所有细节。我(wǒ)想随着事情的发(fā)展，你会发现更多这方面的(de)内容。

主持人(rén)：非常(cháng)感谢。我想观众肯定会有更多问题，也许吧，但我们的时间真的不(bù)多了。所以非常感谢各位小(xiǎo)组成(chéng)员。非常感谢观众的到来和聆听。我认(rèn)为这是一场非常精(jīng)彩的会议，尤其是小组讨(tǎo)论。我对组织者的建议是，我们明年再(zài)举办一次类似的会(huì)议(yì)，然后(hòu)我们可以回顾进展和未来的步骤。

未经允许不得转载：橘子百科-橘子都知道波士顿动力创始人对话国内四大AI机器人CEO：“人形机器人是炫耀而非生产力”