橘子百科-橘子都知道橘子百科-橘子都知道

波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

8月(yuè)24日(rì)下午,2024世界机器(qì)人大会上,举行了一场期待(dài)已久的(de)中国、美国(guó)“具身智能”与(yǔ)人形机器人领(lǐng)域(yù)学者的(de)“世界对谈”。

大名鼎(dǐng)鼎的“机器狗之父”、美(měi)国波士顿动力(lì)创始人Marc Raibert(马克·雷伯特)首次来到北京(jīng)。他说,“我简直(zhí)不敢相信,不仅是机器人的数量,难以置信(xìn),还有这么多热(rè)情(qíng)的人参加(jiā)了展览(lǎn)。中国对机器人的兴奋和(hé)热情很高。”

而此次与Marc对谈的四位CEO所(suǒ)在的公司(sī)也不寻 常:除(chú)了宇树(shù)科技之外,星动纪元、银河通用、北(běi)京具(jù)身智能 机(jī)器人创新中(zhōng)心都成立不足2年(nián),一(yī)出道就是具身智能和(hé)人 形机器人行业的“顶流”。

而且(qiě),星动纪元、银河通用背后也站着中国最(zuì)高学府:北大和清华,代表着中国前沿(yán)科技创新的重要来源。

其中,星动纪元(yuán)由(yóu)姚期智带领(lǐng)的清华大学交叉信息研究院孵化成立的,星动纪元(yuán)创始人(rén)陈建宇现在还(hái)是清(qīng)华大(dà)学交叉信息研(yán)究院 助理教授,公司融资超亿元,联想创投已加入其中。

银河通用机(jī)器人创始人的 王鹤则是北京大学助理教授,也是北京(jīng)智源人(rén)工智能研究院(yuàn)具身智能研究(jiū)中心(xīn)主(zhǔ)任,过去半年,银河通用完成天使轮融资共(gòng)计7亿(yì)元人民币,刷新 了国内人(rén)形机器人领域单轮(lún)融(róng)资规模,美团战投 、北汽产投、商(shāng)汤国香基金、讯飞基金、启明创投、蓝驰(chí)创投、经纬创投、源码资(zī)本、IDG资(zī)本等头部财务机构都(dōu)参与(yǔ)其中。

而北京具身智能机器人创新中心(xīn)则是北(běi)京市(shì)发起成立的机器人“国家队”机构。北京具身智(zhì)能机器人创新(xīn)中心总经(jīng)理熊友军(jūn),目前还是“人形(xíng)机器人第(dì)一股”优(yōu)必选科技CTO。

Unitree Robotics(宇树 科技)也是当下人形(xíng)机器人行业的明星企业。公司创始人、CEO、CTO王兴兴毕(bì)业于上海大学(xué),取(qǔ)得了机械(xiè)工程(chéng)硕士,具有近10多年足式机(jī)器人研(yán)发(fā)经验(yàn),拥(yōng)有产品从0-1-100的研发(fā)与商业化落地能力,100+项机器人相关专(zhuān)利。

此次圆桌由(yóu)德(dé)国慕尼黑工业大学(xué)教授 Alois.C.Knoll主持,美国波士顿动力创始人Marc Raibert(马克·雷伯特),与中国四大 AI机器人企(qǐ)业领军者——陈建宇、王兴兴、王鹤、熊(xióng)友军(jūn),五人围(wéi)绕机器人行业(yè)、AI 大模型(xíng)驱动机器人发展等议题展开讨论。

一个多小时的圆桌当中(zhōng),Marc表示,未来(lái)5年,机器人硬件发(fā)展仍将(jiāng)非常重要,但同时,能够打破语义理解(jiě)障碍的基础模型或(huò)其他 AI 方法也将(jiāng)对机器人技(jì)术(shù)产生更大(dà)的影响。不(bù)过,要想(xiǎng)取得机器人领域真正的进步,就需要更高的可靠性和安全性,未来(lái)人(rén)们需要投入大量资源努力解决此(cǐ)类问题。

Marc非常不看 好人形机器人行业。他认为,工业机器(qì)人已经非常成熟,而且能够商业(yè)化,目(mù)前人形机器人“在某种程度上是(shì)一种炫耀,而不是一种生产力”。

陈建宇(yǔ)表示,过去10年AI发(fā)展(zhǎn)很快,从简单的图像处理,到(dào)深度(dù)学习、强(qiáng)化学习,再到ChatGPT技术,这对(duì)于未来“具身智能”产生很大(dà)的影响。未来几年,AI、具身 智能会与(yǔ)人形机器人不断(duàn)融(róng)合,去 训练一个通用模型。他相信未来(lái)5年,我们将迎来“机器人的ChatGPT时刻”。

王鹤指出,当前 AI 大(dà)模型在机器人 上仍有巨大的局(jú)限,尤其是“泛化的(de)开瓶盖(gài)”技能还(hái)没有训练出来,但同(tóng)时,这也是大模型带来了重要机会,一旦(dàn)大模型涌现能力不断加强,他认为未来5年,依然有一个至少(shǎo)做(zuò)操作任务的通用机器人机会。

熊(xióng)友(yǒu)军表示,当前关节性能(néng)提升、高的能量和电池密度的提升非(fēi)常快,使得机器人的(de)运动控(kòng)制能力、电机等方面提升非常快(kuài)。未来5年(nián),机器(qì)人关节和能量密度会持续提升。毕竟和人类相比,现在机器人的(de)能量执行效率还是有非常大的差距(jù)。

以下(xià)是(shì)钛媒体AGI编辑(jí)对(duì)此次圆桌全文(wén)整理:

问:您能否向观众简单介绍一下您的工作:您为什么以及什么时候开始对人(rén)形机器人感兴趣的?

Alois:我从 2001 年开(kāi)始担任慕尼黑大学的教授。我对人类(lèi)噪音的一个方面产(chǎn)生了兴(xīng)趣,那(nà)就是(shì)具象化,对吧?我的(de)朋友 Pfeiffer 和我们一起(qǐ)从大(dà)学毕业。苏(sū)黎世退休了,不幸(xìng)的是,我们坚信具象化。所以我(wǒ)们认为,在我们的人类类型中,智力只会在(zài)以非常自然的方式与世界(jiè)相连的人类类型身体中(zhōng)发展。所(suǒ)以身体(tǐ)应该有(yǒu)同样的动力,同样的尺寸,等等。否则,就很难做到这(zhè)一点(diǎn),你在这里(lǐ)看到(dào)的 Kronos 系列机器人,左边,左下角 的 Roll Boy2024 就是这种信念的结(jié)果(guǒ)之一。

Marc:我认为你贴出的(de)那张图(tú)片对我回答这个问题很有帮助(zhù)。如果(guǒ)人形(xíng)机器 人意味着两只胳膊、两条腿直立向前,那么直到最(zuì)近我才(cái)对(duì)此感兴趣。事实上,我一直认为现在(zài)的公司注重功能性,作(zuò)为一名教授,我认(rèn)为(wèi)功(gōng)能性才是最重要的,机动性、灵巧性、感(gǎn)知力和智能,而外形(xíng)和外(wài)观则是次要的。另一(yī)方面,如果(guǒ)人形机器人意味着像腿 一样的(de)动态生命,我会把它与世界互动。我一(yī)直是人形机器人(rén)的粉(fěn)丝,尽管我(wǒ)建造(zào)的第一个机器人是弹簧单高跷的东西。我认为人(rén)形机(jī)器人的许(xǔ)多基本要素都在那(nà)些弹簧单高跷的东西中。确实,当我们开始建造机器(qì)人时,波士顿动力公司是直立(lì)的,有两(liǎng)条腿,两(liǎng)只胳膊。有时领先。如果你看看公众的反应,你会(huì)发(fā)现 YouTube 点击量增加了 10 倍,我非常关注这些点击量或评(píng)论(lùn),或者只是人(rén)们的态度。人们非常感兴趣。普通的非(fēi)科学家,比如说,非工程师,他们对人形(xíng)机器人很感兴趣(qù),而狗惹(rě)恼机器人却得不到同样的赞誉。

熊友军:我是从读博士的时候,2000年开始做(zuò)机器人的研发(fā),当时读博士(shì)的时候,那时候更多(duō)的是做工(gōng)业(yè)领域 、特种领域的(de)一(yī)些机器人,用在一些危险的环境里面(miàn),因为那(nà)时候机器人技术(shù)还是非常不成熟,但在很多特种领域和危险场景里面,是需要用机器人去完成工作了(le),然而那时(shí)候机器 智(zhì)能实际上是很差的。所以我们当时想的办法,是将机器人的智能跟人的智能结(jié)合起(qǐ)来,所以做(zuò)了一些机器(qì)人(rén)要操作的一些事情。

但在遥控操作完成这些工作的过程中(zhōng),我们发现有很多的场景,实际上用轮 式的工业机(jī)械手臂是解决不了的,尤其是有时候在一(yī)些(xiē)特种场景环境比较狭小,然后(hòu)环境比较复杂的轮式,然后履带式实际上根本就进不去,但是人是可以 进去。还有(yǒu)一种,是要试用(yòng)很多工具(jù)去完成那(nà)些工作。

所以当时我们就觉得,如果说有微型机器人 的话,实际上应该是能够提供(gōng)很好(hǎo)的解决工具,或者一种解决方(fāng)案,但(dàn)是(shì)我们当时那时候(hòu)也看到了日本(běn)本田ASIMO,给我们提供了很多的一些启发,所以(yǐ)那时候我就(jiù)对人形机器人非常(cháng)感兴趣。后面毕 业之后,一直在做(zuò)机器人相关的工作(zuò),

2012年,我跟优必选科技CEO周剑先生创立了公司,做人形机器人研发(fā)工作,去年从深圳到北京开始筹建(jiàn)具身智能机器人创新中心(xīn),现在也是一直在聚焦人形机器人方面的研发,主要的想法是希(xī)望(wàng)说能够解决(jué)人形机器人方面的一些共性(xìng)、关键的技术(shù)问题(tí),比如本(běn)体的(de)一些(xiē)基础研发不足,其实我们现在微(wēi)型(xíng)机器人(rén)在本(běn)体在关键的核心器(qì)件,然后在一些传感器方面其实上有非常多要攻克的地方。另外在运动控制,实际(jì)上我们也(yě)做了非常多的运动控制的技术(shù)研 发,采用深度(dù)学习强化学习的这种运动控制的方式,包括现在也用一些融神经 网 络的一些方式用去做(zuò)运动控制,同(tóng)时其实我们现在还(hái)在做关于智能方面(miàn)的一 些研发,比如(rú)说把用现在具身智能的方式,做一些(xiē)基础性工作,比如建(jiàn)它(tā)的数据集,研发机器人大模型框架等(děng)。所以这(zhè)就是现在我在做的一些事情。

陈建宇:其实这个兴趣是很小的时(shí)候,就一直对智能机器人非常感兴趣,我印象很深刻,刚刚兴兴说她10岁的时候,我估计也是差不(bù)多(duō)类似的(de)时间,不过当时看的不是波士顿动力,当时关注的是ASIMO系列机器人,当时我就非常的去着迷。然后我觉得(dé),创业这件(jiàn)事(shì)其实(shí)是充满了挑战 性的(de),marc创办(bàn)了波士顿动力做了40多年,其实我是非常尊敬的,就是说你没(méi)有一个发自内心的、天(tiān)生热爱的话(huà),其实(shí)很难去坚持下来的。所 以对我来说,对这类机器(qì)人的热爱,我觉得某种程度上是从(cóng)小就具备就拥(yōng)有的。

那么(me)真正开始做机器人其实是本科的时候。当时在学校里面,我就接触真正(zhèng)意(yì)义上的机器人的研究,当时接触了双(shuāng)足机器人,主要(yào)是做的就是捕获点步态规划相关的研究。后来,博士阶段继续做机器人,虽然不是(shì)人形机器人,但是(shì)也是相(xiāng)关的一些机器人(rén)的(de)领域,控制它的学(xué)习,包括无人(rén)车和机械臂。而真正(zhèng)的去(qù)全力做人形(xíng)机器人,是在我(wǒ)回国之后,然后在现在清华正式投入(rù)去做(zuò)人形机器人,还孵化了星动纪元公司,如今我们已经做了最新一代、第六代机器(qì)人了,然后我们也在展(zhǎn)会上面带来了我(wǒ)们机器(qì)人的实物,欢迎(yíng)大家去关注(zhù)。

王兴(xīng)兴:大家好,我是宇树科(kē)技(jì)创始人王兴兴,刚才有提到我大概可能10岁的(de)时 候(hòu)就看过marc先生在MIT实验室做的双 足,还有(yǒu)单条腿的机器人(rén),然后印(yìn)象非常深,在09年、10年的(de)时候,大概大一寒假,我就做过(guò)一个小的人形机器人(rén),然后当时做的不是特别满(mǎn)意,然后后来的话,就在(zài)研究生期间做了XDog这款机器人,差(chà)不多(duō)在13年到(dào)15 16年,这款机器人的话又采用了比(bǐ)较低成本的硬件,然后运动性能非常好,可以直接实(shí)现 关节的力控以及整机的力控(kòng)。

后来的话,一开始我对人体(tǐ)机器人的技术还(hái)是 跟相(xiāng)对来说(shuō)比较悲观的,但是后来的话在(zài)2022年左(zuǒ)右,整个的(de)机器(qì)人、AI技术的进步,然后再加(jiā)上(shàng)ChatGPT出来(lái)以后(hòu),大家都看到人形机器人和AI结合的可能性(xìng),所以说我们公 司(sī)又重新开始做人形(xíng)机器人。说(shuō)实 在的,其实(shí)我真正感兴趣的并(bìng)不是说人形(xíng)机器人,而是新(xīn)的一个(gè)智能(néng)体机(jī)器人的形态。而(ér)人形机器人可能只是说(shuō)目(mù)前大家比较公认的、一(yī)个最有(yǒu)可能性的通用机器人和通用(yòng)AI的结合体(tǐ),但是这可(kě)能并 不是个唯一的,我真正(zhèng)希望(wàng)能诞生甚至更(gèng)比人(rén)更(gèng)高(gāo)级(jí)的一个智能体形(xíng)态,可以大(dà)大推动整个人类工业的变革,推动新的工业革(gé)命。

王鹤:我是北京大学计算机学(xué)院(yuàn)助理教授,也是北大银河通(tōng)用具身智能联合实(shí)验室的主任王鹤,那么,我(wǒ)跟(gēn)人形机器 人、具身(shēn)智能结缘,主要是从我在斯坦福大学(xué)开始读博的时(shí)候。那么2016年的时候(hòu),当时深度学习技术已经出来了(le),也应用在很多图像识别分类这些任(rèn)务当中。那么当时作为一个(gè)前 沿研究,我们试图去理解人类是如何把感知思考还有交互的能力融合在(zài)一起的。

所以我博士期间的第一个工作(zuò),就用一个视觉模型来看桌面上人的动作和物体的一个(gè)运动,然(rán)后推(tuī)理人下一步想要什么,这是一个语言模型。

最后(hòu)再用一个简单(dān)的机器 人,智能的(de)马克杯去响应(yīng)人的动作,那么(me)这个工作获得(dé)了欧洲图形学的(de)最佳论文(wén)提名,但是我们认(rèn)为它非常的(de)不(bù)足,就是我(wǒ)们的一个马克杯只能在桌面上(shàng)移动响应人的动作,它没有跟人交互的能(néng)力,我们的视觉只能看有限的几一种物体,那么我(wǒ)们的语言模(mó)型(xíng)只能(néng)根据这(zhè)个人跟 这些桌面东西的一些动作来做简(jiǎn)单的推理。

那么通过过(guò)去8年我们的研(yán)究,在怎么样把机器(qì)人的(de)操作(zuò)能力搞得更泛化,什么东西都能抓(zhuā),都能够放置,那么还有跟现在的多模(mó)态大模型技术结合(hé),真(zhēn)的明白人类(lèi)想让你干什么,那么(me)言出法随的去执行所以去年我(wǒ)们就孵化了北京银河通用这(zhè)家人形机器(qì)人公司,我们现在也是把视觉、语言、动作这三种不同的模态融合到大模型当中,真正的赋能人形机器人,让人形机器(qì)人能够走进千行百业、千家万户,这是我(wǒ)们的愿(yuàn)景。

问:你认为,我们 今(jīn)天拥有(yǒu)的哪(nǎ)些(xiē)重要技术是 10 年前没有的(de),但对于实用的人形(xíng)机器人来(lái)说却至关重(zhòng)要?它(tā)们在未来(lái) 5 年将如何发展(zhǎn)?

Marc:我认为硬件开发仍将非常重(zhòng)要。如果 我们谈 论未来 5 年,毫(háo)无疑问,能够打(dǎ)破(pò)语义理解障碍的基础模型或其他人(rén)工智能方法(fǎ)将产生最大的影响。

我认为,人(rén)类可以做的就是,概(gài)括和理解他们所看(kàn)到事物的含义,而目前还无法真正(zhèng)捕捉到这些含义。我相信,如果人工智能能够在这方面取得进展,我认为它(tā)将产生巨大的(de)影响。

实际上,过去十(shí)年来,每个人都在计算机、传感器、感知、控(kòng)制等方面取得了巨大进步。电池,我认为人们忘记了电(diàn)池。虽然电池是工业时代(dài)的产物,但是它们(men)确(què)实非常重要。是的,所以在电机方面过去 5 年里,人们做得很好,我认(rèn)为电机(jī)已经取(qǔ)得了长足的(de)进步,当然(rán),我们将看到更多。

陈建宇:我(wǒ)从(cóng)AI的视角来讲一讲(jiǎng),觉得非常大的一个(gè)不同。如果(guǒ)按照10年前的话,其(qí)实是(shì)2014年左右,当时是DeepLearning刚刚出来不(bù)久,它其实解决了(le)很大一部分,比如(rú)图像(xiàng)处(chù)理等等(děng)一些问题。

那么后面(miàn),其实有我认为两个最重要的里程(chéng)碑:一个是以16年阿尔法(fǎ)狗为代(dài)表(biǎo)的深度学习,紧接着把它用在了强(qiáng)化学习上面,做(zuò)深(shēn)度强化学习,解决了一些问题;第二个是(shì)以ChatGPT为代表的大语 言模型(xíng),所以这点我认为(wèi)是过去(qù)10年没有的,但(dàn)又对(duì)未来我们人(rén)形机器人,或者是 具身智(zhì)能起到非常大的(de)决定性作用的两个因素。

那么可能在接下来的这几年时间,这两项技术会非常深度的跟人形机器人、具身智能融合起来,但(dàn)他们也分别需要经过一定(dìng)程度的(de)训练,从而能训练比(bǐ)较(jiào)通用(yòng)的一个模型,那么我们(men)也能(néng)解决更加丰富的物(wù)理世界的数据程序。那(nà)么我(wǒ)相信,在接下来的5年(nián),这(zhè)几项技术都能起到非(fēi)常大的一个进展,我们可能会在5年内(nèi)迎来“机器人的ChatGPT时刻”。

王兴兴:对过去10年最大的,还是AI技术带来的各种事情(qíng)有(yǒu)更多的(de)信心。我觉得(dé)除了 AI技术本身最大的点,对于人形机器人,对于整个社(shè)会共识(shí)的增加也是非常关键的,就是目前大家更加相信AI,更加相信人 形机(jī)器人可以诞生更多价(jià)值(zhí),这在10年前是完全不能想象的,那时整个社会基本(běn)上对此 都(dōu)完 全没有信心。

另 外一(yī)点的话,我觉得在未(wèi)来5年,总体上是肯定 整个 AI 机器人、AI模(mó)型变 化会非常快,因为目前的AI真的是(shì)日新月异,大(dà)家可以(yǐ)用AI集成技术,去 搭建(jiàn)各 种自(zì)己的模型去做(zuò)训练,这整个已经变成一个非常的扁平(píng)化,以及容(róng)易操作的过程,其实很多 人大家都可以(yǐ)参与进来,去做机器人模型并且去做训练,所(suǒ)以我觉得。未来5年这块(kuài)的各 种(zhǒng)AI模型创新,包(bāo)括更新的一些(xiē)神经网络模型(xíng),包括脉冲神经网络(luò)等都有很大的一些机会。

王鹤:我(wǒ)觉得(dé)10年好快,10年前是2014年,其实我 们已经看到inbody的AI,甚至不是一个(gè)在西(xī)方的学术 界比较popular的词(cí)汇,那么过去的十年,我觉得一大技术(shù)的进展,就是我们在具(jù)身智能里头已经(jīng)有一些技能实现了非常强的泛化性。

那(nà)么以我个人的研究(jiū)举例,在抓取问题上,我们取得(dé)了比较长足的进步,那么我们从只能抓方块圆(yuán)的这些特定形状的物体,到基于三(sān)维视觉传感器,我们可以抓不透(tòu)明(míng)、不反光(guāng),也就是在深度传感器里头能完美成像的(de)这些物体,到我(wǒ)们最近的技术能够预测透(tòu)明、高反光(guāng)、金属(shǔ)、吸光这些(xiē)非常有挑战材质的物体,基(jī)于它去做泛化抓取操作(zuò)。

那么在今天(tiān)的展厅,我们(men)都接(jiē)受观众给我们的各种形状,各种材质(zhì)随便堆叠乱(luàn)七八糟(zāo)的物(wù)体(tǐ),我们(men)的机器人(rén)都(dōu)展(zhǎn)示了非常泛化和高成功率的抓取能力,那么现在的问(wèn)题是,像这样的每一个技能,大家都(dōu)在分分别的(de)去做开(kāi)发,那么 很多人会提(tí)问你能帮我抓水瓶,你能不能(néng)帮我把瓶盖给拧(níng)开?我非常不好意思的(de)说,现在泛(fàn)化的开瓶盖技能我们还没有训练出来,这个就是大模型能够带给我们(men)的机会,那么大(dà)语言模型涌 现,也就 是这种紧急行为紧急行为,他(tā)能够在只见(jiàn)一次(cì)或者是第一次零次的演示的情况下,他都理解(jiě)你要生成什么样的(de)文字,我们相信未来的5年给我们的机会就是发展机器人基础大模型,它能够实现涌现能力,它吞吐足够量的数据后,有灵巧手,它能够抓(zhuā)能(néng)够加(jiā)、能够拧,能够掰各种基本的手的(de)各(gè)种运动能力都有了以后,他能涌现,我们给他看一个视频,他就能理解(jiě)这个(gè)活怎么干,到那(nà)个时候我们真正的就有一(yī)个通用的、至少做操作任务(wù)的的机器人了,这是我认为未来5年的一个机会(huì)。

熊友军(jūn):我觉得这一轮的机器人(rén)技术的进步(bù)主要是(shì)由AI来驱动的。毫(háo)无疑问, AI驱动我觉得体现在几个方面。

第一个(gè)就是它人机交 互性能得(dé)到了极大的提升。我记得(dé)10年前我们做(zuò)人工智能、做机器人的时候(hòu)的(de)那些交互,如果说我要加语音加视觉,第成本非常高,第二个我们要(yào)做大量(liàng)的研发的工作,我们需(xū)要(yào)几个博士、硕士带着一个团队,花很长的时间才能够完成一些物体(tǐ)识别、语音合成,自 然语言理解NLP,还有甚至是TTS、语音合成等方面 的(de)一些工作,甚(shèn)至包括导航,但是我觉得,现在随着技术的进步,我们现在做人形机器人 的(de)大模型,我们直接一个端到端(duān)的直接语音给指定给他,然后很快他就可以有比较好的行为输出,有(yǒu)很好(hǎo)的(de)意图理解,然后做任务规划等。这是一方面,我(wǒ)觉得这一轮对(duì)人机(jī)交互、对动物的规划(huà)、对执行(xíng)等方面(miàn)都有巨大提升,在10年(nián)前(qián)基本上都很难去想象。

然后第二个(gè)现在的这些硬件方面也有极大的提升(shēng),体现在两个 方向,第一个现在关节的性能的(de)提升 是非常(cháng)快的,大家可(kě)以看到很多公(gōng)司机器人可以开(kāi)始去做一些非(fēi)常动态(tài)的(de)、剧烈的运动,实际上离不开关节 性能的提升、高能量密度比,然后高的转速、高性能(néng)等这些技术的提升,实际上,在10年前我觉得是很难去 做到(dào)的。当 然(rán)了这也有运动控制能力的提升 、电机的提升,现在其实也有采用更多结构设计的方(fāng)式,更适合它的布局等方面都有非常(cháng)大的进(jìn)步,包括把腿(tuǐ)的转成(chéng)惯(guàn)量、把电机往上提等等,有各种各样的结(jié)构设计(jì)的技术的变化。

另外,刚才还提到能(néng)量,其实早前(qián)我觉得10年前我们做 机器人的(de)时候(hòu),一个电池就像我们背后要背一个非常巨大的电池包能源包,而且能够持续的时间(jiān)很短。但是这几年(nián)随(suí)着(zhe)新能(néng)源汽车对电池技术的推动作用,其实(shí)我(wǒ)们看到它的电池(chí)能量密度大(dà)幅提升,我现在一个比较(jiào)小的电池,可以支持比较(jiào)长的时间,我觉得(dé)这是一个非常重要的技术突破。

未来,我觉得5年之后(hòu),这几 个可能还是一个重大、要突破(pò)的方向,像刚才说的人机交互方面,我们(men)希(xī)望大模型(xíng)能提供更长(zhǎng)期的(de)任务规(guī)划,然后做意图理解等等方面,我觉得我们能只要给他一个非常模糊(hú)的(de)指(zhǐ)令,他就可以给我们输(shū)出我们(men)很标准的很(hěn)自然的这种交(jiāo)互的结果。第(dì)二方面(miàn),可能就是在(zài)规划实施任务(wù)方(fāng)面是一个非常重大、要 攻克 的方向(xiàng),我们环境会经常变,面对的是(shì)一个动态环境,然后机器人能够(gòu)根据环境变化,能够实时(shí)去改变它的一些执行策略等(děng)。当然,像能量方面我(wǒ)觉得是一 个持续要提升的,它毕竟现在能量(liàng)执(zhí)行效率和我们人(rén)相(xiāng)比,还是有非(fēi)常大的一个差距。

问:大规模(mó)部署人形 机器(qì)人需 要完成哪(nǎ)些任务?

Marc:但是如果你现在 从更宏观的(de)角度来看,我刚才说了如果你想致富你现在就不会着(zhe)手开 公(gōng)司,但是如果你想生(shēng)存下去。你至少 也得收(shōu)支平衡。

我想这(zhè)是一个更长远的计划,我认为(wèi)要想取 得(dé)真正的进步,你必须暂停,或者我(wǒ)不是说你必须暂停,我们在我的研究所暂(zàn)停,让机(jī)器人(rén)更 可靠的(de)本地目标将是一件(jiàn)关键的(de)事情,如果我能指出旧金山的(de)自动驾驶汽车,他们杀死了一个人,这实际上甚至不是自动驾驶汽车的坠落。然后(hòu)克鲁兹完全退出了旧金山。我知道现在(zài)还有很多事情在(zài)进行(xíng),但这(zhè)在机器(qì)人(rén)领域(yù)很容易(yì)发生。因(yīn)此,可靠性是一(yī)个关键因素,这是人们投入大量资(zī)源努力解决的问题之一。但这无助于解决,将(jiāng)我们带入下一代的(de)更大问题。当我说我不认(rèn)为(wèi)每个人(rén)都必须专注于你所说的(de)真正有用的(de)东西时。

陈建宇:要做到大规模应用的话,有非 常重要两个事情(qíng):一(yī)个是能不能找到大规模的需求,另一个能(néng)不能有(yǒu)我们技术,足够去(qù)实现、满足需求。

其实现在有很多零散的(de)表演需求(qiú),如果需要真的达到max(大规模)的话,我觉得主(zhǔ)要(yào)还是看劳动力,非常密集的一(yī)些产业,比如三个阶段(duàn),一个是工业、商用和服 务。

大体我认(rèn)为(wèi),技术(shù)也基本上是按 照这样一个方向去成(chéng)熟发(fā)展,其(qí)中我(wǒ)觉得给我的感受,我(wǒ)认为工业的话(huà)可能会比较快就能够去(qù)用上了。其实(shí)刚才Marc的报告中里(lǐ)面也已经展现(xiàn)出来了,不管是人形(xíng),还是一些轮(lún)式的机(jī)器人,在工厂搬运的这一类的环境里面,已经是达到了非常接近(jìn)人类的一个节点,那么(me)在未来(lái),它可(kě)能会更快更强大,然后以及成本更低,达到这个时候的话,其实它的第一个大规模应用的点就到了。

王鹤:我觉(jué)得具(jù)身智能今天不能讲完全成熟,但(dàn)是我们今天GPT能力搭配人形机器人,其实已经能(néng)够(gòu)在很多(duō)场合(hé)干事情了(le)。

像我们今天在展台展(zhǎn)示了就是在一个零售的场景,那(nà)么用(yòng)户可以下单,我们的机器(qì)人可以(yǐ)根据你的具(jù)体下单的内容,是拿一个冰(bīng)红(hóng)茶(chá),还是拿一个巧克力,那么我们从货架把它取下(xià)来,同时我们也可以从地面的篮子里(lǐ)头把这些货不断的上到(dào)货架上,我们(men)也可以从更大的一(yī)个仓储的料架上,抱着一箱东西放到传送带上。

这些(xiē)场景其实都展示(shì)了,目前具身智能对于比较糙的活,就是抓取放置和双手抱持这(zhè)样(yàng)的能力已经(jīng)走(zǒu)向成熟(shú)。

在这种情况下,我们还(hái)要问一个问题,为什么(me)是这个人形对吧?有很多人现场问我,你们为什么要做成人形?因为你(nǐ)想如(rú)果货架上的一个商(shāng)品掉在地上了,我的机器人得有能力(lì)去够地面这么低的东西,我的货(huò)架可能两米高(gāo),我要能(néng)够抓到两米那么高的东西(xī),同时我还能还得(dé)来回走动,还要得有两只手才能抱住一个箱子,又有两只手又能高又能低又能够来回走,那么(me)它基本上(shàng)就把形(xíng)态往人(rén)基本上非常的靠拢了,那么(me)我们目(mù)前 用的是一个轮式(shì)底盘,没有腿,那么(me)也已(yǐ)经达到这样的一(yī)个能力了。那么我们认为(wèi)像这(zhè)样(yàng)的抓(zhuā)取放置搬运的能力(lì),在很多行业,比如说零售,比如说工厂(chǎng),比如说一些服务(wù)的场景全都可以用起来(lái)。

所以我判断,人形机(jī)器人的大 规(guī)模应用,2025年、2026年我们将(jiāng)见到从百台(tái)级到千台级的一个快速的增长,

王兴兴:我个人的话,总体来说,对目前整个人形机(jī)器人应用落地还(hái)是需要一些时间,但(dàn)当下,包括今年和明年对一些简单场景,像特 斯拉场景里面把一个电池从什(shén)么(me)地方装到什么地方里(lǐ)面,这种简单的,用模仿(fǎng)学习能做的事情,目(mù)前的AI技(jì)术其实成功率还是做的比较高了,今年或明年可以做一些应用,包括(kuò)把整(zhěng)个的GPT速度也提升。

但是我觉(jué)得,真正(zhèng)要提升人形机器 人大规模应用,确实(shí)还需要更多的时间,把机器人的模型本身做得更好一点,让它更通用,基本上无论是更精细化的或者更泛用心的一些事情都可以(yǐ)做一起来(lái),所以我还是希望社会大众对AI和(hé)机器(qì)人能更多一些耐心。但实(shí)际上可能中国其实(shí)还是 有很多人比较心急的(de),我 觉得还是大家可以再(zài)多给(gěi)一点耐心。谢谢。

熊友军:我觉得人形经济和大规模的应用,其实上这个(gè)就涉及到一个商业化场景选择的问题,实际上,并不是说现在人形机器人不能够(gòu)应用,而(ér)是说(shuō)要再(zài)看什么场景(jǐng)。我(wǒ)觉得在(zài)有一些刚需的(de)场景,或者(zhě)对人不(bù)可达到(dào)的这种场景,还是有一些(xiē)可以(yǐ)用的,尤其是这种刚性(xìng)需求的,比如抢险救灾,特种的对核(hé)辐射,或者是说有毒有害气体环境等(děng)等,这些(xiē)我觉得(dé)现在实际上是可(kě)以(yǐ)用的。

大家其实想的更多是,技术怎么去(qù)提(tí)升,然后怎么(me)它能够让人形机器人能够快速适应(yīng)更多 的场景,然(rán)后把(bǎ)成本快速的降下来(lái),只有这样通(tōng)过一方面通过技术的提升 ,提高(gāo)有更多工作效率,让人有(yǒu)更好的体验感,然后更多人愿意用它。

第二方面,就是把成本继续往下降(jiàng),我觉得让大家(jiā)更买得(dé)起,这个我觉得要是要想的这个方式。

另外我觉得还有一种,就是商业模式(shì)上的探索,实际上人形机器人是我觉得是一个集大成者(zhě),它(tā)基本上涵盖(gài)了机器人(rén)和人工智(zhì)能的绝大部分的技术领域,然后在人体技术上(shàng)的研究能够大(dà)大的推进这(zhè)些技(jì)术的成熟,然后技术甚至技术(shù)的(de)市场化,我们(men)可以采用“沿途下蛋”方式(shì)获得这个商(shāng)业的利润。通过这些其他的一些技术,人形机器人产品上孵(fū)化的其(qí)他 技术商业化、产(chǎn)业化来推(tuī)动人形机器人研究。一个典型的例子,就是我们(men)现在有一些人形机器人公司已经(jīng)在其他产品(pǐn)上实现盈(yíng)利,然后已经实现了一(yī)个很好的商(shāng)业化,这我觉得是一种非(fēi)常好的模式。

问:作为技术 人员,我们是否意识到(dào)有很多机器人都有道德伦理方面的顾虑——我们如何才能消(xiāo)除这些顾虑?

Marc:我认为,从最(zuì)高层(céng)面(miàn)来说,理(lǐ)解所有技(jì)术都涉及一些风险和机遇是很重(zhòng)要的。我参加了(le)一(yī)个政府会议,但我(wǒ)听到许(xǔ)多政府(fǔ)的人都在谈论监管人(rén)工智能(néng),而压倒性的(de)感(gǎn)觉是关注最糟糕的结果(guǒ),对吗?

比如在欧(ō波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”u)洲 ,来自(zì)英(yīng)国一位人(rén)士在发言,让我印象深刻的是,人们几乎陷入恐慌,担心最(zuì)糟糕的事(shì)情会(huì)发(fā)生,并(bìng)且不惜一切代价想要(yào)阻止这种事情发生。但我认为,不利(lì)用机会的风险与让坏事(shì)发生的风险一样大。

所以我认为,正如开发人员指出(chū)的那样,我们需要找到一种平衡,当我们撰写论(lùn)文时,我们会在开头列出这些 内容。这些都是(shì)我(wǒ)们工作可能产生的巨大影响,但我(wǒ)们从(cóng)不谈论我们的工作,可能(néng)产生的坏事是什么。

我们需要(yào)诚实和开放,更加公平地对待这个(gè)问题,但随后(hòu)继续(xù)强调这种平衡,并以某种方式防止我(wǒ)们错过机会,我认为由于公众的恐(kǒng)惧,这种机会很容易发生。

陈建宇:我觉得人(rén)们对这个人形(xíng)机器人、或者(zhě)相应的具(jù)身智能机器人技术的担忧,其(qí)实核心来自于对自身安全性的(de)一个担忧。

安全(quán)其(qí)实有几个不同的(de)层次,最(zuì)底层的层次(cì)是物理的安全,大(dà)家担心机器人会不会(huì)在工作(zuò)的时候去伤害到人,那么这是一(yī)个层次;当(dāng)然其实在它波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”分情况,那(nà)么比如说我们刚才说的如果(guǒ)是工厂(chǎng)里面的话,其实如果我们把它跟人工作环境隔开,其实一定程度上能解(jiě)决这个问题;同时,我(wǒ)们 也需要(yào)从我们的算法硬件等等(děng)上(shàng)面做的更鲁棒来去优化这个(gè)问题。

那么(me)第(dì)二个层次,其(qí)实也是生(shēng)存上面(miàn)的(de)问题,但是不是说物理层 面的,那么也是不是说全人类的一个担(dān)忧,而是说有一(yī)部(bù)分(fēn)人一个担(dān)忧,他担心这个会替代咱们的某一些工(gōng)作,大家会有担忧,我(wǒ)觉得这个事(shì)情可(kě)能需要政府或者商(shāng)号进行有一些引导,我们尽量的开始去(qù)做(zuò)一些确实劳动力非常紧缺的这样的一些产业,比(bǐ)如说(shuō)我(wǒ)们一些非常恶劣环境工业环境(jìng),或者是比如说(shuō)养老等。

当然第三个层面,如果未来我们的具身智能(néng)机器人真正拥(yōng)有了意识,那么这个会对人类的自我存在的价值可能产生一些担忧,我觉得这个事是更远的和更大的topic。

王兴兴:我觉得机器人的伦理(lǐ)道德(dé)和安全性问 题,是(shì)非常重要的一件事(shì)情,而且我(wǒ)觉得(dé),要希望(wàng)是在场所有的人都(dōu)大家需 要共同去维护的一件事情,就有点像(xiàng)现在新能源汽车以及(jí)无人驾驶,它其实还是有(yǒu)很多安全(quán)性问(wèn)题,并且比如说有(yǒu)一辆早些年新能源汽车起火了,或(huò)者有一家新能源汽车无人(rén)驾驶出了交通事故,这(zhè)个对(duì)整个行业影响是非常大的,会降低普通老百姓对技术行业 的(de)认可(kě)度以及信心。

这个事情(qíng)很容易发生在人形机器(qì)人和AI这个领域(yù)。所以我一直觉(jué)得。当下(xià)以及未 来大家都应该在机器(qì)人安全性上,无论(lùn)是出台一些规章政策,或者做(zuò)一些更好的引导,或者需要全世界政府出台一些(xiē)相关的政策,都共同推动整(zhěng)个行业的健(jiàn)康发展。

王鹤:所以(yǐ)我就从技术 的角度,人形 机器(qì)人它的一个面(miàn)向终局的技术必然是大模型,那么其实只有大模型才(cái)可能实现非常高的通用性,把很多能(néng)力全部汇集在一起,把很多模态(tài),从视觉感知,到(dào)语言理解,到动作执行,那么(me)融(róng)会贯通,那(nà)么今天我们在技术上其实是有方(fāng)法对大模型(xíng)的行为进行限制,就是“对齐”,我(wǒ)们(men)在大模型内部已经进行了深入研究,那(nà)么未来,我们会对语(yǔ)言模型、多模态模型进行更深入的对齐(qí),让它不会伤害到(dào)我(wǒ)们(men)的人类,并且他的技能会被局限在服务的(de)范畴内,那么这一些(xiē)是(shì)我们技术上能做(zuò)的,在技术上之外,必然还需要政府(fǔ)社会(huì)和国际的合作。

熊友军:我觉得前面几位(wèi)都说的(de)都挺好的,我就补充(chōng)一点,就是说我觉得应该 是有(yǒu)一些行业组织或者是政(zhèng)府(fǔ)出来,更多在法律(lǜ)法规这方面更多的(de)立法,包括更(gèng)多的是做全社(shè)会的机器(qì)人 使用(yòng)、伦理道德方(fāng)面的一些(xiē)教育。因为我觉得,任何 一个机(jī)器(qì)人也是一种工具(jù),放在不(bù)同人的手上,它的可(kě)能有不同的使用方法,然后只 有加强教育,提升大 家对人工智能 对人(rén)形(xíng)机器人的(de)使用,让大(dà)家相对安全角度去考虑,我觉得才是一个正确的方式。

问:您认为 5 年后人形机(jī)器人行业会发展到什么(me)程度?哪些经济(jì)领域将率先使用(yòng)它们?

Marc:不,我认为人形机器人的出现让(ràng)事情变(biàn)得复杂。我认为机器人在工业领域(yù)的应用将取得(dé)很大进展。我认(rèn)为机器人的应用非常广泛。人们对此非常关注。正如大家所说,使机(jī)器人变得越来(lái)越好(hǎo)的技术(shù)确实正在日趋成熟。我(wǒ)认为工业(yè)将继续取得进步。

我认为人形机器人本(běn)身总体上仍然(rán)非常不成熟(shú)。所以我看不到它们。我知(zhī)道你可以看看一些人形 机器(qì)人(rén)公司与汽车公司(sī)合(hé)作的演示。我(wǒ)认为这在某种程度上是一种(zhǒng)炫耀,而不是一种生产力。我不知道这是不是(shì)题(tí)外话(huà)。如果你看看仓库机器人(rén),你会发现最大的挑战 之一是系统集成,特别是如果它不是围绕机器人设计的全新仓库。

我认为许多仓库(kù)机(jī)器人供应商都在苦苦挣 扎,因为他们需要一(yī)个系统(tǒng)集成商,而这个系(xì)统集成商会消耗掉太(tài)多(duō)的预算,因(yīn)此很难赚钱,这是因 为运营仓库的 IT 人员并不想开放他们的系统。在那里工作的人并不(bù)想改变他们现在做的(de)一切(qiè)。如(rú)果机器人可(kě)以处理每一项任务,那(nà)就意味着他们仍然需要一个人来完成任务。使用任何类(lèi)型的机器人对(duì)行业来说都(dōu)具 有很大(dà)的复杂(zá)性。我认为这些都 是重要因素。

说实话,我原本以为 Spot 会取得更大(dà)的(de)成功(gōng),但 Spot 的推出(chū)只是一次实验。我们之所以设计 Spot,是(shì)因为它能够让你连接自己的传感(gǎn)器,因为我们不知道人们想要什么样的(de)传感器。我们之所以设计 Spot,是(shì)因为它能够(gòu)让你对(duì)它进行编程,因为我们(men)不知道现(xiàn)在的用户们都有哪些应用(yòng)程序,而我(wǒ)们对它(tā)们(men)的使用方式有了更(gèng)多了解,开发人员正专注于巨大机遇 ,因(yīn)此 Spot 对人们的接受度确实产生了影响。

也许如果我们(men)没有足够的(de)商人,能够(gòu)提前进入并评估它是什么,我们实际上是在做一个实验。也 许人形机器人会有更好的记录。

王鹤:我觉得我对人形机器人的发(fā)展总体是比较乐观的,那么在未(wèi)来5年,我们要完成真正的(de)大(dà)规模应用,这件事情对于整个人形机(jī)器人仍然是一个先(xiān)慢后快,其中 慢的阶段,那么一个里程碑应(yīng)该是(shì)——在5年的时候我们能达到万台人形机器人级别的 应用(yòng)。

这样的一个市场大约是对标现(xiàn)在商业清洁机器(qì)人。我们举个例子(zi),在超市在万达广场在写字楼一层(céng),我们看来回去洗地擦地的机器人,那么领先的这个市(shì)场(chǎng),中国最领先的公司大约是每年出货1万台,那么他做的事情不局限做这么简单的事情,它能达(dá)到在各种场景,不(bù)管是商(shāng)超还 是写字楼,还是(shì)很多不 同的场景进行清洁,但是当然是平面清洁。

那么,对(duì)于我们人 形 机(jī)器(qì)人来说(shuō),我们希望(wàng)能(néng)做到一个立体操作 ,但(dàn)是它的能力(lì)可能是(shì)局限的(de),我搬(bān)运我就(jiù)是上货,我就是取货,对吧?

我没有更多的能力,但是我(wǒ)也要实现跨场景的应用,可以在超市里、可以在工厂(chǎng)里、可以在服务 场景等(děng)等。那么能达到5年1万台(tái)的市场规模(mó)的(de)话,我相信后面有真实世界数据的回流,那时,我们会看到(dào)人形机器人应用规模会(huì)加快,从(cóng)慢时 代进入快(kuài)时代。

熊友军:人形机 器(qì)人我对(duì)它的(de)应用可能会更加乐观(guān)一点,其实大家看到这两(liǎng)年人形机器人的进步非常(cháng)快,尤其在AI驱动下面,实(shí)际上(shàng)在市场应用方面,你们已经可以看到国的有(yǒu)一些企业,包括全球企业已经开始在一些场景里面做试(shì)点应用了。

比(bǐ)如说在汽车(chē)厂,比如在一些商用服务场景,已经开始做试点,随着 这个试(shì)点数据会形成一个飞轮的效应,所以试(shì)点(diǎn)进(jìn)展,然后它会有(yǒu)更多的迭代,然后有更多(duō)数据驱(qū)动,机器人会(huì)在在一些特定的环 境里面(miàn)提高(gāo)效(xiào)率(lǜ),它的速度,它的随着量的增长(zhǎng),它(tā)的 价格会大(dà)幅的降低,这样我(wǒ)觉得会更快的去(qù)促进产业的应用。

我觉得今(jīn)年年底(dǐ),大家应该可以看到,有一部分的(de)公司已经能(néng)够在(zài)一些比如说新能源汽车厂,比如说(shuō)在一些特种领域(yù)已经开始应用(yòng),明年我觉得应该可以看到一些(xiē)可能千台左右量(liàng)级的 出货。

问:你(nǐ)能在我们的年 轻观(guān)众(zhòng)中“点燃(rán)一把(bǎ)火”,让他(tā)们也想成为“机器(qì)人(rén)专家”吗?他们应该怎么做?

Marc:我认为伊隆·马斯克本人凭借他的雄心和资(zī)源,可(kě)能在几年(nián)内推(tuī)出10000个机器(qì)人,不一定是因为(wèi)它们会直(zhí)接让机器人赚钱(qián),但看看他(tā)对电动汽车(chē)所做的一切。他们(men)从无人相(xiāng)信到现在,我比这里(lǐ)的任何人都更加怀(huái)疑(yí),包括我在内,到每家汽车公(gōng)司都有淘汰内(nèi)燃机的计划。

我认为这(zhè)是一件了(le)不起的事(shì)情。他似乎(hū)对此很认真。所以这在整个人形机器人领(lǐng)域都(dōu)是(shì)一个真正不确定性的因素(sù)。我不确定如果(guǒ)他没有抓住机(jī)会,是(shì)否会有这么多人(rén)形(xíng)机器人(rén)。

我认为机器人玩得越有趣,人们就越能与(yǔ)它们互动。我(wǒ)到处走走,我没有带机(jī)器人来(lái)这里,但这里有很多机(jī)器(qì)人,但我(wǒ)到处发表演讲,发现机器人在计划(huà)中相当无聊。你总是能吸引一群人,只要你愿意让他们与机(jī)器人互动,他们就会(huì)留(liú)下(xià)来。我认为我们做 得越(yuè)多,公众就会越热情。我非常欣慰 ,参加这(zhè)次活动最令人兴奋的事情可能是有很多人说你做的工作是(shì)我十几岁时见过的,现在我正(zhèng)在做。我们越能展示我们的工作并激(jī)励下一代,这就会实现。

陈建宇(yǔ):我的一个建议是,因为机会其实永远是留给(gěi)有 准备的人,那么像(xiàng)Maec做这个(gè)事情做了做(zuò)了好几十年,然后(hòu)包括我们其实(shí)台上我们几位也(yě)都是多年深耕在机器人或者 相关领域,所(suǒ)以说,因为人形机器人(rén)它其(qí)实也是一(yī)个非(fēi)常长(zhǎng)周期的事情,同时它(tā)也包罗万象,从技术上的软件、硬件、AI再到商业、产品(pǐn)等(děng)等,其实(shí)各方面都有,所以说大家应该去问一问自(zì)己的内心在这一步范围内到底自己最有激情,最喜欢的最热爱的是什么?然后从此刻开始就(jiù)去积累它。最后,要么(me)等待未来,要(yào)么总(zǒng)有 时刻(kè)你有施展自己的机会。

王兴兴:对于我觉得(dé)对于所有年轻(qīng)人,包括我们其实这个时代都是非常精彩的(de),而且(qiě)想象一下,大(dà)家也知道AI、机器 人都是阶梯性发展,就像GPT没有出(chū)来之前,大(dà)家觉得语言模型没(méi)什么用(yòng),基本上是非常(cháng)差,但突然就是发生了巨大进步,非(fēi)常好,其实机器人 、AI也(yě)会遵循这种规律,所以(yǐ)大家现在可能看到机器(qì)人的 AI 能力(lì)都比较弱,但实际上这是好(hǎo)事,为什么?因为大家(jiā)都有机会去做的更好,可以(yǐ)真正的把(bǎ)这种人类目前可以(yǐ)预估的最伟大技术,就在当下,就在未来几年,所以这个事(shì)情都是非常(cháng)值得做的,

而且,在机(jī)器人和 AI 另外一个(gè)比(bǐ)较适合年轻的点,它没有那么(me)多历(lì)史包袱,不像数学领域,有几百上千年的非常天才的数学家,你一定要(yào)比他(tā)们做得好,你(nǐ)才可以做技术,但(dàn)是当下,AI 和(hé)机器人它都非常年轻,尤其 AI 技术就最近 几年的东西,所以(yǐ)非常适合年轻人(rén)。我一直(zhí)感(gǎn)觉在如果在(zài)未来5年到10年或者几十年(nián)回看我们现在这个时代,所以想想这(zhè)种感觉,真的非(fēi)常激动人心。

王鹤:我觉得(dé)其实(shí)未来的15年,在我(wǒ)心目中会(huì)是人形 机器人,从(cóng)当(dāng)下在(zài)产 业(yè)中没有(yǒu)规模化应用(yòng),到可能成长到跟今天汽车的产量一(yī)个万亿市(shì)场的过程。那么在这个过程中,其(qí)实对年轻人来(lái)说,那么我觉得大家(jiā)就是做好自己就可以了,因为15年之后很多工作(zuò)都是(shì)跟人形机器(qì)人相关(guān)的,今天可(kě)能你负责卖车,那么15年后,你可能岗位就调到(dào)卖人形机(jī)器人对吧 ?今天你是班(bān)级里头的(de)佼佼者,那么你学 AI ,那么(me)你可能发(fā)现(xiàn)你的职 业生涯(yá)就是围(wéi)绕着进一步提升人形(xíng)机器人的能力展开的,所以大家做好自己,我们一起(qǐ)共享光明、人形机器人的(de)未来。

熊友军(jūn):其(qí)实我(wǒ)是经历过个人电(diàn)脑时(shí)代,我经历智(zhì)能手机时代,我(wǒ)经历过移动互联网的时代(dài),现在其实我们(men)正在经历(lì)智能汽 车的时代,电动汽(qì)车的时代,我觉(jué)得下(xià)一个时代实际上就(jiù)是聚生(shēng)智能的时代,而聚生智能时代的典型代表其实就是人性机器人,所以我(wǒ)给现在的年轻人建议就是说保持野心,怀(huái)揣大梦想(xiǎng)。

问 :让我们在小组成员之间花几分钟时间(jiān)讨论(lùn)一下:你们想要(yào)互相问什么问题?

陈(chén)建(jiàn)宇:所以我想问Marc,你(nǐ)认为对于机器人和人工智能来说(shuō)最重要的研究问题是什么,例如 ,如果你只能选(xuǎn)择一(yī)个研究项(xiàng)目,那么你选择哪一(yī)个?

Marc:让(ràng)我从(cóng)侧面回答一下,这也是一种回避你的问题的方式。最后我没有展(zhǎn)示我的最后(hòu)一张幻灯片。我的最后一张幻灯片是一个展示(shì)机(jī)器人故(gù)障(zhàng)的视频。它展示了,我不知道它大(dà)概有 2 分钟长,可能有 25 种不同的故障(zhàng)。我认为(wèi)故障是工作中最有(yǒu)趣、最有意(yì)思、最有用的部分(fēn),关注它(tā)们,然后在你(nǐ)的工作不工作的时候继(jì)续前进,这(zhè)真的很(hěn)重要。这不(bù)是(shì)研究的主题,但(dàn)它是一种工作精神。所(suǒ)以如果(guǒ)我要 问你 们所有(yǒu)人这 个问题(tí)的话,那就是我还没看到任何人(rén)在演讲(jiǎng)中提到过事(shì)情无法正常运转,而且我敢肯定,单一机器(qì)人不会在(zài)不(bù)发生(shēng)碰撞的情况下完成那些后空翻以及(jí)它们(men)所做的所有很酷的事情。你(nǐ)喜(xǐ)欢碰撞吗?

王兴兴:Marc先生,很荣幸今天见到您,我其实想有好奇想问一下(xià),您 觉得(dé)对于人形机器人的手,您觉得(dé)未来几年比较合适的(de)有几个手指,或者几个电机,这会是比(bǐ)较(jiào)好的一个方(fāng)向?

Marc:再(zài)次(cì),我要回答一个略有不同的问题。我们研究所(suǒ)最近举办了一场研讨会,名为“对操纵的反向观点”。我(wǒ)认为灵巧(qiǎo)性确实很重要,但基本上它并没有取得很大进展,尽管(guǎn)人们至少已经为(wèi)此努力了 50 年。我认为我们必须以不同的方式思考,再次尝试不同的东西,就像我今天在演讲中(zhōng)开始(shǐ)的那样,也许(xǔ)我们需要更多的(de)动态操纵,而不是所(suǒ)有的静态抓握。我(wǒ)认为很多学习界的人在提出(chū)他们正在学(xué)习的灵巧性的要求时对自(zì)己要求(qiú)不够(gòu)。他们做(zuò)的事情很简单(dān),很容(róng)易。

我认(rèn)为那里是有机会的,有多(duō)少只手我不 知道(dào)有多少根手(shǒu)指(zhǐ)。我认(rèn)为五(wǔ)个已(yǐ)经很多了。但也许有 一天我会觉(jué)得更有趣的问题是 手掌怎么样(yàng)?我们(men)的(de)手掌功能非常强(qiáng)大,它们不仅(jǐn)仅是静态(tài)的块。而且你看到的几乎每(měi)个机器(qì)人手都有(yǒu)许多手指在做这件事,但仅此而已。

王 鹤:之前我提到过,大概 15 年后,世界上会有数百万、一千万个人形(xíng)机器人。如果人形机器人具有通用目的(de),那么人形(xíng)机器人 是终极体现(xiàn),那么这种通用目的(de)的终极技术(shù)是什么?对于人类噪音,您是否认为视觉、语言(yán)、动作模型,这 些端到端模型(xíng)是人(rén)类噪音(yīn)的终极(jí)技术或方法?

Marc:我很难相信,端到端(duān)是取得进步的方法。也许最终(zhōng)在渐近线上端到(dào)端是(shì)正确的方 法,但我认为我们知道的太多了。

说(shuō)实话,我认为人们过分看重(机器)学习。我知(zhī)道(dào)应该对学习持乐观态度(dù),但如果你看看当今(jīn)存在的解决(jué)方案,你会发(fā)现最好(hǎo)的解(jiě)决方案中学习(xí)所起的作用 微(wēi)不足道(dào)或微不 足道(dào)。当然,在波(bō)士顿动力(lì)公司,今天学习很少,尽管人们正在努力。我认为(wèi)控制系统、控制理论、观察器,这些在过去 20 或 30 年(nián)建(jiàn)立起来的东西(xī)仍然发挥着(zhe)巨大的作用(yòng)。

我(wǒ)不想就(jiù)这样把它抛弃(qì)。我希望我 们能真正拥抱学习,但要把 它与我们已经知道的东西结合起来,找到一种方法把它们结合起来,至少(shǎo)在(zài)接下(xià)来的5年波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”或10年里,也许在渐近线上,情况会有所(suǒ)不同。

熊友军:我的一个问题是,Marc作为(wèi)波士顿动力的创始人,您之前开发了像Atlas这样的(de)非常令人惊奇的这(zhè)种产品,但(dàn)是我们前不久我们(men)看到波士顿动力终止了这个机(jī)器的研发,然后由原来的液压驱动,转向(xiàng)纯电(diàn)驱动的这种方式。对这(zhè)方(fāng)面是出于什么样的考虑?是(shì)因为成本的考虑,还是因为出于商业化的考虑?同时我还(hái)想知道,波士顿动力未来(lái)5年的一些(xiē)这(zhè)种计划,对商业化(huà)的一些计划。

Marc:我认为,如果你问为什么要进行转变,我认 为有两个关键因(yīn)素:一(yī)个是液压机器人,我喜欢液(yè)压技术,我会用液压技术制造很多机器(qì)人。我认为,建造人形机器人或类似人形机器(qì)人仍有空间,它们将继续使用液压技术(shù),因为重量和强度等因素。

但我认(rèn)为有两点。一是它们很麻(má)烦,至少对于像 Atlas 这样的(de)高性(xìng)能机器人来说,尽管我们付出了无尽的努力,也永远无法让它们完全不漏 油(yóu)。当你把石(shí)油机器(qì)人放到工厂和家里(lǐ)时,它们就不能滴(dī)油;同时,很难找(zhǎo)到精通液压技术(shù)的人,因为人们认为这是非常古(gǔ)老(lǎo)的东西(xī),尽管 Atlas 在液压工作原理方面有很多创新,从服务器阀门到 HPU 液压动力装置,一直都 是如此,确实有创新的东 西(xī)在进行;最后,我认为(wèi)电动汽车在规模上已经足够强大(dà),它们可以(yǐ)参与竞争(zhēng)。我不想代表波士顿动力发言,尽管我是(shì)创(chuàng)始人之一,并且(qiě)仍(réng)然是董事会成员,但我认为他(tā)们必须有自己的计划,说(shuō)明未来 的计划(huà)以及技术的所有细节。我(wǒ)想随着事情(qíng)的(de)发展(zhǎn),你(nǐ)会发现更多这方面的内容。

主持人:非常感谢。我想观 众肯定会有更多问题,也许吧,但我们的时间真的不多了。所以非常感谢各位小组成员。非常感谢观(guān)众的到来和聆听。我认为这是一场(chǎng)非常精(jīng)彩(cǎi)的会议,尤(yóu)其是小组讨论。我对组织者的建议是,我们明年再(zài)举办一次类似的会议,然后我们(men)可以回顾进展和未来的步(bù)骤。

未经允许不得转载:橘子百科-橘子都知道 波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

评论

5+2=