波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”
8月(yuè)24日下午,2024世界机器人大会上,举行了一场期待已久(jiǔ)的中国、美国(guó)“具身(shēn)智能”与人形机器人领域学者的“世界对(duì)谈”。
大名鼎鼎(dǐng)的“机器(qì)狗之父”、美 国波士顿动力创始人Marc Raibert(马克·雷伯特)首次来到北(běi)京。他说,“我简(jiǎn)直不(bù)敢相信,不仅是(shì)机器人(rén)的数量,难以置信,还(hái)有这么多热(rè)情的人参(cān)加了(le)展览。中国对机器人的兴奋(fèn)和热情(qíng)很(hěn)高。”
而此次与(yǔ)Marc对谈的四(sì)位CEO所在的公司也不(bù)寻常:除(chú)了宇树科技之外,星动(dòng)纪(jì)元、银(yín)河通(tōng)用、北京具身智能机器人创新中心(xīn)都成立不足2年,一出道就是具身智能和人形机器人行业的“顶流”。
而且,星动纪元(yuán)、银河通用背(bèi)后也站着中国最高学府:北大和清(qīng)华,代表着(zhe)中国前沿科技创新的重要来源。
其中,星动纪元由姚期智带领的清华大学交叉信息研究院孵化成立的(de),星动纪元(yuán)创始人陈建宇现(xiàn)在还(hái)是清华大学交叉信息研究院助理教授,公司融资超亿元,联想创投已加入其中。
银河通用机器人(rén)创始人的王鹤则是(shì)北京大学助理教授,也是北京智源人工(gōng)智能研(yán)究院具身智能(néng)研究中心主任,过去(qù)半年,银河通用(yòng)完成天(tiān)使轮融资共计7亿元人民币,刷新了国内人(rén)形机器人领域(yù)单轮融资规模,美团战投、北汽产投、商汤国香基金、讯飞基金、启明创(chuàng)投(tóu)、蓝驰创(chuàng)投(tóu)、经(jīng)纬创投、源码资(zī)本、IDG资(zī)本等(děng)头部财 务机构(gòu)都参与(yǔ)其中。
而北京具身智能机器人创新中心则是(shì)北京市发起成(chéng)立的机(jī)器(qì)人“国家队”机构。北京具身智能机器人创(chuàng)新中心总经理熊友(yǒu)军,目前还是“人形机器(qì)人第一股”优必(bì)选科技CTO。
Unitree Robotics(宇(yǔ)树科技)也是当下人形机器人(rén)行业的明星企业。公司创始人、CEO、CTO王兴兴毕业于上海(hǎi)大学,取得了机械(xiè)工程硕士,具(jù)有近10多年(nián)足式机器人研发(fā)经验,拥有产品从0-1-100的研发与商(shāng)业化落地能力,100+项机器人相关专利。
此次圆桌(zhuō)由德国慕尼黑工业大(dà)学教授 Alois.C.Knoll主持,美国波士顿动力创始人Marc Raibert(马克·雷伯特),与中国四大(dà)AI机器(qì)人企业领军者——陈建宇、王兴兴、王鹤、熊友军(jūn),五人围绕机器人行业(yè)、AI 大模(mó)型驱动机器人发展(zhǎn)等议题展开讨论。
一(yī)个多小时的圆桌当中(zhōng),Marc表示,未来5年,机器人硬(yìng)件发展仍将非常重(zhòng)要,但同时,能够打破语义理解障(zhàng)碍的基(jī)础模型或其他 AI 方法也将对机器(qì)人技术产生更大的影响。不过,要(yào)想(xiǎng)取得机器人领(lǐng)域真正的进步,就需要更高的可(kě)靠性和安全性,未来人(rén)们需要投入大量资源努力解决此类问题。
Marc非常(cháng)不看(kàn)好人形机器人行业。他认为,工业机器人(rén)已经(jīng)非常(cháng)成熟,而且能够商业化(huà),目前人形机器人“在某种程度(dù)上是一种炫(xuàn)耀,而(ér)不(bù)是一种生产力”。
陈建(jiàn)宇表示,过去10年(nián)AI发展很快,从简单的图像处理,到(dào)深度学习、强化(huà)学习,再到ChatGPT技术,这对于未来“具身智能”产生很大的影响。未来(lái)几年,AI、具身智能(néng)会与人形机器人不断融合,去训(xùn)练一个通用模型。他相信未来5年,我们将迎来“机器人的ChatGPT时刻”。
王鹤指出(chū),当前 AI 大模型在机器(qì)人上仍有巨(jù)大的局限,尤(yóu)其是“泛化的开瓶盖”技(jì)能还没有训练出(chū)来,但同时(shí),这也(yě)是大模型带来了重要机会,一(yī)旦大模型涌现能力不断加强,他(tā)认为未来5年,依然(rán)有一个至少做操作任务的通用机器人机会(huì)。
熊 友 军表示,当前关节性能提升、高的能量和电池密度的提升非常快,使得机器人的(de)运动控(kòng)制能力、电(diàn)机等方面提升非常快。未(wèi)来(lái)5年,机器人关节和能量密度会持续提(tí)升。毕竟和人类相比,现在机器人的能量执行效率(lǜ)还是有非(fēi)常大的差距。
以下是钛媒(méi)体AGI编辑(jí)对(duì)此(cǐ)次圆桌全文整(zhěng)理:
问:您能否向观众简单介绍一(yī)下您的工作:您为什么以及什(shén)么时候(hòu)开始对(duì)人形机器人感兴(xīng)趣(qù)的?
Alois:我从(cóng) 2001 年开始担(dān)任慕尼(ní)黑大学的教授。我对人类噪(zào)音的一个方面产生了兴趣,那就是具象化,对吧?我的朋友 Pfeiffer 和我们一起(qǐ)从大学毕业。苏黎世退休了,不幸的是,我们坚(jiān)信具象化。所以我们认为,在我们的人类类(lèi)型中,智(zhì)力只(zhǐ)会在以非常自然的方式与世界(jiè)相连的人类类型身体(tǐ)中发展。所以身体应(yīng)该有同样的动力,同样的尺寸,等等。否则,就很(hěn)难做(zuò)到这一点,你在这里看到的(de) Kronos 系列机器(qì)人,左边,左下角的 Roll Boy2024 就是这(zhè)种信(xìn)念的结果之一。
Marc:我认为你贴(tiē)出的那张图片(piàn)对 我回答这个问题很有帮助。如果人形机器人意味着两只胳膊、两条腿(tuǐ)直(zhí)立向前,那(nà)么直到最近我才对此感兴趣。事实上,我一直(zhí)认为现在的公(gōng)司注重功能性,作为一名教授,我认为功能性才是最重要的,机动性、灵巧性、感知力和智能(néng),而外形和(hé)外观则是次(cì)要的。另一方面(miàn),如果人形机器人意味着像腿一样的 动(dòng)态生命,我会把它与世界互动。我(wǒ)一直是人形机器人的粉丝,尽管我建造的(de)第一个机(jī)器人是弹簧单高跷的东西 。我认为人形机器人的许多基本(běn)要素(sù)都(dōu)在那些(xiē)弹簧单(dān)高跷的东西中。确实(shí),当我(wǒ)们(men)开始建造机器人时,波士顿动(dòng)力公司是(shì)直立的,有(yǒu)两条(tiáo)腿,两只胳 膊。有(yǒu)时领先(xiān)。如果(guǒ)你看(kàn)看公众的反应,你会发现 YouTube 点击量增加了 10 倍,我非常关注这些点击量或评论(lùn),或者只是人(rén)们的态度(dù)。人们非常感兴趣。普通的非科学家(jiā),比如说,非(fēi)工程师,他们对人形机(jī)器人很(hěn)感兴趣,而狗惹(rě)恼(nǎo)机器人却得不到同样的赞誉。
熊友 军:我是从读(dú)博士的时候,2000年(nián)开始(shǐ)做机器人的研发,当时读(dú)博士的时候,那(nà)时候更多的(de)是做工业领域、特种领域的(de)一些机器(qì)人,用在一些危险的(de)环境里面,因为那(nà)时候机器人技术(shù)还是非常不成熟(shú),但在很多(duō)特种领域(yù)和危险场景(jǐng)里面,是需要用机器人去完成工作了,然而(ér)那时候机(jī)器智能实(shí)际上是很差的。所(suǒ)以我(wǒ)们当时想的办法,是将机器人的智(zhì)能跟人的智能结合起来(lái),所以做了一些机器人(rén)要操作(zuò)的一些事情(qíng)。
但在遥控操作完成(chéng)这些工作(zuò)的过程(chéng)中,我们发现有很多的场景(jǐng),实际上用轮式的工业机械手臂是解决不(bù)了的,尤其是有时候在一些特种(zhǒng)场(chǎng)景环境比较狭(xiá)小,然后环境比较复杂的(de)轮式,然后履带式实际上根本就进不去,但是人是可以进去。还有一种,是要试用(yòng)很多工具去完成那些工作。
所以当时(shí)我们就觉得,如果(guǒ)说有微型机器(qì)人的话,实际上(shàng)应该是能够提供很好的解决(jué)工具,或者一种解决方案,但是我们当时那时候也(yě)看(kàn)到了(le)日本本(běn)田ASIMO,给我们提(tí)供了很多的(de)一些启(qǐ)发,所以那时候我就(jiù)对人(rén)形机器人非常感兴趣。后面毕业之后(hòu),一直在做(zuò)机器人相关(guān)的工作,
2012年,我跟优必选科技CEO周剑先生创立了公司,做人(rén)形机器人研发工作,去年从深圳到北京开始筹(chóu)建具(jù)身智能机(jī)器人创新中心,现(xiàn)在也是一直在聚焦人形(xíng)机器人方(fāng)面的研发(fā),主要(yào)的想法是(shì)希(xī)望说能够(gòu)解决人形机器(qì)人(rén)方面的一些共性、关键的技(jì)术问题,比如本(běn)体的一些基础研发不(bù)足,其实我(wǒ)们现在微型机器人(rén)在本体在关键的核(hé)心器(qì)件(jiàn),然后在一些(xiē)传感器方面其实上有非常多要攻克的地方(fāng)。另外(wài)在运动控制,实际上我们也做了非常多(duō)的运动控制的技术研发,采用深(shēn)度学习强化学习的这种(zhǒng)运动控制的方式,包括现在也用一些融神经网络的一些方式用去做运动控制,同时其实我(wǒ)们现在(zài)还在做关于智能方面的一(yī)些(xiē)研发,比如说把用现在(zài)具身(shēn)智能的方式(shì),做(zuò)一些基础性工作,比如建它的数据(jù)集(jí),研发(fā)机器人(rén)大模型(xíng)框架 等。所以这就是现在我在做的一些事情。
陈建宇:其实这个兴趣是很小的时候,就一直对智能机器人非常感兴趣,我印象很(hěn)深刻,刚刚(gāng)兴(xīng)兴说她10岁的时候,我估计也(yě)是差不多类似的时间,不过当时(shí)看的不是波士顿动力(lì),当时关(guān)注的是ASIMO系列机器人(rén),当时我就非常的去着迷。然后我觉得,创业这件事其实是充满了挑(tiāo)战(zhàn)性的,marc创办了波士顿动力做了40多年,其实我(wǒ)是非常(cháng)尊敬的,就是说你没有一个发自内心的、天生热爱的话,其实很难去坚持下来的。所以对(duì)我来说,对这类机器人的热爱,我觉得某种程度上是从小就具(jù)备(bèi)就(jiù)拥有的(de)。
那么真(zhēn)正(zhèng)开始做机(jī)器人其实是本科的时候。当时在学(xué)校里面,我就接触真正意义(yì)上的机器人的(de)研(yán)究,当时接触了双足机器人,主要是做(zuò)的就是捕获点步态规划相关的研(yán)究。后 来,博士阶段继续做机(jī)器人,虽(suī)然不是人形机器(qì)人(rén),但是也是相关的一些机器人的领域,控制它的(de)学习,包括无人车和机(jī)械臂(bì)。而(ér)真正 的去全力做(zuò)人形机器人,是在我回国之后(hòu),然后在现在(zài)清(qīng)华(huá)正式投入(rù)去做人形机器(qì)人,还(hái)孵化了星动纪元公司,如今我们已经做了最新一代、第六代(dài)机(jī)器人了,然(rán)后我们也在展会上(shàng)面带来了我们机器人的实物(wù),欢迎大家去关注。
王兴(xīng)兴:大家(jiā)好,我是宇树科技(jì)创始(shǐ)人(rén)王兴兴,刚才有(yǒu)提到我大概可能10岁的时候就看过marc先(xiān)生在MIT实验室做(zuò)的双(shuāng)足,还有单(dān)条腿的机器人,然后印象非常深,在09年、10年的时候(hòu),大概大一寒(hán)假,我就做过一个小的人形机器(qì)人,然后当时做的不是特别满意,然后后来的话,就(jiù)在(zài)研究生期间做了XDog这款机(jī)器人,差不多在13年到15 16年,这款机器人的话(huà)又采(cǎi)用了比(bǐ)较(jiào)低成本的硬件,然后运(yùn)动性能非常好 ,可以直接(jiē)实(shí)现关节的力(lì)控以及整机的力控(kòng)。
后来的(de)话(huà),一开始我对人(rén)体机器人的(de)技术还是跟相对来说(shuō)比较悲观的(de),但是后来的话在2022年左右,整个的机器人、AI技术的进(jìn)步,然后再加上ChatGPT出来以后,大(dà)家都看到(dào)人形机(jī)器人和AI结合的可能性,所以说我们公司又重新(xīn)开始做人形机器人。说实在的,其实我真正感兴趣的并(bìng)不是(shì)说人形机器人(rén),而是新的(de)一个智能体机器人的形态。而人形机器人可(kě)能(néng)只(zhǐ)是说目前大家比较(jiào)公认的、一个最有(yǒu)可能性的通用机器人和通用AI的结合体(tǐ),但是这可能(néng)并不是 个唯一的,我真正希望能诞生甚至更比人更高级(jí)的一个智能体形态,可以大大推动整(zhěng)个人类工业的变革,推动(dòng)新的工业革命。
王鹤:我是北京大学计算机(jī)学院助理教授,也是北(běi)大银河通(tōng)用具身智 能联合实验室的主任(rèn)王鹤,那(nà)么,我跟人形(xíng)机器人、具身智能(néng)结缘,主要是从我在斯坦福大学开始读(dú)博(bó)的时候。那么2016年(nián)的时候,当(dāng)时深度学习技术已经出来了,也应(yīng)用在很(hěn)多图像识(shí)别分类这些任务(wù)当中。那 么当时作(zuò)为一个前沿(yán)研究,我们试图去理解(jiě)人类是如何把感知思考还有交互的能力融合在一起的。
所以我博士期间的第一(yī)个工作,就用一个视觉模型来(lái)看桌面上(shàng)人的动(dòng)作和物体的一个运动,然后推理人下一步想要什么,这(zhè)是一个语言模型。
最后(hòu)再用一个简单的机器人,智能的马(mǎ)克杯去(qù)响应人的动作,那么这个工作获得了欧洲图形学的(de)最佳(jiā)论文(wén)提名,但是我们认为它非常的不(bù)足(zú),就是我们的一个马克杯只能在桌面上移动响应人的动作,它(tā)没(méi)有跟人交互的能力,我们的视觉只(zhǐ)能看有(yǒu)限的几(jǐ)一种物体,那(nà)么我们的语言模型只能根据这个人跟这些桌(zhuō)面东西的一些动作来做简单的推理。
那么通过过去8年我(wǒ)们的研究,在怎么样把机器人的操作能力搞(gǎo)得更泛化(huà),什么东西(xī)都能抓,都能够放置,那么(me)还有跟现在的多(duō)模态大模型技术结合,真的(de)明白(bái)人类想让你干什么,那么言(yán)出法(fǎ)随的去执(zhí)行,所(suǒ)以去年我们就(jiù)孵化了北京银(yín)河通用(yòng)这家人(rén)形机器人公(gōng)司,我们现在也是把视觉、语言(yán)、动作这三种不同的模态融合(hé)到大(dà)模型当中,真正的赋能(néng)人形机器(qì)人,让人形机器人能够走进千行百业、千家万(wàn)户,这是我们的(de)愿景。
问:你认为,我们今(jīn)天拥有的哪(nǎ)些重要技术是 10 年前没有的,但对于(yú)实用(yòng)的人形机器人来说(shuō)却(què)至关重要?它们在(zài)未来 5 年将如(rú)何发展(zhǎn)?
Marc:我认为硬件开发仍将非常重(zhòng)要。如果我们谈(tán)论未来 5 年,毫无疑问,能够打破语义理解障碍的基础模型或其他人工智(zhì)能方法将(jiāng)产生最大的影响。
我认为,人类(lèi)可以做的就(jiù)是,概括和理解他们所看到事物的含义,而目前还无法真正(zhèng)捕(bǔ)捉到这些含义。我(wǒ)相信,如果人工智能能够在这方面取(qǔ)得进展,我认为它将产生巨大(dà)的影响。
实际上,过去十年(nián)来,每个人都在计算机、传感器、感知、控制等方面取得了巨大进步。电池,我认为人(rén)们忘记了电池。虽然(rán)电池是工业时代的产物,但是它们确实非常重要。是的,所以在(zài)电(diàn)机方(fāng)面过(guò)去 5 年(nián)里,人们做得很(hěn)好,我认为电机已经取得(dé)了长足的进(jìn)步,当然,我(wǒ)们将看到(dào)更多。
陈建宇:我从AI的(de)视角来讲(jiǎng)一讲,觉得非常大的一个不同。如果按照10年(nián)前的话,其实是2014年左右,当时是DeepLearning刚刚(gāng)出来不久,它其实解决了很大一部分,比如(rú)图像处理等等一些(xiē)问题。
那么后面,其实(shí)有(yǒu)我认为(wèi)两(liǎng)个最重要的里程碑:一个是以16年阿尔法狗为代表的深度学(xué)习,紧(jǐn)接着把它用在了强(qiáng)化学习上面,做深(shēn)度(dù)强化(huà)学习,解决了一些(xiē)问题;第二个是以ChatGPT为代表的(de)大(dà)语言模(mó)型,所(suǒ)以这点我认为(wèi)是过去10年没有的(de),但又对未来我(wǒ)们人形机器人,或者是具身智能起到非常大的决定性(xìng)作用的两个因素。
那么可(kě)能在接下来的(de)这几年 时(shí)间,这两项技术会非常深度的跟人形机器人、具身智能融合起(qǐ)来,但他们也分别需要经过一定程度的训练,从而能训练(liàn)比较通用的一个模型,那么(me)我们也能解决更加丰富(fù)的物理世界的数据程序。那么我相信,在接下来的5年,这几项技术都能起到非(fēi)常大的一个进展,我们可能会在5年内迎来“机器人的(de)ChatGPT时刻”。
王兴兴:对过去(qù)10年最大(dà)的(de),还是AI技术(shù)带来的各种事情有更多的信心。我觉得除了 AI技术本身最(zuì)大的点,对于人(rén)形(xíng)机(jī)器人,对(duì)于整个社会共识的(de)增加也(yě)是非常关键的,就(jiù)是目前大家更加相信AI,更加相(xiāng)信人形机器人可以诞生更(gèng)多价值,这在10年前是完全不能(néng)想象的,那时(shí)整个社会基本(běn)上对此(cǐ)都(dōu)完全(quán)没有信(xìn)心。
另外一点的话,我觉得在未(wèi)来5年(nián),总体上是肯定整个 AI 机器人、AI模(mó)型(xíng)变化(huà)会非常快,因(yīn)为目前的AI真的是日新月异,大家可以用AI集成技术,去搭建各种自(zì)己的模型去(qù)做训练,这整个(gè)已经变成一个非常的扁平化,以及容易(yì)操作(zuò)的过程(chéng),其实很多人大家都可以参与进(jìn)来(lái),去做机器人模型并且去做训练,所以我觉得。未来5年这块的各种(zhǒng)AI模型创新,包括(kuò)更新的一些(xiē)神经网(wǎng)络模型,包括脉冲神经网络等都有很大(dà)的(de)一些(xiē)机(jī)会。
王鹤:我觉得10年好快,10年前是2014年,其实(shí)我们已经看到inbody的AI,甚至(zhì)不是一个在西方的学术界比较popular的词(cí)汇,那(nà)么过去的十年,我觉得一(yī)大技术的进展,就是我们在具身智能里头已经有(yǒu)一些技(jì)能实现了非常强(qiáng)的泛化性。
那么以我个人的研究(jiū)举例,在抓(zhuā)取问题上,我们取得了比较长足的进步,那么我(wǒ)们从只能(néng)抓方 块圆(yuán)的这(zhè)些特定形状(zhuàng)的物体,到基于(yú)三维视觉传感器,我(wǒ)们可以抓不透明、不反光,也就是在深度传感器里(lǐ)头(tóu)能完美成像的这些物体,到我(wǒ)们最近的技术(shù)能够预测透明、高(gāo)反光(guāng)、金属(shǔ)、吸光这些非常有挑战材(cái)质(zhì)的(de)物体,基于它去做泛化抓取操作。
那么在今天的展厅,我们都接受观 众给我们的各种形状,各种材质随便堆叠乱七八糟的物体,我们的机器人都展示了非常(cháng)泛化(huà)和高成功率的(de)抓取能力,那么现(xiàn)在的问(wèn)题是,像这样(yàng)的每(měi)一个技能,大家都在分分别的去做开发,那么很多人会提问你能帮我抓水瓶,你能不能帮我(wǒ)把瓶盖(gài)给拧开(kāi)?我非(fēi)常不(bù)好意思的(de)说,现在泛化的开(kāi)瓶盖技能(néng)我们还(hái)没有训(xùn)练出来,这个就是大模型能够带给我们(men)的机会,那么大语言模型(xíng)涌现(xiàn),也就 是这种紧急行为紧急行为,他能够在只见一(yī)次(cì)或(huò)者是第一次(cì)零次的演示的情况下(xià),他都理解你要生成什么(me)样的文字,我们(men)相信未来(lái)的5年(nián)给(gěi)我们(men)的机会就是发展机器人基础大模型,它能够实现(xiàn)涌现能力,它吞吐足够量的数据(jù)后,有灵巧手,它能够抓能够加、能够(gòu)拧,能够掰各 种基本的手的各(gè)种运动能力都有了以后,他(tā)能涌现,我们给他看一个视(shì)频,他(tā)就能理解这个活怎么干,到那个时候我们(men)真正的就有一个(gè)通用的、至少做(zuò)操作任务的(de)的机器人了,这是我认为未来5年的一个机会。
熊友军:我觉得这一轮的机(jī)器人技术(shù)的进步主要(yào)是由AI来驱动的。毫无疑问, AI驱动我觉得(dé)体现(xiàn)在几(jǐ)个方面。
第一个就是它人机交互(hù)性(xìng)能得(dé)到了极(jí)大的提升(shēng)。我记得10年前我们做人(rén)工智(zhì)能、做机器人的时候 的那些交互,如(rú)果说我要加语音加视觉,第成本非(fēi)常高,第二个我们要做(zuò)大量的研发的工作,我们(men)需要几个博(bó)士、硕士带着一个团队,花很(hěn)长的时间才能够完成一些物体识别、语音合成,自然语言理(lǐ)解NLP,还有甚至是TTS、语音合(hé)成(chéng)等方面(miàn)的一些工作(zuò),甚至(zhì)包括导航,但是(shì)我觉得,现在随着技(jì)术的进步,我们现(xiàn)在做人形机器人的(de)大模型,我们直(zhí)接一个(gè)端到端的直接语音给(gěi)指定给他,然后很快他就可以有比较(jiào)好的行为输出,有很好的意图理(lǐ)解,然后做任务规划等。这是一方(fāng)面,我觉得(dé)这一轮对人机交互、对动物的规划、对(duì)执行等方面(miàn)都有巨大提升,在10年前基(jī)本上都很难(nán)去想象。
然后第二个现(xiàn)在的这些硬件方面也(yě)有极大(dà)的提升,体现在两个方向,第一个现在关节的性能的提升是(shì)非(fēi)常快的(de),大家可以(yǐ)看到很多公(gōng)司机器人可以开始去做(zuò)一些非常动态的、剧烈的运动,实(shí)际上(shàng)离不开关节性能的提升、高能量密度比,然(rán)后高的(de)转速(sù)、高性能等(děng)这些技术(shù)的提升,实际上,在10年前我觉得(dé)是(shì)很难去做到(dào)的。当然了这也有(yǒu)运动控制能力的提升、电机的提升,现在其实也有(yǒu)采用更多结构设计的方式,更适合它的布局等方面都有非常大的进步,包(bāo)括(kuò)把腿的转成惯量、把电机往上(shàng)提等等,有各种各样的(de)结构(gòu)设计的技术(shù)的变化。
另外,刚才还提到能量,其实早前我觉得(dé)10年前我们(men)做机器人的时候,一(yī)个(gè)电池就像我们背后要背一个非常巨大的电池包能源包,而且(qiě)能够持续的时间(jiān)很短。但是这(zhè)几年(nián)随着新能源(yuán)汽车对电池技术的推动作用,其实(shí)我们看到它的电池能量密度大幅提升,我现在一个比(bǐ)较(jiào)小的电池,可以(yǐ)支持比较长的时间,我觉得这是一个非常(cháng)重要的技术突破。
未(wèi)来,我觉得(dé)5年之(zhī)后,这几个(gè)可能还是一个重大、要突破的方向,像刚才说的人机交互方面,我们希望大模(mó)型能提供更长期的(de)任务规(guī)划(huà),然后做意(yì)图理解等等(děng)方面,我觉得我(wǒ)们能只(zhǐ)要给他一(yī)个非 常模糊(hú)的指令,他就可(kě)以给我们(men)输出我们(men)很标准的很自然的这种交互的结果。第二方面,可能就是在规划实施(shī)任务方面是一个非常重大(dà)、要攻克的方向,我们环境会经常变,面(miàn)对的是一(yī)个动态环境,然(rán)后机(jī)器人(rén)能够根据环境变化,能够实时去(qù)改(gǎi)变它的一些执行策略等(děng)。当然(rán),像能量方面我觉得(dé)是一个持续要提升的,它毕竟现在能量执行效率和我们人相比,还是有非常大的一个差距(jù)。
问:大规模部(bù)署人形机器人需要完成(chéng)哪些任务?
Marc:但是如(rú)果你现在(zài)从更宏观的角度来看,我(wǒ)刚才说了如果你想致富你现在就不(bù)会着手开公司,但是(shì)如果你想生存(cún)下去。你至少也得收(shōu)支平衡。
我(wǒ)想这是一(yī)个更(gèng)长远的(de)计划,我认为要想取得真正(zhèng)的进步,你必须(xū)暂停,或者我不(bù)是说你必(bì)须暂停,我们在我的研究所暂停,让机器人更(gèng)可靠的(de)本地目标将是一件关键的事情,如果我能指出旧(jiù)金山的(de)自动驾驶汽车,他们杀死(sǐ)了一个人,这实际上甚(shèn)至不是自(zì)动驾(jià)驶汽车的坠落。然后克鲁兹完全退出(chū)了旧(jiù)金山(shān)。我知道现在还有(yǒu)很多事(shì)情在(zài)进行,但这在机器人领(lǐng)域很容易发生。因此,可靠性是一个关键因素,这是人们投(tóu)入大量(liàng)资源努力解决的(de)问题之(zhī)一。但这无助于解决,将我们带入下一代的更大问 题。当我说我不认为每个人都必须专注于(yú)你所说的真正有用的东西时。
陈建宇:要做到大规模应(yīng)用的话,有非常重要(yào)两个事情:一个是能(néng)不能(néng)找到大规模的需(xū)求,另一个能不能(néng)有我(wǒ)们技(jì)术,足够去实(shí)现(xiàn)、满足(zú)需求。
其实(shí)现在有很多(duō)零散的表演需(xū)求,如果需要(yào)真的达到(dào)max(大规模)的(de)话,我觉得主要(yào)还是看劳动力,非常密集的一些产业,比如三个阶段(duàn),一个是工业、商用和服务。
大体(tǐ)我认(rèn)为,技术也基本上是按照这(zhè)样一个方向去成(chéng)熟发展,其中我觉得给我的感受,我认为(wèi)工业的话可能会比(bǐ)较(jiào)快就能(néng)够去用上了。其实刚(gāng)才Marc的报告中里面也(yě)已经展现出来了,不管是人形,还是一(yī)些轮式的机器人,在工厂搬(bān)运的这一类的环境里(lǐ)面,已(yǐ)经(jīng)是达到了非常接(jiē)近(jìn)人类(lèi)的一个节点,那么在未来,它可能会更快更强大(dà),然后(hòu)以及成本更低,达到这个时候的话,其实它的第一个大规(guī)模应用(yòng)的点就到了。
王鹤:我觉得具身(shēn)智能今天不能讲完全成(chéng)熟,但是我们今天GPT能力搭配(pèi)人形机器人(rén),其实已(yǐ)经能够在(zài)很多场(chǎng)合干事情了。
像(xiàng)我们今天(tiān)在展台展示了(le)就是在一个零售的场景,那(nà)么(me)用户可以下单,我们的(de)机器人可以根据你的具体下单的 内容,是拿一个冰红茶,还是拿一个巧克力,那么我们从货架把它取下(xià)来,同时我们也 可以从地(dì)面的篮子里头把这些货不断的上到货架上,我(wǒ)们也可以从(cóng)更(gèng)大的一个(gè)仓储的料架上,抱着一箱东西放(fàng)到传送带上。
这(zhè)些场景其实都展示了,目前具身(shēn)智能对于(yú)比较糙的活,就是抓取放置和双手抱(bào)持这样 的能力(lì)已(yǐ)经走向成熟。
在(zài)这种情(qíng)况下,我们还要问一(yī)个问题,为什么是这个人形对吧(ba)?有很多人现(xiàn)场问我,你(nǐ)们为什么要做成人形(xíng)?因为你想如果货架上的一个(gè)商品掉在地上了,我的机器人得有能力去够地面这(zhè)么低的东(dōng)西(xī),我的货架可能两米高(gāo),我要能够抓到两米那么高的东西,同时我还能还得来回走动,还要得有(yǒu)两只手才能抱(bào)住一个箱子,又有两只手又能高又(yòu)能低又(yòu)能够来(lái)回走,那么它基本上就(jiù)把形态往人基本上非常的靠拢了,那么我们目前用的是一个轮式底盘,没(méi)有腿,那么也已经达到这(zhè)样的一个能力了。那么我们认为像这(zhè)样的抓取放置搬(bān)运的能力,在很多行(xíng)业,比如说零售,比如说工厂,比(bǐ)如说一些服务的场景全都可以用起来。
所以我判(pàn)断 ,人形机器人的大规(guī)模应用,2025年、2026年我们将见到从百台级到千台级的(de)一个快速的增长,
王兴兴:我个(gè)人的话,总体(tǐ)来说,对目(mù)前(qián)整个(gè)人形机器人应用落地还是(shì)需要一些时间,但当下,包括今年(nián)和明年对一些简单场景(jǐng),像特斯(sī)拉(lā)场景里面把(bǎ)一个电池从什么地方装到(dào)什么(me)地方里面,这种简单的(de),用模仿(fǎng)学(xué)习能做的事情,目前(qián)的AI技术其实成功(gōng)率还(hái)是做的比较高了,今年或明年可以做(zuò)一些应用,包括把整个的 GPT速度也提升。
但(dàn)是我觉(jué)得(dé),真 正要提升人形机(jī)器人大规(guī)模应(yīng)用,确实还需要更多的时间,把机器人(rén)的模型本身(shēn)做得更好(hǎo)一点,让它更通用,基本上无论是更精细化的或者更泛用心的一些事(shì)情都(波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”dōu)可(kě)以做一起来,所以我还是希望社会大众对AI和机器人能更多一些耐心。但实际上可能中国其实还(hái)是有很多人比较心急的,我觉得还是大家可以再多给一点耐心。谢谢。
熊友(yǒu)军:我觉(jué)得人形经济和大规模的应用,其实(shí)上这个(gè)就涉及到一个商(shāng)业化场景选择(zé)的问题,实际上(shàng),并不是(shì)说现(xiàn)在人形机 器(qì)人不 能够应用,而是(shì)说要再看什么场景。我觉得在有一些刚需的场景,或者对人不可达到的这种场景,还是有(yǒu)一(yī)些可以(yǐ)用的,尤(yóu)其是这(zhè)种刚性需(xū)求的(de),比如抢险救灾(zāi),特种的对核辐射,或者(zhě)是说有毒有害气体环境等等(děng),这些我觉得现在实际上是可以用的(de)。
大家其实想的更多是,技术怎么去提升,然(rán)后怎么它能够让人形机器人能够快速适应更多的场景,然后把成本快速(sù)的降下来,只(zhǐ)有这样通过一方面通过技术的提升,提高有更多工作效率,让人有更好(hǎo)的体验感,然后更多人愿意用它。
第二方面,就是把成(chéng)本继续往下降,我觉得让大家更 买得(dé)起(qǐ),这个我觉得要是(shì)要想的这个方式。
另外(wài)我觉得还有一种,就是商业模(mó)式(shì)上的探(tàn)索,实际(jì)上人形 机器人(rén)是我觉得是一个集大成者,它基本(běn)上涵盖了(le)机器人和人工(gōng)智能的绝大部分(fēn)的技术(shù)领域,然后在人体技术上的研究能够大大的推进这(zhè)些技术(shù)的成熟,然(rán)后技术甚至技术(shù)的(de)市场化,我们可以采用“沿途下蛋”方式获得(dé)这个商(shāng)业的利(lì)润。通过这些其 他的一些技术,人形机器人产(chǎn)品(pǐn)上孵化的其(qí)他技术商业化、产业化来(lái)推(tuī)动(dòng)人(rén)形机(jī)器人研究。一个典型的例(lì)子,就是我们现在有(yǒu)一些人(rén)形(xíng)机器人公司(sī)已经在其他产品上(shàng)实现盈利,然后(hòu)已 经实现了一个很好的商业化,这我觉得是一种非常好(hǎo)的模式。
问:作(zuò)为技(jì)术人员,我们是否意识到有很多机器人都(dōu)有道德伦理方面的顾虑——我们如何(hé)才能消除这(zhè)些顾虑?
Marc:我(wǒ)认为,从最高层面来说,理解所有(yǒu)技术都涉及(jí)一些风险和机遇是很重要的。我参加了一个政(zhèng)府会议,但(dàn)我听到(dào)许(xǔ)多政府的人都在谈(tán)论监(jiān)管(guǎn)人工智能,而压倒性的感 觉是(shì)关注最糟糕(gāo)的(de)结果,对吗?
比如在(zài)欧洲,来自英国一位人士(shì)在发(fā)言,让(ràng)我印(yìn)象深刻的(de)是,人们几乎陷入恐慌,担心最糟糕的事情会发生,并且不惜一 切代价想要阻止(zhǐ)这种事情发生。但我认为,不利(lì)用机会的风险与(yǔ)让坏事发生的风险一样大。
所(suǒ)以我认为,正(zhèng)如开发人员指出的那样,我们需要(yào)找到一种平衡,当我们撰写(xiě)论文时,我们会在开头列出这些(xiē)内容(róng)。这些(xiē)都是我们工作可能产生的(de)巨大影响,但我们(men)从不谈论我们的(de)工作,可能产生的坏事是什么。
我们(men)需要诚实和开放(fàng),更加公平地对待这(zhè)个问题(tí),但随后(hòu)继续强调这种(zhǒng)平衡,并以某种方式防止我们错过机会,我认为由于公众(zhòng)的恐惧,这种机会(huì)很容易发生。
陈建宇:我觉得人们对这个人形(xíng)机器人、或者相应的(de)具身智能(néng)机器人技术的担忧,其实核心来自于对自身安全(quán)性的一个担忧。
安全其实有几个不同的层次,最底层的层次是物理的安全,大(dà)家担心机器人会不会在工作的时候去伤害到(dào)人,那么这是一(yī)个层次;当然其实在它分情况,那么比如说我们刚才说的如果(guǒ)是(shì)工厂里面的话,其实如(rú)果我们把它跟人工作环境隔开(kāi),其实一定程度上(shàng)能解(jiě)决这个问(wèn)题;同时,我们也需要从我们的算法硬(yìng)件等等(děng)上(shàng)面做的更鲁棒来去(qù)优化这(zhè)个问题(tí)。
那(nà)么第二个层次,其实也是生存上面的(de)问题,但是(shì)不是说(shuō)物理层面的,那(nà)么也是不是说全人类(lèi)的一个担忧,而是说(shuō)有一部分人一(yī)个担忧,他(tā)担心这个会替代咱们的某一些工作,大家(jiā)会有担忧(yōu),我(wǒ)觉得这个事情(qíng)可能需要政府或者商号进行有一些引导,我们尽(jǐn)量的开始去做一些确实(shí)劳动力非常紧缺的这样(yàng)的一些产(chǎn)业,比如说我们一(yī)些非常恶劣环境工业(yè)环境,或者是比如说养老等。
当然第三个层 面(miàn),如果未来我们的具身智能机(jī)器人真正拥有了意(yì)识,那么这个会(huì)对(duì)人(rén)类的自(zì)我存在的价值可能产生一些担忧(yōu),我觉得这个事是更远的和(hé)更大的topic。
王兴兴:我觉得(dé)机器人的伦理道德和安全性问题,是非常重(zhòng)要的一件事情,而且我觉(jué)得,要希望是(shì)在场所(suǒ)有的人(rén)都大家需(xū)要共同去维护的一(yī)件事情,就有点像现(xiàn)在新能源汽车以及无人驾(jià)驶,它其实还是有很多安全性问题,并且比如说有一辆早些年新(xīn)能(néng)源汽(qì)车起火了(le),或者有一家新能源汽车无人驾驶出了交(jiāo)通事故(gù),这个对整(zhěng)个行业影响是非常大的,会降低普通老百姓对技术行业的认可度以(yǐ)及信心。
这个(gè)事情很容易发生在人形机器人和AI这个领(lǐng)域。所以我一直觉得。当下以及未(wèi)来大家都应该在(zài)机器人安全(quán)性上,无论(lùn)是出台一些规(guī)章政策,或者做一些更(gèng)好的引导(dǎo),或 者需要(yào)全世界政府(fǔ)出台一些相关的政(zhèng)策,都共(gòng)同推动整(zhěng)个行业的(de)健康发展。
王鹤:所以我就(jiù)从技术(shù)的角(jiǎo)度,人(rén)形机器人它的一个面向终局的(de)技术必然是大模型,那(nà)么其实只有大(dà)模型才可能实现非常高的通用(yòng)性,把很多能力全部(bù)汇集在一起,把很多模态,从视觉感知,到语言理解,到动(dòng)作执行(xíng),那么融会贯通,那么今天我们(men)在技术上其(qí)实是有方法对大模型的行为进行限制,就是“对齐”,我们在大模型内部已经进行了深入研(yán)究,那么未来,我们会对(duì)语(yǔ)言(yán)模型、多模(mó)态(tài)模型进 行更深入的对齐,让它不(bù)会伤害到(dào)我们的人类,并且他的(de)技能会被局限在服务的(de)范畴内(nèi),那么这一些是我(wǒ)们技术(shù)上能做的,在技术上之外,必然还需要政府社会和国(guó)际的合作(zuò)。
熊(xióng)友军:我觉得前面几位都说的都挺好的,我(wǒ)就补充一点(diǎn),就是说我觉得应该(gāi)是有一些行业组织或者是政府出(chū)来,更多在法律法规这方面(miàn)更多的立法,包括更多的(de)是做全(quán)社(shè)会(huì)的机器人使用、伦理道德方面的一(yī)些教(jiào)育。因为我觉得,任何一个机器人也是(shì)一种工具,放在(zài)不同人的手上,它的可能有不同(tóng)的(de)使用(yòng)方法(fǎ),然后只有加(jiā)强教育,提(tí)升大(dà)家对人(rén)工智能对人形机 器人的使用,让(ràng)大家相对安全角度去(qù)考虑,我觉得才(cái)是一个正确的方式。
问:您认为(wèi) 5 年后人形机(jī)器人行业会发展到什么程度?哪些经济领域将率(lǜ)先使用它们?
Marc:不,我认为人形机器人的(de)出(chū)现让事情变得复杂。我认为机(jī)器人在工业领域的应用将(jiāng)取得很大(dà)进展。我认为机器人(rén)的应用非常广泛。人们对此非常关注。正如大家所说,使机器人变得越来越好的技术确实正在日趋(qū)成熟。我认为工业将 继(jì)续(xù)取得(dé)进步。
我认(rèn)为人形(xíng)机(jī)器人本身总体上仍然非常(cháng)不(bù)成(chéng)熟。所以我看不到它(tā)们。我知道(dào)你可以看看一些人形机器人公司与汽(qì)车公司合作的演示。我认为这在某种程度(dù)上是一种炫耀,而(ér)不(bù)是一种生产力。我不知道(dào)这是不是题外话。如果你看看(kàn)仓库机器人,你 会发现(xiàn)最大的挑战之一是系统(tǒng)集(jí)成(chéng),特别是如果它不是围绕(rào)机器人设计的 全新仓库。
我认为许多仓库机器人供应(yīng)商都在苦苦挣扎,因为他们需 要一个系统集成商,而这个系统集成商会消耗掉太多的预算,因此很难赚钱,这是因为运营仓库的 IT 人员并不想开放他们的系统。在那里工作的人(rén)并不想改变他们现在做的(de)一切。如果机器人(rén)可以处理每一(yī)项任务,那就意味着他们仍然需要一(yī)个人来完成任务。使用(yòng)任(rèn)何类型的机(jī)器人对行(xíng)业来说都具有很大的复杂性。我认为这些都是重要因素。
说(shuō)实话,我(wǒ)原本以为 Spot 会取得更(gèng)大的成功,但 Spot 的推出(chū)只是一次(cì)实(shí)验。我们(men)之所以(yǐ)设计 Spot,是(shì)因为它能(néng)够让你连(lián)接自己的传(chuán)感(gǎn)器,因为(wèi)我们不知道人们想要(yào)什么样的传感器。我们(men)之(zhī)所(suǒ)以设(shè)计 Spot,是因为它能够让你对(duì)它进行编程,因为我们不知道(dào)现在的用户们都有哪些应用程序,而(ér)我们对(duì)它们的使(shǐ)用方式有了更多了(le)解,开发(fā)人波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”员正专注(zhù)于(yú)巨大机遇,因此 Spot 对人(rén)们的接受度确实产生了(le)影响。
也许如果我们(men)没有足够的商人,能够提(tí)前进入并(bìng)评估它是什么(me),我们实际上是在做(zuò)一个实验(yàn)。也许人形机器人会有(yǒu)更好的记(jì)录。
王鹤:我觉得(dé)我对人形机(jī)器(qì)人的发展总体是比较乐(lè)观的,那么在未来5年,我们要完成真正的(de)大 规模应(yīng)用,这件事情对于(yú)整个人形机器人仍然是一个先慢后快,其中慢的阶段,那(nà)么一(yī)个里程(chéng)碑应该是——在5年的时(shí)候我们能达到万(wàn)台人(rén)形机器人级别的应用。
这样的一个市场大约是对标现在商业清洁机器人。我们举个例子(zi),在超市在万达广场(chǎng)在(zài)写字楼一层(céng),我们看来(lái)回去洗地擦地的机器人,那么领先的这个市场,中国最领先的公司大约是每年(nián)出货1万台(tái),那么他做(zuò)的事情不局限(xiàn)做这么简单的事 情,它能达到在各种场景,不管是商超还是写字楼,还是很多不同的场景进行清洁,但是当然是平面清洁。
那(nà)么,对于(yú)我(wǒ)们人形机器人来说,我们(men)希望(wàng)能做到一个立体(tǐ)操作,但(dàn)是它的能力可(kě)能是(shì)局(jú)限的,我搬运我就是上货,我就是取货,对吧?
我没有更多的能力,但是我也要实现跨场景的(de)应用,可以在超市里、可以(yǐ)在(zài)工厂里、可以在服(fú)务场景等等。那么能达(dá)到5年(nián)1万台的市场规模(mó)的话,我相信后面有真实世界数据(jù)的回流,那时,我们(men)会看到人形机(jī)器人应用规模会加快,从慢时代进入快时代(dài)。
熊友军:人形机器人我对它的应用可能会更加乐观一点,其实大家看到这两年人形(xíng)机(jī)器人的进步非常快,尤其在AI驱动下面,实际上在市场应用(yòng)方面,你们已经可以看到国的有一些企业,包括全球企业已经开始在一些场景里面做(zuò)试点应用(yòng)了。
比(bǐ)如说在汽车(chē)厂,比如在一些商用服务场景,已(yǐ)经开始做试点(diǎn),随着这个试点(diǎn)数据会形成一个飞轮的效应,所以试点进展,然后(hòu)它会有更多的迭代,然后有更(gèng)多数据(jù)驱动(dòng),机器人会在在一些特定(dìng)的环境里面提(tí)高(gāo)效率(lǜ),它的速(sù)度,它的随着量的增长,它的价格(gé)会大幅(fú)的降低 ,这样我觉得会更快的去促进产业(yè)的应用(yòng)。
我觉得今(jīn)年(nián)年(nián)底,大家应该可(kě)以看到,有一部分的公司已经能够在一些比如说新能源汽车厂(chǎng),比如说在(zài)一些特种领域已经开始应用,明(míng)年我觉(jué)得应该可以看到一些可能千台左右(yòu)量级的出(chū)货。
问:你能在我们的年轻观众中“点燃一把火”,让他们也想成为“机(jī)器(qì)人专家”吗?他们应该怎么做?
Marc:我认为伊隆·马斯克(kè)本人凭借他的雄心和(hé)资(zī)源,可(kě)能在几年内推出10000个机器人,不(bù)一定是因(yīn)为它们会直接让机器人赚钱(qián),但看看他对电动汽车(chē)所做的一切。他们(men)从无人相信到现在,我比这里(lǐ)的任何人(rén)都更加(jiā)怀疑,包括(kuò)我在内,到每家汽(qì)车公司都有淘汰(tài)内燃(rán)机(jī)的计划。
我认为这是一件了不(bù)起的事情。他似乎对此(cǐ)很认真。所以这在整个人形机器(qì)人领域都是(shì)一个真正不确定性的因(yīn)素(sù)。我不(bù)确定如果他没有抓住机会,是否会(huì)有这么多人形机器人。
我认为机器人玩得越有趣,人们(men)就越能与它们互动。我到处走走,我没有带机器人(rén)来这里,但这里(lǐ)有很(hěn)多机器人,但我到处发表演讲,发现机器人在计划中相当无聊(liáo)。你总是能吸引(yǐn)一群人,只要你愿(yuàn)意让他们与机器人互动,他们(men)就 会留下来。我(wǒ)认为我们做得越多,公众(zhòng)就会(huì)越热情(qíng)。我非(fēi)常欣慰,参加这(zhè)次活动最令人兴(xīng)奋的事情可能是有很多人说你做的(de)工作是我十几岁时见过的,现在我正在做。我们越能(néng)展示我们的工作(zuò)并激励下一(yī)代,这(zhè)就会实现。
陈建宇:我的一个建议是,因为机会其实永远是留给有准备(bèi)的人(rén),那么像Maec做这个事情(qíng)做了做了好几十年,然后包括我们其实台上(shàng)我们几(jǐ)位也都是多年深耕在机器人或者(zhě)相关领域(yù),所以说,因为人形机器人它其实也是一(yī)个非常长周期的事情,同(tóng)时它(tā)也包罗万(wàn)象,从技术上(shàng)的软件、硬件、AI再到商业、产品等等,其实(shí)各方面都有,所(suǒ)以说大家应(yīng)该去问一问自己的内心在这一步范围内(nèi)到底自(zì)己最有激情,最喜欢的最热爱的是(shì)什(shén)么?然后从此刻开始(shǐ)就去(qù)积累它。最后,要么等待(dài)未来(lái),要么总有时刻你有施展自己的机(jī)会。
王兴兴:对(duì)于我觉得对于所 有年轻人,包(bāo)括我们其实这个时代(dài)都是非(fēi)常精(jīng)彩的,而且想象(xiàng)一(yī)下,大(dà)家也知道AI、机(jī)器(qì)人都是阶梯性发展 ,就像GPT没有出来(lái)之前,大(dà)家觉得语言模型(xíng)没什么用,基本(běn)上(shàng)是(shì)非常差(chà),但突然就是发生了巨(jù)大进步,非常好,其实 机器人、AI也会遵循这(zhè)种规律,所以大(dà)家现在可能看到(dào)机器人(rén)的 AI 能力都(dōu)比较弱,但实际上这(zhè)是好(hǎo)事(shì),为什么?因为大家都(dōu)有机会去做的更好,可以真正的把这种(zhǒng)人(rén)类目(mù)前可以预估的最伟大技术,就在当(dāng)下,就在未来(lái)几年,所以这个事情都是非常值得做的,
而且,在机器人和 AI 另外一个 比(bǐ)较适合年(nián)轻(qīng)的点,它没有那么多历史包袱,不像数学领域(yù),有几百上千年的非常天(tiān)才的数学家(jiā),你(nǐ)一定要比他们做得好,你(nǐ)才可以(yǐ)做技术,但是当下,AI 和机器人(rén)它都非 常年轻,尤其 AI 技术就最近几年的东西,所以非常适合(hé)年轻人(rén)。我(wǒ)一直感觉在如果在未来(lái)5年到10年或者几(jǐ)十年回看我们现在这个时(shí)代,所以想想这种感觉,真的非常激动人心(xīn)。
王鹤(hè):我觉得(dé)其实未来的15年,在我心(xīn)目中会是人形机器人,从当(dāng)下在产业中没有规模化应用,到可(kě)能成长到跟今天汽车的产量一个万亿市(shì)场的(de)过(guò)程。那么在这个过程中,其实(shí)对年轻人来说,那(nà)么我(wǒ)觉得大家就是做好自己 就可(kě)以了,因(yīn)为15年之(zhī)后(hòu)很多工作都(dōu)是跟人形机器人相关(guān)的,今天可(kě)能(néng)你负(fù)责卖车,那么15年后,你(nǐ)可能岗位就调到卖人形机器(qì)人对吧?今天你是班级(jí)里头的佼(jiǎo)佼者,那么你学 AI ,那么你可能发现你的职(zhí)业生涯就是围绕着(zhe)进一(yī)步提升人形机器人的能力展开的,所以 大家做好(hǎo)自己,我们(men)一起(qǐ)共享光明、人形机器(qì)人的未(wèi)来。
熊友(yǒu)军:其实我是经历过个人电(diàn)脑时代,我经历智能手机时代,我经(jīng)历过移动(dòng)互联网的时代,现在其实我们正在经历智能汽车的时代,电(diàn)动汽车的时代,我(wǒ)觉得(dé)下一个时代实际上(shàng)就是聚生智能的时代,而聚生智能时代(dài)的典型代表其实就是人性机器人,所以我给现在的年轻人建议就(jiù)是说保持野心(xīn),怀(huái)揣大梦想。
问:让我(wǒ)们在(zài)小组成员之间花几分钟时(shí)间讨论一(yī)下(xià):你们想要互相问什(shén)么问题?
陈建宇:所以我想问Marc,你认为对于机器人和(hé)人工智能来说最重要的研(yán)究问题是什么,例(lì)如,如果你只(zhǐ)能选择(zé)一个研究(jiū)项目,那么你选择哪一个(gè)?
Marc:让我从侧面回答一下,这(zhè)也是一种回避你的问题的方式。最后我没有展(zhǎn)示我的最后一(yī)张幻灯片。我的最后一张幻灯片是一个展示机器人故障的视频。它(tā)展示了,我不知道它大概有 2 分钟(zhōng)长,可能有 25 种不同的故障。我认为(wèi)故障是工(gōng)作中(zhōng)最有趣、最有意思、最有用的部(bù)分(fēn),关注它(tā)们,然(rán)后在你(nǐ)的(de)工(gōng)作不工(gōng)作的时候继续前进,这真的很重要。这不是研究的主题,但它是一种工作精(jīng)神。所以如果我要问(wèn)你们所有人这个问题的话,那就是我还没看到任何人在(zài)演讲中提到过事情无法正常运转,而(ér)且我(wǒ)敢肯定,单一机器人不会在不发生碰撞的情况下完成那(nà)些后空翻以(yǐ)及(jí)它们(men)所做(zuò)的所(suǒ)有很酷(kù)的事情。你喜欢碰撞吗?
王兴兴:Marc先生,很荣幸今天见到您,我其(qí)实想有好奇想问一下,您觉得对于人形机器人的手,您觉(jué)得未(wèi)来几年(nián)比较合适的有几个(gè)手指,或者几个电机(jī),这会是比较好的一个方向?
Marc:再次,我要回答一个略有不同的问题。我们研究所最近举办了一场研讨 会(huì),名为“对操纵的反向(xiàng)观点(diǎn)”。我认为灵巧性(xìng)确实很重要,但基本上(shàng)它并 没有取得(dé)很大进展,尽管人们至少已经为(wèi)此努(nǔ)力了 50 年。我认为我(wǒ)们必须以不同的方式思考,再次尝试不同的东西,就(jiù)像我今天在(zài)演讲中开始的(de)那样,也许(xǔ)我们需要更(gèng)多的动态操纵,而不是所有的静(jìng)态抓(zhuā)握。我认为很多学(xué)习界的人在提(tí)出他们正在学习的灵巧性的(de)要求时对自己要求不够。他们做的事(shì)情很简单,很容易。
我认为那里是有机会的,有多少只手我不知道有多少根手指。我认(rèn)为五个已经很多了(le)。但也许(xǔ)有一(yī)天我会觉得更有趣的问题是手掌怎么样?我们的(de)手掌功能非常强 大,它们不仅仅是静态的块。而且你看到的几乎每个机器人手都有许多手指在做这(zhè)件事,但仅此而已。
王鹤:之前我提到过,大概 15 年(nián)后,世界上会有(yǒu)数百万、一千(qiān)万个人形机器人。如果(guǒ)人形(xíng)机器人具有通用目的,那么人形机器人是终极体现,那么这种通用目的的终极技术是什(shén)么(me)?对于人类噪音,您是否认为(wèi)视觉、语言、动作模型,这些端到端模型是人类噪(zào)音(yīn)的终极技术或方法?
Marc:我很难相信,端到端是(shì)取得进步的方法(fǎ)。也许最终在渐近(jìn)线上端到端是正确的方法,但(dàn)我认为(wèi)我们知道(dào)的太(tài)多了。
说实话,我认为人们过分看重(机器)学习。我知道应该对学习持乐观态度,但如果你看看当今存在的解决方案,你会发现(xiàn)最好的解决(jué)方案中学习所起的作用微不足道或微不足道。当然,在波士顿动力公司,今天学习很(hěn)少,尽管人们正在努力。我认为控(kòng)制系统、控制理论、观察器,这些在过去 20 或 30 年建立起来的东西仍(réng)然发挥着巨大的(de)作用。
我(wǒ)不想就这样把它抛弃。我希望我们能真正拥抱(bào)学习,但要把它与我们已经知(zhī)道的(de)东西结合起来,找到一种(zhǒng)方法把它们结合起来,至少在接(jiē)下来的5年或10年里(lǐ),也许在渐近线上,情况(kuàng)会有所不同(tóng)。
熊友军(jūn):我的一个问题是,Marc作为波士顿动(dòng)力的创始人,您之前(qián)开发了像Atlas这样的非常令人惊奇的(de)这种产品,但是我们前不久我们(men)看到波(bō)士顿动力(lì)终止了这个机器的研发,然后由原(yuán)来的液压驱动,转向(xiàng)纯电驱动的这(zhè)种方式。对这方面是(shì)出于什(shén)么(me)样的考虑?是因为成本的考虑,还是因为出于商业化的考虑?同时我(wǒ)还想知道,波士(shì)顿动力未来5年的一些这种(zhǒng)计(jì)划,对(duì)商业化的一(yī)些计划。
Marc:我认为,如果你问为什么要进行转(zhuǎn)变,我认为有两个关键因素:一(yī)个是液压机器人(rén),我喜欢液压技术,我 会(huì)用液压技术制(zhì)造很多机器人。我认为,建造人形机器人或类似人形机器人仍(réng)有空(kōng)间 ,它(tā)们将继续(xù)使用液压技术,因为重量和(hé)强度(dù)等(děng)因素。
但我认为有两点。一是它们(men)很麻烦,至少对于像 Atlas 这样的高性(xìng)能机器人来说(shuō),尽管我们付出了无尽的努力,也永(yǒng)远无法让它们完全不漏(lòu)油。当你把石油机器人放(fàng)到工(gōng)厂和家里时,它们(men)就不能滴油(yóu);同(tóng)时,很难找到精通液压技(jì)术的人,因为人们认为这(zhè)是非常古老的东西,尽管 Atlas 在液压工作原(yuán)理方面有很多创新,从服务器阀(fá)门到(dào) HPU 液压动力装置,一直都是如此,确实(shí)有创新的东西在进(jìn)行;最(zuì)后,我认为电(diàn)动汽车在(zài)规模上已经(jīng)足够强大,它们可以参与(yǔ)竞争。我不想代表波士顿动力发言,尽管(guǎn)我是创始人之一,并且仍然(rán)是董事会成员,但我认为他们必须有自己的计划,说(shuō)明未来的计划以及(jí)技术的所有细节(jié)。我想随着事情的发展,你会发现更 多这(zhè)方面的内容。
主(zhǔ)持人:非常感谢(xiè)。我想观众肯(kěn)定(dìng)会有更多问题,也许吧,但我们的时间真的不多(duō)了。所以(yǐ)非常感谢各位小组成员。非常感谢观众的到来和(hé)聆(líng)听。我(wǒ)认(rèn)为这是一场(chǎng)非常精彩的会议,尤其是(shì)小组讨论。我对组织(zhī)者的建议是,我们明年(nián)再举办一次类似的会(huì)议,然后我们可以回顾进展和未来的步骤(zhòu)。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了