橘子百科-橘子都知道橘子百科-橘子都知道

波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

8月24日下午 ,2024世界机器人大会上,举行了一场期待已久的中国、美国“具身智能”与人形机器(qì)人领域学(xué)者(zhě)的“世界对谈”。

大名鼎鼎的“机器狗(gǒu)之父”、美国波士顿动(dòng)力创始人Marc Raibert(马(mǎ)克·雷伯特)首次(cì)来到北京。他说,“我(wǒ)简直不敢相信,不仅是机器人的数量(liàng),难(nán)以置信,还(hái)有这么(me)多热情的人参加了展览。中国对机器人的兴奋和热情很高。”

而此次与Marc对谈的四位CEO所在的公司也不寻常:除了宇树科技之外,星(xīng)动纪(jì)元、银河通用、北(běi)京具身智能机器人创(chuàng)新中心都成立不足2年,一出道(dào)就是具身智能和(hé)人形机(jī)器人行业的“顶流”。

而且,星(xīng)动纪元、银河通用背后 也站着中国(guó)最高(gāo)学(xué)府:北 大(dà)和清华(huá),代表着中(zhōng)国前沿科技创新的重要来源。

其中,星动 纪元由(yóu)姚期智带领的(de)清华(huá)大学交叉(chā)信息(xī)研究院孵(fū)化成立的,星动纪元创始人陈建宇现在还是清华大学交叉(chā)信息研究院助理教授,公司融资超亿元(yuán),联想创(chuàng)投已加入其(qí)中。

银河(hé)通用机器人创始人的王鹤则是(shì)北(běi)京大学(xué)助理教授,也是北京智源人工智能研究院具身智能(néng)研究中心主任,过 去半(bàn)年,银(yín)河通用完成天使轮融资共计7亿元(yuán)人民币,刷新了国内人形机器人(rén)领域单轮融资规(guī)模,美团战(zhàn)投、北(běi)汽产投、商汤 国香基(jī)金、讯飞基金、启明创投、蓝(lán)驰创投、经纬 创(chuàng)投、源码资本、IDG资本(běn)等头(tóu)部财务机构都参与其中。

而(ér)北(běi)京具身智能机器人创新中心则是北京市(shì)发起成立的机器人“国家(jiā)队”机构 。北京具身智能机器人(rén)创新中(zhōng)心总经理熊友军,目前(qián)还是“人形(xíng)机器人第一股(gǔ)”优(yōu)必选(xuǎn)科(kē)技CTO。

Unitree Robotics(宇(yǔ)树科技)也是当(dāng)下人(rén)形(xíng)机(jī)器人行业的明星企(qǐ)业。公 司创始人、CEO、CTO王(wáng)兴兴毕业于上海大学,取得了机械工(gōng)程硕(shuò)士,具有近(jìn)10多年足式(shì)机器人研发经验,拥有产品(pǐn)从0-1-100的研发与(yǔ)商(shāng)业化(huà)落地能力,100+项机器人相关专利。

此次圆(yuán)桌由德国慕尼黑工业大学教授(shòu) Alois.C.Knoll主持,美国波士顿动力创始人Marc Raibert(马(mǎ)克(kè)·雷伯特(tè)),与(yǔ)中国 四大AI机器(qì)人企业领军者——陈建宇、王兴兴、王鹤(hè)、熊友军,五人围绕机器人行业、AI 大模型驱动机器人(rén)发 展等议 题展开讨论。

一个多小时(shí)的圆桌(zhuō)当中,Marc表示,未(wèi)来5年,机器人硬件发展仍(réng)将非常重要,但同时,能够打破语义理解障碍的基础(chǔ)模型或其他 AI 方法也(yě)将对机器人技术产生更大(dà)的影响。不过,要想取得(dé)机器人领(lǐng)域真正的进步,就需要更高的可靠性和安全性,未来人们需要投入大量资源(yuán)努力解决(jué)此类问题。

Marc非常不看好人形机(jī)器人行业。他认为,工(gōng)业机器人已(yǐ)经非常(cháng)成熟,而且 能够商业化,目前人形机(jī)器人(rén)“在某种程(chéng)度上是一种炫耀,而不(bù)是一种(zhǒng)生(shēng)产力”。

陈建宇表示,过去10年AI发展很快,从简单的图像(xiàng)处理,到深度学习、强化学习,再到ChatGPT技术,这对于未来“具身智能”产(chǎn)生很大的影响。未来几年,AI、具身智能会与人形机器(qì)人不断融(róng)合,去训练 一个通用模型。他相信未(wèi)来(lái)5年,我们 将迎来“机(jī)器人(rén)的ChatGPT时刻”。

王鹤指(zhǐ)出,当前 AI 大模型在机器(qì)人上仍有巨大的局限,尤其是 “泛(fàn)化的开瓶(píng)盖”技能还没(méi)有训练出来,但(dàn)同(tóng)时,这也是大模型带来了重要机(jī)会,一旦(dàn)大模型涌现能 力(lì)不断加强,他(tā)认为未来(lái)5年,依然(rán)有一个至少(shǎo)做操作任(rèn)务的(de)通用机(jī)器人机会。

熊(xióng)友军表示,当前关节性能提升、高的能(néng)量和电池密度的提升非常快,使得机器人的(de)运动控制能力、电机(jī)等方面提升非(fēi)常快。未来5年(nián),机器人(rén)关(guān)节和(hé)能量密(mì)度会持续提升。毕竟和人(rén)类相比,现在机器人的能量执行效率还是有非常大的差 距。

以下是钛(tài)媒(méi)体(tǐ)AGI编辑对此次圆桌全文整理:

问:您能否向观众简单介绍一(yī)下(xià)您的工作:您为什(shén)么以及什么时候开(kāi)始对人(rén)形机器(qì)人感兴趣的?

Alois:我从 2001 年开始担任慕尼(ní)黑大学的教授。我对人类噪(zào)音的一个方面产生(shēng)了兴趣,那就是具象化(huà),对吧?我(wǒ)的朋友 Pfeiffer 和我们(men)一起从大学毕业。苏黎世退休了,不幸的是,我们(men)坚信具象化。所以我们认(rèn)为,在我们的人类类型中,智力只会在以非常自然(rán)的方式与世界相连的人类类 型身体中发展。所以身体应该有同样的(de)动力,同样的尺寸,等等(děng)。否则,就很难(nán)做到这一(yī)点,你在(zài)这里看到的 Kronos 系列机器人,左边,左(zuǒ)下角的 Roll Boy2024 就是这种信念的结果之一。

Marc:我认(rèn)为你贴出的(de)那张图片对我回答这个问题很有帮助。如(rú)果人形机器人 意(yì)味(wèi)着两只胳膊、两条腿直立 向前,那么(me)直到最近我才(cái)对此感兴(xīng)趣。事实(shí)上,我一直认(rèn)为现(xiàn)在的(de)公(gōng)司注重功能性,作为一名教授(shòu),我认为功能性才是(shì)最重要的,机动性、灵巧(qiǎo)性、感知力和智能,而外形和外观则是次要的。另一方面,如果人形机器人意味着像腿一样的动态(tài)生命(mìng),我会把它与世界(jiè)互动。我一直是(shì)人形机器人的粉丝,尽管我建造的第一个机器人是弹簧单高跷的东西。我认为(wèi)人形机 器人的许(xǔ)多基本要素都在(zài)那些弹簧单高跷的东西中。确实,当我(wǒ)们开始建造机(jī)器人时,波士(shì)顿动(dòng)力公司是直立的,有两条腿,两只(zhǐ)胳膊。有时领先。如果你看看公众的反应,你会发(fā)现 YouTube 点击(jī)量(liàng)增加了(le) 10 倍 ,我非常关注这些点击量(liàng)或评论,或者只(zhǐ)是人们的态度。人们非常感兴趣。普通的非科学(xué)家(jiā),比如说,非工程师,他们(men)对人形机器人很感兴(xīng)趣,而狗惹恼机器人却得不到同样的赞誉。

熊友(yǒu)军:我(wǒ)是从读博士的(de)时(shí)候,2000年开始做(zuò)机器人的研发,当时读 博士的时候,那时候更多的是做工业领域、特种领域的一些机器人(rén),用在(zài)一些危险的环境(jìng)里(lǐ)面,因(yīn)为那(nà)时(shí)候机器人技术还是非常不成熟,但在很多特种领域(yù)和危险场景(jǐng)里面,是需要(yào)用机器人去完成工作了,然而那时候机器智能实际上是很差的。所以我们当时想的办法,是将机器 人的智能跟人的智能结合起来,所(suǒ)以做了一些机器人要操作的一些事情(qíng)。

但在遥控(kòng)操作完成这些工作(zuò)的过程中(zhōng),我们(men)发现有很多的场景,实际上用轮式的工业机(jī)械手臂是(shì)解(jiě)决(jué)不了的,尤(yóu)其(qí)是有时候在一些特种(zhǒng)场景环境比(bǐ)较狭小,然后环境比较复杂的(de)轮式,然后履带式实际上根(gēn)本就进不去(qù),但是人是可(kě)以(yǐ)进去。还有一种,是 要试用很多工具去完成那些工作。

所以当(dāng)时我们就觉得,如果说有(yǒu)微(wēi)型机器人的话,实际上应该是能够提供很好的解决(jué)工具,或者一种解决方(fāng)案(àn),但是我们当时那(nà)时候也看到了(le)日本本田ASIMO,给我们提供了很多的一些启(qǐ)发,所以那时候我就对(duì)人形机器人非常感兴趣。后面毕业之(zhī)后,一直在做机器人相关的工作,

2012年,我跟优必选科技CEO周剑先(xiān)生创立了公司,做人形机器人研(yán)发工作,去(qù)年从深圳到北京开始筹建具身智能机器人创新中心,现在也是一直在聚焦人形机器(qì)人方面(miàn)的研发,主要的想法(fǎ)是希望说能(néng)够解(jiě)决人形机(jī)器(qì)人方面的一些共性、关键的技术(shù)问题,比如(rú)本体的一些基础研发不足,其实(shí)我们现在微型机器人在(zài)本体在关键的(de)核心器件,然后在一些传感器方面其实上有非 常(cháng)多要攻克的地方。另(lìng)外在运动(dòng)控制,实(shí)际上我们也做了非常(cháng)多的运动控制的技术研发,采用深(shēn)度学(xué)习(xí)强化学习的这种运(yùn)动控制的方式,包括现在也用一些(xiē)融(róng)神经网络的一些方式用去做运动 控制,同时其实我们现在还在做关于智能方(fāng)面的一些研发,比如说把用现在 具身智能的方 式,做一些基(jī)础性工作(zuò),比如建它的(de)数据集,研发机器人大模型框架等。所以这就是现在(zài)我在做的一些事情。

陈建(jiàn)宇:其实这个兴趣是很小的时候,就一直对智能机器人非常感兴趣,我印象很深刻,刚刚兴兴说她10岁的时候,我估计也是差不多类似的时间(jiān),不(bù)过当时看的不是波士(shì)顿动(dòng)力,当(dāng)时关注的是ASIMO系列(liè)机器(qì)人,当时我就非常的去着迷。然后我觉得,创业这件事其实是充满了挑战性(xìng)的,marc创办了波(bō)士(shì)顿动力做了40多年,其实我是(shì)非常尊敬的(de),就 是说你(nǐ)没有一个 发 自内心(xīn)的、天生热爱的话,其实很难去坚持下来(lái)的。所以对(duì)我(wǒ)来说(shuō),对这类机器人的(de)热爱,我(wǒ)觉得某种程度上是从小就(jiù)具备就拥有的。

那么真(zhēn)正开始做机器人其实(shí)是(shì)本科的时(shí)候(hòu)。当时在(zài)学校里面,我就接(jiē)触真正意义上的机器人的研究,当时接触了双足机器人,主要是做的就是捕获点步态规划(huà)相关的研究。后 来,博士阶段继续做机器人,虽(suī)然(rán)不是(shì)人形机器人,但(dàn)是也是相(xiāng)关的一些机器人(rén)的领域,控制它的学习,包括无人车和机械臂。而真 正的去全(quán)力做(zuò)人形机(jī)器人,是在我回国(guó)之后,然(rán)后在现在清(qīng)华正式投入去做人形机器人,还孵化了星动纪元公司,如今我们已经做了 最新一代、第六代机器人了,然后我们也(yě)在(zài)展会上面带(dài)来(lái)了我们机器人的实物,欢迎大家去关 注。

王兴兴:大(dà)家好,我是宇树科技创始人王兴兴,刚才有提到我大概可能10岁的时候就看(kàn)过marc先生在MIT实 验室做的双足,还有(yǒu)单(dān)条腿的机器人,然后印象非常深,在09年、10年的时候,大概大波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”一寒假,我就(jiù)做过一(yī)个小的人形机(jī)器人,然后(hòu)当(dāng)时做的不是特别(bié)满意,然后后来的(de)话,就在(zài)研究 生期间做了XDog这款机器人,差不多在13年到(dào)15 16年(nián),这款(kuǎn)机(jī)器人的话又采用了(le)比较低成 本的硬件(jiàn),然后运动性能非常好(hǎo),可以直接实现(xiàn)关节(jié)的力控以及整机的力控。

后(hòu)来的(de)话,一开(kāi)始我对人体机(jī)器(qì)人的技术还是(shì)跟 相对来说比较悲观的,但(dàn)是后来的话在2022年左右,整个的机器人、AI技术的进步,然后再加上ChatGPT出来以后,大家都看到人形机器人和AI结合的(de)可(kě)能性,所以说我(wǒ)们公司又重新开始做人形机器人。说实在(zài)的(de),其实我真正(zhèng)感兴趣的并不是说人形机器人,而是新的一个智能体机器人的形态。而人(rén)形机器(qì)人可能只是 说目(mù)前(qián)大家比较公认的、一个最有可能性的通用机器人和通用AI的结(jié)合体,但是这(zhè)可能并不(bù)是个唯一的,我(wǒ)真正希望能诞生甚至更比人更高级的一个智能(néng)体形(xíng)态,可以大大推动整个人类(lèi)工(gōng)业的变革,推(tuī)动新的工业革命(mìng)。

王鹤:我是北京大学计算(suàn)机学院助理教授,也是北大(dà)银河通用具身智能联合实验(yàn)室(shì)的主任王鹤,那么,我(wǒ)跟(gēn)人形机器人、具身(shēn)智能结缘,主要是从我在(zài)斯坦福大学开始读博的时候。那么2016年的时候,当时深度学(xué)习技术已经出(chū)来了,也应用在很多图像识别分类这些任务当(dāng)中。那么(me)当时 作为一个前沿研究,我们试图去理解人类是如何(hé)把感知思考还有交互的(de)能力(lì)融合在一起的。

所以我博士期间的第一个工作,就用(yòng)一个视觉模型来看桌面上人的动作和物体的一(yī)个运动,然后推理人下一步(bù)想要什么,这是一个语言模型。

最后再用(yòng)一个简(jiǎn)单的机器人,智能的(de)马克杯去响应(yīng)人的动作,那么(me)这个(gè)工作获得了欧洲图形学的最佳论文提名,但是(shì)我们认为(wèi)它(tā)非常的不足,就是(shì)我们的一个马(mǎ)克杯只(zhǐ)能在桌面(miàn)上移(yí)动响应人的(de)动作,它没有跟(gēn)人交(jiāo)互的能力,我们的视觉(jué)只能看有限的(de)几(jǐ)一种物体,那么我们 的语言(yán)模型只能根据这个人(rén)跟这些桌面 东(dōng)西的一些动作来做简单的推理。

那么通过过去8年我们的研究,在(zài)怎么样(yàng)把机器人的操作能力搞(gǎo)得更泛化,什么东(dōng)西都能抓,都能够放(fàng)置,那么(me)还有(yǒu)跟现在的多 模态大模(mó)型技术(shù)结合,真的明白人(rén)类想让你干什么,那么言(yán)出法随的去执(zhí)行所以去年我们就(jiù)孵化了北京银河通(tōng)用这家人形机(jī)器人 公司,我们现(xiàn)在也(yě)是把视觉、语言(yán)、动作这(zhè)三种不同的模态融(róng)合到大模(mó)型当(dāng)中,真正的赋能人形(xíng)机器人,让人形机器人能(néng)够走进千行百业、千家万户,这是我们的愿(yuàn)景。

问:你认为,我们(men)今(jīn)天(tiān)拥有的哪些重要(yào)技术是 10 年前没有的,但对于实用的人形机 器(qì)人来说却至关重要?它们在未来 5 年将如何发展?

Marc:我认为硬件开发仍将非常重要(yào)。如果我(wǒ)们谈论(lùn)未(wèi)来 5 年,毫(háo)无疑问,能够打破语义(yì)理解障碍的基础模型或其他人(rén)工智能方法将产 生最大的影响。

我认(rèn)为,人(rén)类可以做的(de)就是 ,概括和理解他们所看到事物的含义,而目前还无法真正捕捉到这些含义。我相信,如果(guǒ)人工智能能够在(zài)这方面取得进展,我认为它(tā)将产生巨大的影响。

实际上,过去(qù)十年来,每个(gè)人都在计算机、传感器(qì)、感知(zhī)、控 制等方面取得(dé)了(le)巨大进步(bù)。电池,我认(rèn)为人们忘记了(le)电池。虽然电池(chí)是(shì)工(gōng)业(yè)时代(dài)的产物,但是它们确实非常重要。是的,所以在电机方面过去 5 年里,人们做得很好,我(wǒ)认为电机已经(jīng)取得了长足的进步,当然,我们(men)将看到 更多 。

陈建宇:我从AI的视角来讲一讲,觉得非常(cháng)大的一个 不同。如(rú)果按照(zhào)10年(nián)前的话,其(qí)实是 2014年左右,当时是DeepLearning刚刚出来不(bù)久,它其实解决(jué)了很大一部分,比如图像处理等 等一些(xiē)问题。

那么后面,其实有我(wǒ)认为两个最重要的里程碑(bēi):一个(gè)是以16年(nián)阿尔法狗为代表的深度学习(xí),紧接着把它用在了强化(huà)学习上面,做深度强化学习(xí),解决了一些问题;第二(èr)个是以(yǐ)ChatGPT为(wèi)代表的大语言模(mó)型,所以这点我认为是(shì)过去10年没有的,但又对未来我们人形机器人,或(huò)者是具身智能起到非常 大的决(jué)定性作用的两个因素。

那么可(kě)能在接下来的这几年时间,这(zhè)两项(xiàng)技术会非常深度的跟人形机器人、具身智能融合起(qǐ)来,但他们(men)也分别需要(yào)经过一定(dìng)程度的训练,从而能训(xùn)练比较通用的一个模型,那么我们也能解决(jué)更加丰(fēng)富的(de)物理世界的数据程序。那么我相信,在接下来的5年,这几项技术(shù)都能起到非常大的一(yī)个进展,我们可能会在5年内迎来“机器(qì)人(rén)的ChatGPT时(shí)刻”。

王兴(xīng)兴:对过(guò)去10年(nián)最大的,还是AI技术带来的各种事情(qíng)有更多的(de)信心。我觉得除了 AI技术本身最大的(de)点,对于人形机器人,对于整个社会共识(shí)的(de)增加(jiā)也是非常关键的,就是 目前大家更加相信AI,更加相信人形(xíng)机器(qì)人可以诞生更多(duō)价值,这在(zài)10年前是(shì)完全不能想象的,那时整个社会基(jī)本上对(duì)此都完全没有(yǒu)信心。

另外一点的话,我觉(jué)得在未来 5年,总体上是肯定整个 AI 机器人、AI模型变化会(huì)非常快,因为目前的AI真的是日新月异,大家(jiā)可以用AI集(jí)成技术,去(qù)搭建各种自己的模型(xíng)去做训练,这整个已经变成一(yī)个(gè)非常的扁平化,以及容(róng)易操作的过程,其实很(hěn)多人大家都可以参与进来 ,去做机(jī)器人模型并且去做训 练,所以 我觉得。未来5年这块的各种AI模型创新(xīn),包括更新的一些神经网(wǎng)络模型,包括脉(mài)冲(chōng)神(shén)经网络等都有很大 的一(yī)些机会。

王鹤:我觉得10年好快,10年前是(shì)2014年,其实我们已经看到(dào)inbody的AI,甚至不是 一个在西方的学(xué)术界比较popular的词(cí)汇,那么过去的十年(nián),我觉得一大技(jì)术的(de)进(jìn)展,就是(shì)我们在具(jù)身智能里 头已经有一些技能实现了非(fēi)常强的(de)泛化性。

那么以我个人的研究举(jǔ)例,在(zài)抓取 问题上,我们取得(dé)了比较长(zhǎng)足的进步,那么我们从只能抓方块圆的这些特定形状的物体,到基于三维视觉传(chuán)感器,我们可以抓不透明(míng)、不反光,也 就是在(zài)深度(dù)传感器里头 能完(wán)美成像的这些物体,到我们最(zuì)近(jìn)的技(jì)术能够预测透明、高反光、金属、吸光这些非常有挑战材质(zhì)的物体(tǐ),基于(yú)它去做泛化抓(zhuā)取操作。

那么在今天(tiān)的展厅,我们都(dōu)接受观(guān)众给我(wǒ)们的各(gè)种形(xíng)状,各种材(cái)质随便堆叠乱七八糟的物体,我(wǒ)们的机器(qì)人都展示了非(fēi)常(cháng)泛化和高成功率的抓取能力,那么现在的问题(tí)是,像这样的每一个技能,大家都在分分别的去做开发,那么很多人会提问(wèn)你能(néng)帮我(wǒ)抓水瓶,你能不能帮我把瓶(píng)盖给拧开?我非常不(bù)好意思的说,现在泛化的开瓶盖技能我们还没有训练出(chū)来,这个就是大模型能够带给我们的机会,那么大语言模型涌现,也就是这种紧急(jí)行为(wèi)紧(jǐn)急行为,他能够在只见一次或(huò)者是第一次零次的演示的情况下,他都理解你要生成什(shén)么样的文(wén)字,我们(men)相(xiāng)信未来的5年给我们的机会就是发展机器人基础大模型,它能够实(shí)现涌现能(néng)力,它吞吐 足够量的数据后,有灵巧手,它能够抓能够加、能够拧,能够掰各种基本(běn)的手的各种运动能(néng)力都有了 以后,他能(néng)涌现,我们(men)给(gěi)他看一个视频,他就能理解这个活怎么干,到那个时候我们真正的就(jiù)有一个通用的、至(zhì)少(shǎo)做操作任务的 的机(jī)器人(rén)了,这是(shì)我认为未来5年的一 个机 会。

熊友 军:我(wǒ)觉得这一轮的机器人技术的进(jìn)步(bù)主要是由AI来驱动的。毫无疑问, AI驱动(dòng)我觉得体现在(zài)几个方面。

第一(yī)个就是它人机交(jiāo)互性(xìng)能得到了极(jí)大的提升。我记得10年前我们做(zuò)人工智能、做机器人 的时候(hòu)的那些交互,如果说我要加(jiā)语音加视觉,第成本非常高(gāo),第二个(gè)我们要做大量的研(yán)发的工作,我们需要(yào)几个博士(shì)、硕士带着一个团队,花很长的时间才能够完成一些物体(tǐ)识别、语音合成,自然语言理解NLP,还有甚 至是TTS、语音合成等方面的一些工作,甚至包括导航,但是(shì)我觉得,现在随(suí)着(zhe)技术的 进步,我们现在做(zuò)人形机器人(rén)的大模型,我们(men)直接一个(gè)端 到端的直接语音给指定给他,然后很快他(tā)就可以有 比较好的行为输出,有(yǒu)很(hěn)好的(de)意图理(lǐ)解,然后做任务(wù)规(guī)划(huà)等(děng)。这是一(yī)方面,我觉得这一轮对人机交互、对动物的规划、对执行等方面都有巨大提升,在10年前基本(běn)上都很(hěn)难去想象(xiàng)。

然后第二个现在(zài)的这些硬件方面也有(yǒu)极大(dà)的提升,体现(xiàn)在两个方向,第一个现在关节的性能的提升是非常快(kuài)的,大家可以看(kàn)到很多公司机(jī)器人可(kě)以开始去做一些非(fēi)常动态的、剧烈的运(yùn)动,实际上离不(bù)开关节性能的提升、高能量密度比,然后高的转速、高性能等这些技术的提升,实际上,在10年前我觉得是很难 去做到(dào)的。当然(rán)了(le)这(zhè)也有运动控制(zhì)能力的提升、电机的提升,现在其 实(shí)也有采用更多结构设计的方式,更适合它的布局等(děng)方面都有非常大的进步,包括把腿的转成惯量、把电机往上提等等,有各种各(gè)样的结构设计的技术的变化。

另外,刚(gāng)才还(hái)提到能量,其实早前我觉得10年(nián)前我们做机器人的时候,一个(gè)电池就像我们背后要背一个(gè)非常巨大的电池包能源包(bāo),而且能够持续的时间(jiān)很短。但是(shì)这(zhè)几年随(suí)着新(xīn)能源(yuán)汽车对电池技术(shù)的推(tuī)动(dòng)作用,其实我(wǒ)们 看到它的电池能(néng)量密度大幅提升(shēng),我现在一个比(bǐ)较(jiào)小的电池,可以支持比较长的(de)时间,我觉得这是一个非常重要的技术(shù)突破。

未(wèi)来,我觉得5年之后,这几个可能还是一个(gè)重大、要突破的方向,像(xiàng)刚才说的人机交互方面,我们希望大模型能提供更长(zhǎng)期的任(rèn)务规划,然后做意图 理解等(děng)等(děng)方(fāng)面(miàn),我觉得(dé)我们能只要给他一个 非常模糊的指令(lìng),他就可以给我们输出我们很标准的很(hěn)自然的这(zhè)种交互的结果。第二方面(miàn),可能就是在(zài)规划实(shí)施任(rèn)务(wù)方(fāng)面是一(yī)个非常重大、要攻克的方向,我们(men)环境会(huì)经常 变,面对的是一个动态环境,然后机器人能够根据环境变化,能够实时去改变它的一(yī)些执行策略等。当然,像能量方(fāng)面我(wǒ)觉得是 一个持续(xù)要(yào)提升的,它毕竟现在能(néng)量执行效(xiào)率和我(wǒ)们(men)人相比,还是(shì)有非常大的一个(gè)差距。

问:大规模部署人形机器(qì)人需要完(wán)成哪些任务?

Marc:但是如果你现在从更宏观的角(jiǎo)度来看,我刚才说了如果你想致富你现在就不会着(zhe)手开公司(sī),但是如果(guǒ)你想生存下去(qù)。你至(zhì)少(shǎo)也得收支平衡。

我(wǒ)想这是一(yī)个 更长远的计划(huà),我认为(wèi)要想取得真(zhēn)正的进(jìn)步(bù),你必须暂停,或(huò)者我不是(shì)说你必(bì)须暂停,我们在我(wǒ)的(de)研究所暂(zàn)停,让机器人更可靠的本地目标将是一件关键的事情,如果我能指出旧金山(shān)的自动驾驶汽车,他们杀死了一个人,这实际上甚至不是自动驾驶(shǐ)汽车的坠落。然(rán)后(hòu)克鲁兹完全退出了旧(jiù)金山。我知道现在还有很 多事情在(zài)进行,但这(zhè)在机器人领域很容易发生。因此(cǐ),可靠性是一个(gè)关键因素,这是(shì)人们投 入(rù)大量(liàng)资源(yuán)努力解决的问题之一。但这无助于(yú)解决,将我们带入下一代的更大问题(tí)。当我说我不认(rèn)为(wèi)每个人都必须专 注于你所说的真正有用的东西时。

陈建宇:要做(zuò)到 大规模应(yīng)用的话,有非常重要两个(gè)事情:一个是能(néng)不(bù)能找到大规模的需求,另一个能不能有(yǒu)我们技术,足够去实现、满(mǎn)足需求。

其实 现在(zài)有很(hěn)多零 散的表演需求(qiú),如果需(xū)要真的达到max(大规模)的话,我觉得主要还是看劳动力,非常密集的一些产业,比如三(sān)个阶段(duàn),一个是工(gōng)业、商用和服务(wù)。

大 体我认为,技术也基(jī)本上是按 照这样一个方向(xiàng)去成(chéng)熟发展,其中我觉得给我的感受,我认为工业的话可能会比较快就能够去用上了。其实刚才Marc的报(bào)告中里面也已经展现(xiàn)出来了,不管是人形,还是一些轮式的(de)机器人,在工厂搬运的这一类 的环境里面,已(yǐ)经是达到了非常接近 人类的(de)一个节点,那(nà)么在未来,它可能会更快更强大,然后以及成本更低,达到这个时候的话,其实它(tā)的第一个(gè)大规模应用的点就到了。

王鹤:我觉得具身智(zhì)能(néng)今天不能讲完全成熟,但是我们(men)今天GPT能力搭配人形(xíng)机器人,其实已(yǐ)经能够在很多场合(hé)干事情了。

像我们今天在展台(tái)展示了就是在一(yī)个零售的场 景,那么用户可以(yǐ)下单,我们的 机器人可以根据你的具 体下单(dān)的内容(róng),是拿一个(gè)冰红茶,还是拿一个巧克力,那么我们从货(huò)架把它(tā)取下来,同时我们也可以从地(dì)面的篮(lán)子里头把这些货不断的上到货架(jià)上,我们也可(kě)以从更大的 一个仓(cāng)储的料架上 ,抱着一箱东西放(fàng)到传送带上。

这些场(chǎng)景其实都(dōu)展示了,目前具身智能对于比较(jiào)糙的活,就是抓取放(fàng)置和双手抱(bào)持这样的能力已经(jīng)走向成熟。

在这种情况(kuàng)下,我们还要问一个问题(tí),为什么是这个人形对吧?有很多人现场问我(wǒ),你们为什么要做(zuò)成人形?因为你想如果货架上的一个商品掉在地上了,我的机器人(rén)得有能力去够地面(miàn)这么 低的东西,我的货(huò)架可能两米高,我要能够 抓到两米那么高的东西,同(tóng)时我还能还得来回走动(dòng),还要得有两(liǎng)只手才(cái)能(néng)抱住一(yī)个箱子,又有两只手(shǒu)又能高又能低又能够来回走,那(nà)么它基本上就把 形态往人基本上非常的靠拢了,那么(me)我们目前用的是一个轮式底盘,没有腿(tuǐ),那么也 已经达到这样(yàng)的一个能力了(le)。那么我们认为像这样的抓取放置搬运的能力,在很多(duō)行业(yè),比如说零售,比如说工厂,比如说一些 服(fú)务的场景全都可以用(yòng)起来。

所以我判(pàn)断,人形机器人(rén)的大规模应用,2025年、2026年(nián)我们将见到(dào)从(cóng)百(bǎi)台(tái)级到千台(tái)级的一个快速的增长,

王兴(xīng)兴:我个人的话,总体来说,对目前整(zhěng)个人形机器人应 用落(luò)地还是需要一些时间,但当(dāng)下,包括今年和明(míng)年对一些简单场景,像特斯拉场景(jǐng)里面把一(yī)个电池从什么地方装到什么地方里面,这种简(jiǎn)单的(de),用模仿学习能做的(de)事情,目前的AI技术其实成(chéng)功率还是做的比(bǐ)较高了,今年或(huò)明年可以(yǐ)做一些应用,包括把整个的(de)GPT速度也提升。

但是我(wǒ)觉得(dé),真正要提升人形机器 人大规模应用,确实还需要更多的时间,把机(jī)器人的模型本身做得更好一点,让(ràng)它更(gèng)通用(yòng),基本上无论是更精细化的或者更泛(fàn)用心的一些事情都可以(yǐ)做一起来 ,所以(yǐ)我还是希望(wàng)社会(huì)大众对AI和机器(qì)人能更多一些耐心。但(dàn)实际上(shàng)可能中国其实还是有很多(duō)人比较(jiào)心急的,我觉得还是大(dà)家可以再多给一(yī)点耐心。谢谢。

熊(xióng)友军(jūn):我觉得(dé)人形经济和大规模的应 用,其(qí)实上这个就涉及到一(yī)个商业化场景选择的(de)问题,实际上,并不(bù)是说现在人形机器人不(bù)能够应(yīng)用,而(ér)是说要再(zài)看什么(me)场景。我觉得在有一些刚需的场景,或者(zhě)对人不可达到的这种场景,还是有一些可(kě)以(yǐ)用的,尤其是这种刚性需求的,比如抢(qiǎng)险救灾,特种的(de)对核辐(fú)射(shè),或者是说有毒有害气体环境等(děng)等(děng),这些我觉得现在(zài)实 际上是(shì)可以用的。

大家其(qí)实想的更多(duō)是,技术怎么去提升,然(rán)后(hòu)怎么它能够让人形机(jī)器 人能够快速(sù)适应更多的场景,然后把(bǎ)成本快速的降下来,只(zhǐ)有这样通(tōng)过一方面通过技 术的提升,提高有更多工作效率,让人有更好的体验感,然后更多人愿意用它。

第二方面(miàn),就是把成本 继续往下(xià)降,我觉得让大家更买得起,这个(gè)我觉得要是(shì)要(yào)想的这个方式。

另外我觉得还(hái)有一(yī)种,就是(shì)商业模式上的探索(suǒ),实际上人形机器人是我觉得是一个集大(dà)成者,它基本上涵盖了机(jī)器人和人工智能的 绝(jué)大部(bù)分的技术领域,然后在人体技术(shù)上的研究能够大大的推(tuī)进这些技术的成熟(shú),然后技术(shù)甚至技术(shù)的市场化(huà),我们可以采(cǎi)用“沿途下蛋(dàn)”方式获得这个商业的利润。通过这(zhè)些其他的一些技术,人形机器(qì)人产品上孵化的其他(tā)技术商业化、产业化来推动人(rén)形机器人研究(jiū)。一个典型的例(lì)子,就是我们现在有一(yī)些人形机器人公(gōng)司(sī)已经在其他产品上实现盈(yíng)利,然后(hòu)已经(jīng)实现了一个很好的商业化,这我觉得是一种(zhǒng)非常好的模(mó)式。

问:作为(wèi)技术人员,我们是否意识(shí)到有很多机器(qì)人都有道德伦(lún)理方面(miàn)的顾虑——我们如何才(cái)能消除这些顾虑?

Marc:我认为,从最高层(céng)面来说,理解所有技术都涉(shè)及一些风险和机遇(yù)是很重(zhòng)要的。我参加了(le)一(yī)个政府会议,但我听到许多政府的人都在谈(tán)论监管人工智能,而压(yā)倒性(xìng)的感觉 是关注最糟糕的结果,对吗?

比如(rú)在欧洲,来(lái)自英(yīng)国(guó)一位(wèi)人士在发言,让我 印象深刻的是(shì),人们几乎(hū)陷入恐慌(huāng),担心最糟(zāo)糕的事情 会发生,并且不惜一切代价想(xiǎng)要阻止这种事情发生。但我认为,不利 用机会的风险与让坏事发生的风险一样大(dà)。

所以我认为,正如开发人员指出的那样,我们需要(yào)找到一种平衡,当我们撰写论文(wén)时,我们会在开头列出这些内容。这些(xiē)都是我们工作可(kě)能产生的巨大影响,但(dàn)我们(men)从不谈论我(wǒ)们的工作,可能产生的坏事是什么。

我们需要诚实(shí)和开放,更加公平地(dì)对待这个问题,但随后继续强调这种平(píng)衡,并(bìng)以某种方式(shì)防止我们错过机会,我认为由于公众的恐惧(jù),这种机会 很容易发生。

陈建宇:我觉得人(rén)们(men)对这个人形机(jī)器人、或者相应的具身智能机(jī)器人技术的担忧,其实核心来(lái)自于对自(zì)身安全性的一个担忧。

安全(quán)其(qí)实有几个不同的 层(céng)次,最底(dǐ)层的层次是(shì)物理的安全,大家担心机器人会不会在工作的时候去伤害到人(rén),那么这(zhè)是一个层次;当然其实(shí)在(zài)它分情况,那么比如说我们刚 才(cái)说的如果是工厂里面的话,其实(shí)如果我们把它跟人工(gōng)作环境隔开,其实一定(dìng)程(chéng)度上能(néng)解决(jué)这个问题;同时,我们也需要从我们的算 法硬(yìng)件等等上面(miàn)做的更(gèng)鲁棒来去(qù)优化这个问题。

那么第二个层次,其实也(yě)是生存上面的(de)问题,但是不是说物(wù)理层面(miàn)的,那(nà)么也是不(bù)是说全人类的一个(gè)担忧,而是说有一部分(fēn)人 一个担忧,他(tā)担(dān)心这个会替代咱们(men)的某一些工作,大家(jiā)会(huì)有(yǒu)担忧,我觉得这个事情可能需要政府或者商(shāng)号进行有一些引(yǐn)导,我们尽量的开始去做一些确(què)实(shí)劳动 力非常紧缺的(de)这样的一些波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”产业,比如说我们一些(xiē)非常恶劣环境工业环境,或者是比如说养老等。

当然第三(sān)个层面,如(rú)果未来我们的具(jù)身智 能机器人真正拥(yōng)有了(le)意(yì)识,那么这个会对人类的(de)自我存 在的价值可能产生一些担忧,我觉(jué)得这个事是更远的和更大(dà)的topic。

王兴兴:我觉得机器人的伦(lún)理 道德和安全性问题,是非(fēi)常重要的(de)一件事情(qíng),而且我觉得,要希望是在场所有的人都大(dà)家需(xū)要共同去(qù)维护(hù)的一件事情,就有点像(xiàng)现在新能源汽车(chē)以及无人驾驶,它其实还是(shì)有很(hěn)多安全(quán)性问题(tí),并且(qiě)比如说(shuō)有一辆早(zǎo)些年(nián)新能(néng)源(yuán)汽车起火了,或者有一家新能源汽车无人驾驶出了交通事故,这个对整个行(xíng)业(yè)影响是非常大的,会(huì)降低普通老百姓对技术行业的认可度以及信心。

这 个事情很(hěn)容易发生在人形(xíng)机器人和AI这个领域(yù)。所以我一直觉得(dé)。当下以及未来大(dà)家都(dōu)应(yīng)该在机器人安全性上,无论是出台一(yī)些规章政策,或者做一些更好的(de)引导,或者需要全世界政府出(chū)台一些 相关的政策,都(dōu)共同推动整个行业的健康发展。

王(wáng)鹤:所(suǒ)以我就从技术的角度,人形机器人它的一个面向终局的技术(shù)必然是大模(mó)型,那(nà)么其实只有大模型才可能(néng)实现(xiàn)非常高的(de)通用性(xìng),把很多能力全部汇集在(zài)一起,把很多模态,从视觉(jué)感知,到语言理解,到动作执行,那么融会贯通,那么今天(tiān)我们在技术(shù)上其实是(shì)有方法对(duì)大模型的行为进行限制,就是“对齐”,我们在大模型内部已经进行了深入研究,那么未来,我(wǒ)们(men)会对语言模型、多模态模(mó)型进行更深入的对齐,让它(tā)不会伤(shāng)害(hài)到我们的人类,并 且(qiě)他的技能会被局限在服务的范畴内,那(nà)么这一些(xiē)是我们技术上能做的,在技 术上之外,必然还需要(yào)政(zhèng)府(fǔ)社会和国际的合作(zuò)。

熊友军:我觉得前面(miàn)几位都说的都挺好的,我就补充一点,就是(shì)说我觉(jué)得应该是有一些(xiē)行业组织或者是政府出来,更多(duō)在法(fǎ)律(lǜ)法规这方(fāng)面(miàn)更多的立法,包 括更多的是(shì)做全社会 的机(jī)器人使用(yòng)、伦理道德方面(miàn)的一些(xiē)教育。因为我觉得,任何一个机器人也是(shì)一种工具,放在不同人(rén)的手 上(shàng),它的可能有(yǒu)不同的使用方法(fǎ),然后(hòu)只有加强教育,提升大家对(duì)人(rén)工智能对人 形机器人的使用,让(ràng)大(dà)家相对安全角度去考虑,我觉得才是一个正(zhèng)确(què)的方式。

问:您认为 5 年后(hòu)人形机器(qì)人(rén)行(xíng)业会发展到什么程(chéng)度?哪些经济领域将率先使用它们?

Marc:不(bù),我认为人形机器(qì)人的出现让事情变得(dé)复杂。我认为机器人在(zài)工业领域的应(yīng)用将取得很大进展。我认为机器人的应用非(fēi)常广泛(fàn)。人们对此(cǐ)非常关注。正如大家所说,使机器人(rén)变得(dé)越来越(yuè)好的技术确实(shí)正在日趋成熟。我认为工业将继(jì)续取得进步(bù)。

我认为(wèi)人形机器人(rén)本(běn)身总体上仍然非常(cháng)不成熟。所以我看不到它们。我知道你可(kě)以看看一些人形机器人公司与汽车(chē)公司合作的演示。我认为这在(zài)某种程(chéng)度上是一种(zhǒng)炫耀(yào),而不是一种生产力。我不知道这是不是题外话。如果你看(kàn)看仓(cāng)库机器(qì)人,你会发现最大的挑战(zhàn)之一是系统集成,特 别是如(rú)果它不是围绕(rào)机器人(rén)设计的全新仓库。

我(wǒ)认为许多仓库(kù)机器人供应商都在苦苦挣(zhēng)扎,因为他们需要一个系统集成商,而这个系统集成(chéng)商会消(xiāo)耗(hào)掉太多的预算,因(yīn)此很难赚钱,这是因为运营仓(cāng)库的 IT 人(rén)员并不想开放他(tā)们的系统。在那里工作的人并(bìng)不想改变他们现在做的一切。如果机器人可以处理每一项任务,那就意味着他们仍然需(xū)要(yào)一个人来完成任务。使用任何类型的(de)机器人对(duì)行业(yè)来说都具有很大 的复杂性。我认为这些都是重要因(yīn)素。

说实话,我原本(běn)以为 Spot 会取得更大的成功,但 Spot 的推出只是一次实验。我们之所以设计 Spot,是因(yīn)为它能够(gòu)让(ràng)你 连接自(zì)己的传感器,因(yīn)为我们(men)不知道人(rén)们想要什么样的传感器(qì)。我们之所以设计 Spot,是(shì)因为它能够让你对它进行编程,因为(wèi)我 们不(bù)知道现(xiàn)在的用户们都有哪些应用程序,而我们对它们的使用方式有(yǒu)了更多了解,开发人员正专注于巨大机遇,因此 Spot 对人(rén)们的接受度确实产生了影响。

也许如果我们没有足够的商人,能够提前进入并评(píng)估它是什么,我们实际上是在(zài)做一个实验。也(yě)许人(rén)形机器人会有更好的记录。

王鹤:我(wǒ)觉得我对人形机(jī)器人的发展总体是比较乐观的,那么在未 来5年,我们要完成真(zhēn)正的大规模应用,这件事情对于整个人形机器人(rén)仍(réng)然是一(yī)个先慢后快(kuài),其中慢的阶段,那么一个(gè)里程碑应该是——在(zài)5年的(de)时候我们能 达到万(wàn)台人(rén)形(xíng)机器人级别的应用(yòng)。

这样的一(yī)个市(shì)场大约是(shì)对标现在商业(yè)清洁(jié)机器人 。我们举个例子(zi),在超市在万达广场(chǎng)在写字(zì)楼一(yī)层,我们看(kàn)来回去洗地擦地的机器人,那么领先的这个市场,中国最领先的公司大约(yuē)是每年出货1万台,那么他做的事情不局限做这么(me)简单的事情,它能(néng)达到在各种场景,不管是(shì)商超还是写字楼,还是很多不同的(de)场景进行(xíng)清洁,但是(shì)当然是平面清洁。

那么,对于我们人形机器人(rén)来说,我们希望能做到一个立(lì)体操作,但 是它的能力可能(néng)是局限的,我搬运我就是上货(huò),我就是取货,对吧(ba)?

我没有更(gèng)多的能力,但是我也(yě)要实现跨(kuà)场景的(de)应用,可以在超市里、可以在工厂里、可 以在服务场景等等。那么(me)能达到5年1万台的市场 规(guī)模的话,我相信后面有真 实世界数据的(de)回流,那(nà)时,我们会看到人形机器人应(yīng)用规(guī)模会加(jiā)快,从慢时代进入快(kuài)时代。

熊友军:人(rén)形机器人我对它的(de)应用(yòng)可能会更加乐(lè)观一点,其(qí)实大家 看到这两(liǎng)年人形机(jī)器人的进步(bù)非常快,尤其在AI驱动下面(miàn),实(shí)际上在市场应用方(fāng)面,你们已经可以看到国 的有一(yī)些企业,包括全球企业已经开始在(zài)一些场景里面做试点应(yīng)用了。

比如(rú)说在汽车厂,比如在一些商用服务场景,已(yǐ)经开始做试点,随着这个试点数据 会形(xíng)成(chéng)一个飞轮的效(xiào)应,所以(yǐ)试点进展,然后它(tā)会有更多的迭代,然后有(yǒu)更多数据驱动,机器人会在在一些特定的环(huán)境里面(miàn)提高效率,它的速度,它的(de)随着量的增长,它的价格(gé)会大幅的降低(dī),这样我觉得会更快的去促进产业(yè)的应用。

我(wǒ)觉得今年年底,大家应该可以看到,有一部分的公司已经能(néng)够在一些(xiē)比如 说新能(néng)源汽车厂,比如说(shuō)在一些特种领域已经开(kāi)始应用,明年我觉得(dé)应该可以看到一些可能千台左右量级的出货。

问:你能在我们的年轻观众中(zhōng)“点燃一把火”,让(ràng)他们也想成为“机器人专家”吗?他们应该 怎么做?

Marc:我认为伊隆·马斯克本人凭借他的雄心和资源(yuán),可能(néng)在几年内(nèi)推出10000个机器人,不一定是因为它们(men)会直接(jiē)让机器人赚(zhuàn)钱,但看看他对电(diàn)动汽(qì)车所做(zuò)的一切。他们从无人相信到现在,我比这里的任(rèn)何人都更加怀疑,包括我(wǒ)在内,到 每家汽车公司都有淘汰(tài)内燃机的计划(huà)。

我认(rèn)为这是一件了(le)不起的事情。他似乎对此很认真。所以这在整(zhěng)个(gè)人形机器人 领域都是(shì)一个真正不确(què)定性(xìng)的因素。我不确定如果他没有抓住机(jī)会,是否会(huì)有这么(me)多人形机(jī)器人。

我(wǒ)认(rèn)为(wèi)机器人玩得越有趣,人们就越能与它们互动。我到处(chù)走走,我没有带机器人来这里(lǐ),但这里有很多(duō)机器人,但我到处发表演讲,发现机器人在计划中(zhōng)相当无聊。你总是能吸(xī)引一群人,只要你愿意让他们与机(jī)器人互动,他(tā)们就会留下来。我认为我们做得越多,公众(zhòng)就会(huì)越热情(qíng)。我非常欣慰,参加这次活动最(zuì)令(lìng)人兴奋的事情可能是有很多(duō)人说你做(zuò)的工作是我十(shí)几岁时见过的,现在我正在做。我(wǒ)们越能展示我们(men)的工作并激励下一代,这就会实现。

陈建宇:我的一个(gè)建(jiàn)议是,因为机(jī)会其实永远是留(liú)给有准备(bèi)的人,那么(me)像Maec做这个事情做(zuò)了做了好几十(shí)年,然后包括我们其实台上我们几位也都是多(duō)年(nián)深耕在机器人或者相(xiāng)关领域(yù),所以说,因为人形机器(qì)人它其实也是一(yī)个非常长周期的事(shì)情(qíng),同时(shí)它也包(bāo)罗万象,从技术上的(de)软件、硬件、AI再(zài)到商业(yè)、产品等等,其实各方面都有,所以说大家应该去问一问自己的内心在这一步范围内(nèi)到底自己最有激情,最喜欢的最热爱的是什么?然后从(cóng)此(cǐ)刻开始就去(qù)积(jī)累它。最后,要么等待未来,要么总有时刻你有施展自己的机(jī)会。

王兴兴(xīng):对于我觉得对于所有年(nián)轻(qīng)人,包(bāo)括(kuò)我(wǒ)们其实这(zhè)个时(shí)代都(dōu)是非常精彩的,而且想象一下,大家也知道AI、机(jī)器人都是阶梯性发展(zhǎn),就(jiù)像GPT没有出来之前,大家觉得语言模型没(méi)什么用,基本上是非常差(chà),但突然就是发生了巨大进步,非常好,其实机器人、AI也会遵循这种规律,所以大家现(xiàn)在(zài)可能看到机器人的 AI 能力都比较弱,但实际上这是好事,为什么(me)?因为大家都有机会去(qù)做的更好(hǎo),可以真正的把这种人类目前可以预估的(de)最伟大技术(shù),就在当下,就在未来几年,所以这(zhè)个(gè)事情都是非常值得做的,

而(ér)且(qiě),在(zài)机器人和 AI 另外一个比较适合(hé)年轻的点(diǎn),它(tā)没有那么多历史包袱,不像数学 领域,有几百上千年(nián)的非常天才的数学家(jiā),你一定 要比他们做得好,你才(cái)可以做技术,但(dàn)是当下,AI 和机器人它都非常(cháng)年轻,尤其 AI 技术就最近(jìn)几年的东西,所以非常(cháng)适合年轻人。我一直感觉在如果在未来(lái)5年到10年或者几十年回看我们现在这个(gè)时代(dài),所 以想想这种感觉,真的非常激动人心。

王鹤:我觉得其(qí)实未来的(de)15年,在(zài)我(wǒ)心目(mù)中会是人形机器人,从当下在产业中没有规(guī)模化应用,到可能成长到跟今天汽车的产(chǎn)量一个万(wàn)亿市场(chǎng)的过程。那么在这个过程中,其实对年(nián)轻人(rén)来说,那(nà)么我觉得(dé)大家就是做好自己就可(kě)以了,因为15年之后很多工(gōng)作都是(shì)跟(gēn)人形机器人相关的,今天可能你(nǐ)负责卖车,那么15年后(hòu),你可能岗位(wèi)就调到卖人形机(jī)器人(rén)对吧?今天你是班级里头的佼(jiǎo)佼者,那(nà)么你学(xué) AI ,那么你可能发(fā)现你的职业生涯就是围绕着(zhe)进一步提升人形机器人的能力展开的,所以大家做好自己(jǐ),我们一起共享光明、人形机器(qì)人的未来。

熊友(yǒu)军:其实我是(shì)经历过个人电(diàn)脑时代,我经历智(zhì)能手机时代,我经历过移动互联网的时代(dài),现在其(qí)实我们正在经历智能汽车的时代,电动汽(qì)车的时代(dài),我觉得(dé)下一个 时代(dài)实际上就 是聚生智能的时代,而聚生智能(néng)时代的典型代表其实就是人性机器人,所以我给 现 在(zài)的(de)年轻人建议就是说保持野心,怀揣大梦想(xiǎng)。

问:让我们在小组成员之间(jiān)花几分钟时间讨论一下:你们想要互相问什么(me)问(wèn)题?

陈建宇:所以我想问Marc,你认为对于机器(qì)人 和人工智能来(lái)说(shuō)最重要的(de)研究问题是什(shén)么,例如,如果(guǒ)你只(zhǐ)能选择一个研究项目,那么你选择哪一个?

Marc:让我从侧面回答一下,这 也是一(yī)种回避你的 问(wèn)题的方式。最(zuì)后我没有 展示我的最后一张幻(huàn)灯片。我(wǒ)的最后一张幻灯(dēng)片是一个展示机器人故障的视频。它展示了,我不知道它大概有 2 分钟长,可能有 25 种不同的故障。我认为故障是工作中最(zuì)有趣、最有意思、最有用的部分,关(guān)注它(tā)们,然后在你的工作不工(gōng)作的 时(shí)候继续前进,这真的很重要。这不是研究的主题,但(dàn)它是一(yī)种工作精神。所(suǒ)以如果我要问你们所有人这个问题的话,那就是(shì)我还没看(kàn)到任(rèn)何(hé)人在演讲中提到过事情无法正(zhèng)常运转,而(ér)且我敢肯定,单一机器人不会在不发生碰撞的情况下完成那些后空翻以及它(tā)们所做的 所 有很酷的事情。你喜欢碰撞吗?

王兴兴:Marc先生,很荣幸今(jīn)天(tiān)见到您(nín),我其实想有好(hǎo)奇(qí)想(xiǎng)问一下,您觉得对于人形机器人(rén)的手,您觉得未来(lái)几年(nián)比较合适的有几个手(shǒu)指,或(huò)者几个电(diàn)机,这会是比较(jiào)好的(de)一 个方向?

Marc:再次,我要回答一个(gè)略有不同的问(wèn)题。我们研究 所最近举办了一场研讨会,名为“对操纵的反向观点”。我(wǒ)认为灵巧性 确实很重(zhòng)要,但基本上(shàng)它并没有取得很大进展,尽管人(rén)们(men)至少已经 为此努力了(le) 50 年。我(wǒ)认为我们必(bì)须以不同的方式思考,再次(cì)尝(cháng)试不同的东西(xī),就像我今天在演讲中开始的那(nà)样,也许我(wǒ)们需要 更(gèng)多的(de)动态操(cāo)纵,而不(bù)是所有(yǒu)的静态抓握。我认为(wèi)很多学习界的人在提出他们正在 学习的灵巧性的要求时对自己要求(qiú)不够。他们(men)做的事情很简单,很(hěn)容易。

我认为那里是有机会的,有(yǒu)多少只(zhǐ)手我不知道有多少根手指。我认为(wèi)五个已经很(hěn)多了。但也许有一天我会觉(jué)得更有(yǒu)趣的(de)问题是手掌怎么样?我们的手掌功(gōng)能非常强(qiáng)大,它们不仅(jǐn)仅是静态的块。而且你看到的(de)几乎(hū)每个机器人手都有许多手(shǒu)指在做这件事(shì),但仅此(cǐ)而已。

王鹤:之前我提到过,大概 15 年后,世界上会有数百万、一千万(wàn)个人形机器人(rén)。如果 人形机(jī)器人具有通用目的,那么人形(xíng)机器人是终极体现(xiàn),那么这种通用目的的终极技术是什么?对于人类噪 音(yīn),您是(shì)否认为视觉、语言、动(dòng)作模型,这些端到端模型是人类噪(zào)音的终极技术或方法?

Marc:我(wǒ)很难相信,端到端是取得(dé)进步的方法。也许最终在(zài)渐近(jìn)线(xiàn)上端到端(duān)是正确(què)的方(fāng)法,但我认为我们知(zhī)道的太多了。

说实话,我认(rèn)为人们过分(fēn)看重(机器)学习。我知道(dào)应该对学(xué)习持乐观态度,但如果你看看当今存在的解决方案,你会(huì)发现最好(hǎo)的(de)解决方(fāng)案中学习所起的作用微不(bù)足道或微不足道。当然,在(zài)波士顿动力公司,今天学习很少,尽管人们正在努(nǔ)力。我认为控(kòng)制系(xì)统、控制理论、观察(chá)器 ,这(zhè)些在过去 20 或 30 年(nián)建立起来的(de)东西仍然发(fā)挥(huī)着巨(jù)大的作(zuò)用。

我(wǒ)不想就 这样把(bǎ)它抛弃。我希望我们能真正拥抱学(xué)习,但要把它与我们已经知道的东西结合起来,找到一种方法把它们结(jié)合起来,至少在接下来的5年或(huò)10年里,也许在渐近(jìn)线上,情况会有所不同。

熊友军:我的一个问题是,Marc作(zuò)为波士顿动力的创始人,您之前开发(fā)了像Atlas这样的非常(cháng)令人惊奇的这种产品,但是我们前不久我们看到波士顿动力(lì)终止了(le)这个(gè)机器的研发,然后由原来的(de)液压驱动,转向纯电驱动(dòng)的这种方式。对这方面是出于什么样的考虑?是(shì)因为成本的考虑(lǜ),还(hái)是因为出于商业化的考虑?同时我(wǒ)还想知道(dào),波(bō)士顿(dùn)动(dòng)力未来5年的一些这种(zhǒng)计划,对商业化的一些计(jì)划。

Marc:我认为,如果(guǒ)你(nǐ)问为什么要进行转(zhuǎn)变,我认为有两个(gè)关(guān)键因素 :一个(gè)是(shì)液(yè)压机器人,我(wǒ)喜欢(huān)液压技术,我会用液压技术(shù)制造很多机器人。我认为,建造人形机器人或(huò)类似人形机器人仍有 空间,它们将继续使用液压技术,因为(wèi)重量和强度等因素(sù)。

但我认为有两点。一是它们很麻烦,至少对于像 Atlas 这样的高性能机器人来说,尽 管我们付出(chū)了无尽的努力,也永远无法让它们(men)完全不漏油。当你把石油机器人放到工厂和家里时,它们就不能滴油;同时,很难找到精通液压技(jì)术的(de)人(rén),因为(wèi)人们认为这(zhè)是非常古老的(de)东西,尽管 Atlas 在液压工作(zuò)原理方面有(yǒu)很多创新,从服务器阀(fá)门到(dào) HPU 液压动力装置,一直都是(shì)如此,确实(shí)有创新的东西在进行 ;最(zuì)后,我认(rèn)为(wèi)电动汽车在规模上已经足够强(qiáng)大,它们可以参与竞争。我不想代表波士顿动力发言,尽管我是(shì)创(chuàng)始人之一,并且仍然(rán)是董事会成员,但我认为他们必须(xū)有自己的计划,说明(míng)未(wèi)来的计划 以及技术的所(suǒ)有细节。我想随着事情的发展,你会(huì)发现更多这方面的内(nèi)容。

主持人:非常感(gǎn)谢。我想观众肯定会有更多(duō)问题,也许吧,但我们的时间真(zhēn)的不(bù)多了。所以非常(cháng)感谢(xiè)各位小组成员。非常感(gǎn)谢观众 的到来(lái)和聆听。我认为这是(shì)一场非常精彩的(de)会(huì)议,尤其是小组讨(tǎo)论。我对组织者的建(jiàn)议是,我们 明(míng)年再举办一次(cì)类似的会议,然后我们可以回顾进展和未(wèi)来的步骤。

未经允许不得转载:橘子百科-橘子都知道 波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

评论

5+2=