橘子百科-橘子都知道橘子百科-橘子都知道

波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

8月24日下午,2024世界机器人 大会 上,举行了一(yī)场期待(dài)已久的 中国、美国“具身智能”与人形机器人领(lǐng)域(yù)学者(zhě)的“世界对谈”。

大名鼎鼎的“机器狗(gǒu)之(zhī)父”、美国(guó)波士顿动力创始人(rén)Marc Raibert(马(mǎ)克·雷伯特)首次来到北京。他说,“我简直不敢相(xiāng)信,不(bù)仅是机器(qì)人(rén)的数量,难以置信(xìn),还有这么多热情的人参加了(le)展(zhǎn)览。中国对机器人的兴奋和热情很高。”

而此次与Marc对谈的四位CEO所在的公司也不寻常(cháng):除了宇(yǔ)树科(kē)技之外,星动纪元、银河通用、北京具身智(zhì)能机器(qì)人创新中心都成立不(bù)足(zú)2年,一(yī)出道就是(shì)具身智能和人形机器人(rén)行业的(de)“顶流”。

而且,星动纪元、银(yín)河通用背后(hòu)也站着中国最高(gāo)学府:北大和 清华,代表着(zhe)中国前沿(yán)科技(jì)创新的重要来源。

其中,星动纪元由姚(yáo)期智(zhì)带(dài)领的清华大学交叉信息研究院孵化成立的,星动纪元创始人陈建(jiàn)宇现在(zài)还(hái)是清华大学交叉(chā)信息研究院(yuàn)助理教授,公司融资超亿元,联想创投已加入其(qí)中。

银河通用机器人创始人的王鹤则是北京大学助理教授,也(yě)是 北京智源人工智能研(yán)究院具(jù)身智能研 究中心主任,过去半年,银河通用完成(chéng)天使轮融资(zī)共计7亿元人民币,刷新(xīn)了国内人(rén)形机器(qì)人领域单轮融资规模,美团战投、北汽产投、商汤国香基金、讯 飞基金、启明(míng)创投、蓝驰创投、经纬创(chuàng)投(tóu)、源码(mǎ)资本、IDG资本等头部财务机(jī)构都参与其中。

而北京(jīng)具身智能机(jī)器人创新中心则(zé)是北京市发起成立的机(jī)器(qì)人“国家队”机构。北京具(jù)身智(zhì)能机器人创新中心总经理熊友军,目前(qián)还是“人形 机器人第一股”优必选科技CTO。

Unitree Robotics(宇树科技)也是当下人形机(jī)器人行(xíng)业的明星(xīng)企业。公司创始(shǐ)人、CEO、CTO王兴(xīng)兴毕业于上海大学,取得了机械工(gōng)程硕士,具有近10多(duō)年足(zú)式机(jī)器人研发经(jīng)验,拥有产品从0-1-100的研发与商业化落(luò)地能力,100+项机器人相关专利(lì)。

此次圆桌由(yóu)德国(guó)慕尼黑工业大学 教授 Alois.C.Knoll主持 ,美(měi)国波士顿动(dòng)力创始人Marc Raibert(马克·雷伯(bó)特),与中国四大AI机器人(rén)企业(yè)领军者——陈建宇、王兴兴、王鹤(hè)、熊友军,五人(rén)围绕(rào)机器(qì)人行业(yè)、AI 大模型驱动机器人(rén)发展等议题展开(kāi)讨论。

一个 多小(xiǎo)时的圆桌当中,Marc表示,未来5年,机器人硬件发展仍将非常重要,但同(tóng)时 ,能够(gòu)打破语义理解障碍的基础模型或其(qí)他 AI 方法也将对机器(qì)人(rén)技术产生更大的影响。不过,要想取得机器人领域真正的进步(bù),就(jiù)需要更高的可靠性和安全性,未来人(rén)们需要投入大量资(zī)源努力解(jiě)决此类问题(tí)。

Marc非常(cháng)不看好人形机器人行业。他认为,工业机器人(rén)已经非(fēi)常(cháng)成熟,而且(qiě)能够商业化,目前人形机器人“在某种程度上是一种炫耀 ,而不是(shì)一种生产力”。

陈建宇表示,过去10年AI发展很快,从(cóng)简单的图(tú)像处理(lǐ),到深度学习、强化学习,再到ChatGPT技(jì)术,这对于未来(lái)“具(jù)身智能”产生很大的影响。未来几年,AI、具身智能会与人形机器人不断融合,去训练一个通用模(mó)型。他(tā)相信(xìn)未来5年,我们将迎来“机器(qì)人的ChatGPT时(shí)刻”。

王鹤指(zhǐ)出,当前 AI 大模型在机器人上仍有巨大(dà)的局限,尤其是“泛(fàn)化的开瓶盖(gài)”技能还没有训练出来,但同时,这也是大模型带来了重要机会,一旦大模(mó)型(xíng)涌现能力不断加强,他认为未来5年,依然有一个至少做操作任务的通用(yòng)机 器人机会(huì)。

熊友(yǒu)军表示,当前关(guān)节性能提升、高的能(néng)量和电池密度(dù)的提升非常快,使 得(dé)机器(qì)人的运动控制能力、电机等方面提升非常快。未来5年,机器人关节和能量密(mì)度会(huì)持(chí)续提升。毕竟和人类相(xiāng)比,现在机器人的能(néng)量(liàng)执行效率还是有(yǒu)非常大的差距。

以下是钛(tài)媒体AGI编辑对此次圆桌全(quán)文整理:

问:您能否向观众简单(dān)介绍 一下您的工(gōng)作 :您(nín)为什么以 及(jí)什么时候开(kāi)始对人形机(jī)器人感兴趣的(de)?

Alois:我从 2001 年(nián)开始担任慕尼(ní)黑大学的教授。我对人类噪音(yīn)的一个方面产(chǎn)生(shēng)了兴(xīng)趣,那就是具(jù)象(xiàng)化,对(duì)吧?我的 朋友(yǒu) Pfeiffer 和我们一起从大学(xué)毕业 。苏黎世退休了,不幸的是,我 们坚信具象化。所以我们认为,在我们(men)的人(rén)类类型中,智力只会在以非常自然的方式与世界相连的人类类 型身体中发展(zhǎn)。所以(yǐ)身体应该(gāi)有同样的动力,同样的尺寸,等等。否则,就很(hěn)难做到这一点,你在这(zhè)里看到的 Kronos 系列机器人,左边,左下角的 Roll Boy2024 就是这种信念(niàn)的结果之一。

Marc:我认为你贴出的那张图片对(duì)我回答这个问题很有帮助。如果人形机器人意味着两只胳(gē)膊、两条(tiáo)腿直立向前,那么直到最近我(wǒ)才对此感兴趣(qù)。事实上,我一直认为现在的公(gōng)司注重功能性,作为一名教授,我认为功能性才是最重要的,机动性、灵(líng)巧(qiǎo)性、感知力和智能,而外形(xíng)和外观则是(shì)次要(yào)的(de)。另一方(fāng)面,如果人形机器人意味着像腿一样的动态生命,我会把它与世界互动。我一直是人形机器人的粉丝,尽管我建造的第一个机器人是弹簧单(dān)高跷的东西。我认为人形机器人的许多基本要素都在那些弹簧单高跷的东西中。确实,当我(wǒ)们开始建造机器人时,波士顿动力(lì)公司(sī)是直立的,有 两条腿,两只(zhǐ)胳膊。有(yǒu)时领先。如果你看看公众的反应,你会发(fā)现 YouTube 点击量增加了 10 倍,我非常关注这些点击量或评(píng)论,或者只是(shì)人们的态度。人(rén)们非常感(gǎn)兴趣。普通的非科(kē)学家,比如(rú)说,非工程师,他们对人形 机器人很感兴趣,而狗惹恼机器(qì)人却得不到同样的赞誉。

熊友(yǒu)军:我是(shì)从读博士的时候,2000年开始做机器(qì)人的研发,当时读博士的时候,那时候更多的是做工(gōng)业领域、特种领域的一些(xiē)机器人,用在一些危险(xiǎn)的环境里面,因(yīn)为(wèi)那(nà)时候机器人技(jì)术还是非(fēi)常(cháng)不成熟,但在很多特种领域(yù)和(hé)危险场景里面,是需要用机(jī)器人去完(wán)成工作了,然而(ér)那时候机器智能(néng)实际上(shàng)是(shì)很差的。所以我们当时想的办法,是(shì)将机器人的智能(néng)跟人的智(zhì)能结合起来(lái),所以做了(le)一些机(jī)器人要操作(zuò)的一些事(shì)情。

但在(zài)遥控操作完成这些(xiē)工作的过(guò)程中,我们发现有很多的场景,实际上用轮(lún)式的工业(yè)机械手臂是解决不了的,尤其是有时候在一些特种(zhǒng)场景环(huán)境比(bǐ)较狭小(xiǎo),然后环(huán)境比较复杂的轮式,然后履带式实际上根本就进不去,但是人是可以进去。还有一种,是要 试(shì)用很多工具去完成(chéng)那些工作。

所以当时我们就觉得,如果说有微(wēi)型机器人的话(huà),实际上应该是能够提供很好的解决工具,或(huò)者(zhě)一 种解决方 案,但是我(wǒ)们当时那时候也看到了日本本田ASIMO,给我们提(tí)供了很多的一些启(qǐ)发,所以那时候我就对(duì)人形(xíng)机器人(rén)非常感兴趣。后面(miàn)毕业之后,一直在做(zuò)机器人相关的工作,

2012年,我跟优必选科技CEO周剑先生创立了公司,做人形机(jī)器(qì)人(rén)研发工作,去(qù)年(nián)从深(shēn)圳到北京开始(shǐ)筹建具身智能(néng)机(jī)器人创新中心,现在也是一直在(zài)聚焦人形机器人方面的研发,主要的想法是(shì)希望(wàng)说能够解决(jué)人形机(jī)器(qì)人方面的一些共性、关键的技(jì)术问题,比如(rú)本体的一(yī)些基础研发不足,其实我们现在微(wēi)型机器人在(zài)本体在关键(jiàn)的核心器件,然后在一些传(chuán)感器方面其实上有非常多要攻克的地方。另外在运动控制,实际(jì)上我们也做了非常多的运动(dòng)控制的(de)技术研(yán)发,采用(yòng)深度学习(xí)强化学习的这种运动控制的方 式,包括现在(zài)也用一些融神(shén)经网络的一些方式用(yòng)去做运 动控 制,同(tóng)时其实我们现在还在做(zuò)关于智能方面的一些研发,比如说把用现(xiàn)在具身(shēn)智(zhì)能的方式,做一 些基础性工作,比如建它 的数据集,研(yán)发(fā)机器人大模型框架等。所以这就是现在我(wǒ)在做(zuò)的(de)一些事情。

陈建宇:其实这个兴趣是很小的时候,就一直对智能机器人(rén)非常(cháng)感兴(xīng)趣,我印 象很深刻 ,刚刚兴兴(xīng)说她10岁的时候,我估计也(yě)是差不多类似的(de)时间(jiān),不过当时看的不是波士顿动 力,当时关注的是ASIMO系列机(jī)器人,当时我就非(fēi)常的去着迷。然后我觉得,创业这件事(shì)其实是充满了挑战性的,marc创办了波(bō)士(shì)顿动力做了40多年,其实我是(shì)非常尊敬的,就是说(shuō)你没(méi)有一个发自 内心的、天生热爱的话(huà),其实很难(nán)去坚持下来的(de)。所以对我来说(shuō),对这类机器人的(de)热爱,我觉得某种程度上是从小就(jiù)具备就拥有的。

那么真正开始做机器人(rén)其实是本科的时候。当时(shí)在学校里面(miàn),我(wǒ)就接触真正意(yì)义上的机器人的研究,当时接触了双足机(jī)器人,主要是(shì)做的就(jiù)是捕获点(diǎn)步态规划相关的研究(jiū)。后来,博士阶段继续做机(jī)器(qì)人,虽然不是(shì)人形机器(qì)人,但是也(yě)是相关(guān)的一些机器人的领域(yù),控制它的学习,包括无人车和机械臂。而真正的去全力做人形机器人,是在我(wǒ)回国之后,然后在现(xiàn)在清华正式(shì)投(tóu)入去做人形机器人,还孵化了星动纪元公司,如今我们(men)已(yǐ)经做了最新一(yī)代、第六代机器人了,然后我们也在展会上面带来了我们机器人(rén)的(de)实物,欢迎大家去(qù)关注(zhù)。

王兴兴(xīng):大家好(hǎo),我是宇树(shù)科 技(jì)创 始人王兴兴,刚才有提到我大概可能10岁的时候就看过marc先生在MIT实验室做的双足,还有单条腿 的(de)机器人(rén),然(rán)后印象非常深,在(zài)09年(nián)、10年的时候(hòu),大概大一寒假,我就做过一个小的人(rén)形机器人,然后当时做(zuò)的不是(shì)特别满意,然后后来的话,就(jiù)在研 究生期间做了XDog这款(kuǎn)机器人,差不多在13年到15 16年(nián),这款机器人(rén)的话又采用了比较低成本的硬件,然后运动性能非(fēi)常好(hǎo),可以直接实现关节的力 控(kòng)以及整机的力控。

后来的话,一开始我对(duì)人体机器人的(de)技术还(hái)是跟相对来说比较(jiào)悲观的(de),但是后(hòu)来(lái)的话(huà)在2022年左右,整个的机器(qì)人、AI技 术的进步,然后(hòu)再加上ChatGPT出来以后,大家都看到(dào)人形机器(qì)人和AI结合的可能(néng)性,所以说我们公(gōng)司又重新开始做(zuò)人形机器人。说实在的,其实我真正感兴趣的并不是说人 形机器人,而是新(xīn)的一个智能体机器(qì)人的形态。而人(rén)形机器人可能只是说(shuō)目前大(dà)家比较公认的、一个最有可能 性的通用机(jī)器人和通用AI的结合体,但是这可能并不是个唯一的,我真正(zhèng)希(xī)望能诞生甚(shèn)至更比人更高级的一个智能体形(xíng)态,可以大大推动整个人类工业(yè)的 变革,推动新(xīn)的工业革命。

王(wáng)鹤:我是北京(jīng)大学计算机学院助(zhù)理教授,也是北大(dà)银河通用具身智(zhì)能联(lián)合实(shí)验室的主任(rèn)王鹤,那么,我跟人形机器人、具(jù)身智能结缘,主要是(shì)从我在斯坦福大学开始读博的时(shí)候。那么2016年(nián)的时候,当时深度学习技术已经出来了,也应用在(zài)很(hěn)多图(tú)像识 别分类这些任务当中。那么(me)当时作为(wèi)一个(gè)前沿研究,我们试图去理(lǐ)解人类是(shì)如何(hé)把感知思(sī)考(kǎo)还(hái)有交互的能力融合在一起的。

所(suǒ)以我博士期间的第(dì)一个 工作,就用一个视觉模型来看桌面上人的动作和(hé)物体的一个(gè)运动,然后推理(lǐ)人下一步想要什么,这是(shì)一个语言模型。

最后再用一个简单的机器人,智能(néng)的马克杯去响应人的动作,那么这个工作获(huò)得了(le)欧洲图形学(xué)的最佳论文提名,但是我们(men)认(rèn)为它非(fēi)常(cháng)的不足,就是我们的一个马克(kè)杯只能在桌面(miàn)上移动响应(yīng)人的动作(zuò),它没(méi)有跟人交互的能力,我们的(de)视觉(jué)只能看有限的几一种物体,那(nà)么我们的语言模型只能根据这(zhè)个人(rén)跟(gēn)这些桌面东西(xī)的(de)一(yī)些动作来做简单(dān)的推理。

那么通过过去8年我(wǒ)们的研究,在怎么样把(bǎ)机器人的操作能力搞得更泛化,什么东西都能抓,都能够放置,那么还有跟(gēn)现在的多模态大模型技(jì)术结合,真(zhēn)的明白人类想(xiǎng)让你干什么,那么言出法随的去执行所以去年我 们(men)就(jiù)孵化(huà)了北(běi)京银(yín)河通用这家人(rén)形机器人公司,我们现在也是把视觉(jué)、语言、动作(zuò)这三种不同的(de)模(mó)态融合到大模型当中,真正的赋能(néng)人形机器人,让(ràng)人形机器(qì)人能够走进千行百业(yè)、千家万户(hù),这是我们的愿景。

问:你认为(wèi),我们今天(tiān)拥有(yǒu)的哪些重要 技术是 10 年前没有的,但对于实用的人形机器(qì)人来说却至(zhì)关重(zhòng)要?它们在未来 5 年将如(rú)何发展?

Marc:我认为硬件开发仍将非常重要。如果我们谈论未来 5 年,毫无疑问 ,能够打破语(yǔ)义理解(jiě)障碍(ài)的基(jī)础模型或其他人工智能方法将产生最大的影响。

我认为,人类可以做(zuò)的就是,概括和理解(jiě)他们所看到事物的含义,而(ér)目前还无法真正捕捉(zhuō)到这些(xiē)含义。我相 信,如果人工智能能够(gòu)在这方面取得 进展,我认为它将产(chǎn)生(shēng)巨大的影(yǐng)响。

实(shí)际上,过(guò)去十年来,每个人都在计算机、传感器、感(gǎn)知、控制等方面取得了巨大进步。电池,我(wǒ)认为人们忘记(jì)了电池。虽(suī)然电池是工业时代的(de)产物,但是它们确(què)实非常重(zhòng)要(yào)。是的,所以在电机(jī)方面过去(qù) 5 年里,人们做得很好,我认为电(diàn)机已经取(qǔ)得了 长足的进步,当然,我们(men)将看到更(gèng)多(duō)。

陈建宇:我从AI的视(shì)角来讲一讲,觉得非常大的(de)一个不同。如果按照10年 前的话,其实是2014年左右,当时(shí)是(shì)DeepLearning刚刚出(chū)来不久,它其实解决(jué)了很(hěn)大一部分,比如图像处理等等一些问题。

那么后面,其实(shí)有我认为两(liǎng)个最重要的里程(chéng)碑:一个是以16年阿尔法狗(gǒu)为代表(biǎo)的深度(dù)学习,紧接着把(bǎ)它用在了强化学习上面,做深度强(qiáng)化学习,解决(jué)了一些问题;第二个是以ChatGPT为代(dài)表的大语言模型(xíng),所以(yǐ)这点我认为是过去10年没有的,但又对未来我(wǒ)们人形机器人,或者是具身智能起到非(fēi)常大的(de)决定性作用的两个(gè)因(yīn)素。

那么可能在接下来的这几年时间(jiān),这两项技术会非常深度的跟人形机器(qì)人、具(jù)身(shēn)智(zhì)能融合(hé)起来,但(dàn)他们也分别需要(yào)经过一定程度的训练,从而(ér)能训练比 较通用的(de)一(yī)个模(mó)型(xíng),那么我们(men)也能解决更加丰富的物理(lǐ)世界的(de)数据程序。那么我相(xiāng)信,在接下来的(de)5年,这几项技术都能 起到非常(cháng)大的一(yī)个进展(zhǎn),我们可能会在(zài)5年内迎来(lái)“机器人的ChatGPT时刻”。

王兴兴(xīng):对过去10年最大(dà)的,还是(shì)AI技术带来的各种事情有更(gèng)多 的信心。我觉得除了(le) AI技(jì)术本身(shēn)最大的点,对于人形机器人,对于(yú)整(zhěng)个社(shè)会共识的增加也是非常关键的,就是(shì)目前大家更加相信AI,更加相信人形机器人(rén)可以诞生(shēng)更多价(jià)值,这在10年(nián)前是完全不能(néng)想象的,那(nà)时(shí)整个社会基本上对此都完全没有信心(xīn)。

另外一点的话,我(wǒ)觉(jué)得在未来5年,总体(tǐ)上是肯定整个(gè) AI 机器人、AI模型变化会非常快,因为目前的AI真(zhēn)的是日新月异,大家可以(yǐ)用AI集成技(jì)术,去搭建(jiàn)各种自(zì)己的(de)模型去做训练,这整个已(yǐ)经变成一个(gè)非常的扁平化,以及容(róng)易操作的过程,其实很多人(rén)大家都(dōu)可(kě)以(yǐ)参与进来,去做机器人(rén)模型(xíng)并且去做训(xùn)练,所以我觉得。未来5年这块的各种AI模型创(chuàng)新,包(bāo)括更新的一些神经网络模型,包括脉冲神经网络等都(dōu)有(yǒu)很大的(de)一些机(jī)会(huì)。

王鹤(hè):我觉得 10年好快,10年前是2014年,其实我(wǒ)们已经看 到inbody的AI,甚至(zhì)不是一个在西方(fāng)的学术界比(bǐ)较popular的词汇(huì),那么(me)过去(qù)的十年,我觉得一大技术的进(jìn)展,就(jiù)是(shì)我们在(zài)具(jù)身智能里头已经有一些技能实(shí)现了非常强的泛化性。

那么 以(yǐ)我个人的 研究举例(lì),在抓取问题上,我们取得了比较长足的进步,那么我们从只(zhǐ)能抓方块圆的这些(xiē)特定形状的物体,到(dào)基于三(sān)维视觉(jué)传感器,我(wǒ)们可以抓不透(tòu)明、不反(fǎn)光,也 就是在深度(dù)传感器里头能完美成像的这(zhè)些物体,到我们最近的技(jì)术能够预测透明、高反光、金属、吸光这些非常有挑战材质的物体(tǐ),基于它去做泛化抓(zhuā)取操作(zuò)。

那么在今天的展厅,我们都接受观众给我们的各种形状,各种材质随(suí)便堆叠乱七八糟的物体,我们的机器人都展示了非(fēi)常泛(fàn)化和高(gāo)成功率的(de)抓取能力,那么现在的问题是,像这样的每(měi)一(yī)个技(jì)能,大家都在分分别的(de)去做(zuò)开 发,那么很多人会 提问你能帮我 抓水(shuǐ)瓶,你能(néng)不能帮我把瓶盖给拧开?我非常不好意思的(de)说,现在泛化的开瓶盖技能我们还没有训练出(chū)来,这(zhè)个就是大模型能够带给我们的机会,那 么大语言模型涌现,也就是这种紧急行为紧急行为,他能够在只见一次或者是第一(yī)次零次(cì)的演示的情况下,他都理解 你要生成什么样的文字,我们相信(xìn)未来的5年给我们的机会就是发展机器人(rén)基础大(dà)模型,它能够实现涌现能力,它吞吐足够量的数据后,有灵巧手(shǒu),它能够抓能(néng)够加、能(néng)够拧,能够掰各种基本的手的 各种运(yùn)动能力都有了以后,他能涌现,我们给他看一个 视频,他就能理解这个活怎(zěn)么干,到那(nà)个时候我(wǒ)们真正的就有一个通用的(de)、至少做(zuò)操(cāo)作任务的的机器人了,这是我认为(wèi)未(wèi)来(lái)5年(nián)的一(yī)个机会。

熊友军:我觉得这一轮的机器人技(jì)术的进步主要是由AI来驱动的。毫无疑问, AI驱动我觉(jué)得(dé)体现在几个方面。

第一个就是它人 机交互性能(néng)得到了极大的提升。我(wǒ)记得10年前我们做人工智能、做机器人的时候的那些交互 ,如果说(shuō)我要加语音加视觉,第成本非常高,第二(èr)个我们要做大量的(de)研发的(de)工(gōng)作,我们需要几个博士、硕士带(dài)着一个团队(duì),花很长的时间才能够完成一些物体(tǐ)识别、语音合(hé)成,自然语言理解(jiě)NLP,还有甚至是TTS、语音合成等方面的一(yī)些工作,甚至 包括导(dǎo)航(háng),但是我(wǒ)觉得 ,现在随着技 术的进步(bù),我(wǒ)们现在做人形机器人的大模型,我们直接一个端到端(duān)的直接语音给指定(dìng)给他,然后很快他就可以有比较(jiào)好的行为输出,有(yǒu)很好的(de)意图理解,然后做任务规划等。这(zhè)是一方(fāng)面,我觉得这一轮对人机交互、对动(dòng)物的规(guī)划、对执行等方面都有巨大提升,在10年前基本(běn)上都很难去(qù)想象。

然后第二个现在的这些硬(yìng)件方面也(yě)有(yǒu)极(jí)大的(de)提升,体现在两个方向,第一个现在关节的性(xìng)能的提升是非常快(kuài)的,大家可以看到很多公司机器人可以开始去做一些(xiē)非常动态的、剧(jù)烈(liè)的运动,实际上离不开关节性能的提升、高能(néng)量密度比,然(rán)后高的转速、高性能(néng)等这些技术的提升,实际上,在10年前我觉得是很(hěn)难去做到的。当然了这也有运动控制能力的(de)提升、电机的(de)提升,现在其实也有(yǒu)采用更多结构设计的方式,更适合(hé)它的布局等(děng)方面都有非常大的进步,包括把腿的转成惯量、把电机往上(shàng)提等等,有各种各样的结(jié)构设计的技术的(de)变化。

另外,刚才还提到(dào)能量,其实早前我觉得(dé)10年前我(wǒ)们做机器人(rén)的时候,一个电(diàn)池就像我们背后要(yào)背一个非常(cháng)巨(jù)大(dà)的电池包(bāo)能源包,而且能够持续的时间很(hěn)短。但是这几年随着新能源汽车对(duì)电池技术的推动作用,其实我们看到(dào)它的电池能量密度大幅提升,我(wǒ)现在一个比较小的电池,可以支持比较长的(de)时(shí)间,我觉得这是一个非常重要的技术突破。

未来,我觉得5年之后,这几个可能还是一个重大、要突破 的(de)方(fāng)向,像刚才说的人机交(jiāo)互方面(miàn),我(wǒ)们(men)希 望大模型能(néng)提供更长期的任务规划,然(rán)后做意图理解等等 方面,我觉(jué)得我们(men)能只要给(gěi)他(tā)一个非常模糊(hú)的指令,他就可以给我们输出我们 很标准(zhǔn)的很(hěn)自然的这种交互的结果。第二方面,可能就是(shì)在规划实施任务方面是一个非常重大、要(yào)攻克的方向,我们环境会经常变(biàn),面对的是一个动态环境,然(rán)后机器人能够根据环境变化,能够实时去改变它的一些(xiē)执行(xíng)策略等。当然,像能(néng)量(liàng)方面(miàn)我(wǒ)觉得(dé)是一个持(chí)续要提升的,它毕竟现在能量执行效率和我们人相比,还是有非常大的一个差距。

问:大规模部署人形机器人 需要完成哪些任务?

Marc:但是如果你现(xiàn)在从更宏观的角度 来看,我刚才说了如果你(nǐ)想(xiǎng)致富你现在就不会着手开(kāi)公司(sī),但(dàn)是如果你想生存(cún)下去。你至少也得收支平衡。

我想这是一(yī)个更长(zhǎng)远(yuǎn)的计划,我认为要想(xiǎng)取得真正(zhèng)的进步,你必须暂停,或(huò)者我不是(shì)说你必须 暂停(tíng),我们在我的研究所暂停,让机 器人更(gèng)可靠(kào)的本地目标将是一件关键的事(shì)情,如果我能指出旧金山的自动驾驶汽车,他们杀(shā)死(sǐ)了(le)一个人,这实际上甚至不是(shì)自动驾驶汽车的坠落。然后克鲁兹完全(quán)退出了(le)旧金山。我知道现在(zài)还有很多事情在进行,但这在机器人领域很容易发生。因此,可靠性是一个关(guān)键(jiàn)因素,这是(shì)人们(men)投入大量资源努力解(jiě)决的(de)问题之一。但这无助于解决,将(jiāng)我们带入(rù)下一代的更大问题。当我说我不(bù)认为每(měi)个人都必须专(zhuān)注于你所 说的真正(zhèng)有用的东西时。

陈建宇:要(yào)做到大规模应用的话,有非常(cháng)重要(yào)两个事情(qíng):一个是(shì)能不能找到大规模的需求,另一个能不能(néng)有我们技术(shù),足够去(qù)实现、满足(zú)需求。

其实现在有(yǒu)很(hěn)多零散的表演需求(qiú),如(rú)果需(xū)要真(zhēn)的达到(dào)max(大规模)的话,我觉得主要还是看劳动力,非常密集的一(yī)些产业,比如(rú)三个阶段,一个是工业、商用和服务。

大体(tǐ)我认为(wèi),技术也基(jī)本上是按照这样一个方向去成熟发展,其中我觉得给我的(de)感受,我认 为工业的话可能会比较快(kuài)就能够去用上了。其实(shí)刚(gāng)才Marc的报告(gào)中里(lǐ)面也(yě)已经展现出来了,不管是人形,还是(shì)一些轮(lún)式的机器人,在工厂搬运的这一类的环(huán)境 里面,已经是达到了非常接近人类的一个节(jié)点 ,那么在未来,它(tā)可能会更快(kuài)更(gèng)强大,然(rán)后以(yǐ)及成本更低,达到这(zhè)个时候的话,其实它的第一个大规模应用的点就到了。

王鹤:我觉得具身(shēn)智能今(jīn)天(tiān)不能讲完全成熟,但是(shì)我们今天GPT能力搭(dā)配(pèi)人形机器人,其实已经能够在(zài)很多场合干事(shì)情(qíng)了。

像我们(men)今(jīn)天在展台展示了(le)就是在一(yī)个零售的场景(jǐng),那么用户(hù)可以(yǐ)下单,我们的机器人可以(yǐ)根据你的具体下单的内(nèi)容,是拿(ná)一个冰红(hóng)茶,还是拿一个巧克(kè)力,那么我们从货架把(bǎ)它取下来 ,同时我们(men)也可以从 地(dì)面的篮子里头把这些货不断的上到货(huò)架上(shàng),我们也可以从更(gèng)大的一个仓储的料(liào)架上,抱 着一箱东西放到(dào)传送带上(shàng)。

这些场景其实都展示了,目前具身智(zhì)能对于比较糙的活,就是抓取放置和双手抱(bào)持这(zhè)样的能力已经走(zǒu)向成熟。

在这种情(qíng)况下(xià),我们还要问(wèn)一(yī)个问题,为什么是(shì)这个人(rén)形对吧?有很(hěn)多人现场 问(wèn)我(wǒ),你们为什么要做成人形?因为(wèi)你想如果货架上的一个(gè)商品掉在地上了,我的机器(qì)人得有能力去(qù)够地面 这么低的东西,我的货(huò)架可能两米高,我要能够抓到两米那么高的东西,同时我还(hái)能(néng)还得来回走(zǒu)动,还(hái)要得(dé)有两只 手才(cái)能抱住(zhù)一个箱子,又有两(liǎng)只手又能(néng)高又能低又能(néng)够来回走,那么它基(jī)本上(shàng)就把形(xíng)态(tài)往(wǎng)人基本上(shàng)非常的靠拢了,那么我们目(mù)前用(yòng)的(de)是(shì)一个轮(lún)式底盘,没有(yǒu)腿,那么也已(yǐ)经达到这样的(de)一个能力了。那么我们认为(wèi)像这样(yàng)的抓(zhuā)取放置搬(bān)运的能力,在很多行业(yè),比如说零售,比如说工厂,比如说一些 服务的场景(jǐng)全都可以用起来。

所以我判断,人形机器人的大(dà)规模应用,2025年、2026年我(wǒ)们(men)将(jiāng)见到从百台级到千台级的一个(gè)快 速的增长,

王兴兴:我个(gè)人的话,总体来说,对(duì)目前(qián)整(zhěng)个人形(xíng)机器(qì)人应用落地还是需要一些时间,但当下(xià),包括今年和明年(nián)对一些简单场(chǎng)景,像特(tè)斯拉场景里(lǐ)面把一个电(diàn)池从什么(me)地(dì)方装(zhuāng)到(dào)什么地方里面,这种(zhǒng)简(jiǎn)单的,用模仿学(xué)习能做的事情,目前的AI技术(shù)其实成功率还是做的比较高(gāo)了,今年或明年可以做一些应(yīng)用,包括把整个的(de)GPT速度也(yě)提(tí)升。

但是我觉得,真正(zhèng)要提升人形机器人(rén)大规模(mó)应用(yòng),确实还需要更(gèng)多的时间,把机器人(rén)的模型本身做得更好一点,让它更通(tōng)用,基本上无论是更精细化的或者(zhě)更泛用心的一(yī)些事情都可以做一起来,所以我还是希望社会大 众对AI和机器人能更多一些耐心。但实际(jì)上可能中国(guó)其实(shí)还是有很多人比较心急的,我觉得还(hái)是大家可以(yǐ)再多给一点耐心。谢谢(xiè)。

熊友军:我(wǒ)觉得人形经济和大规模的应用,其实上这个就涉及(jí)到一个商业(yè)化场(chǎng)景选择的问题,实际上,并不是(shì)说现在人形机器人不能够应用,而是说要再(zài)看什么场景。我觉得在(zài)有一些刚需的场景,或者对(duì)人不可达波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”到(dào)的这种场景,还是有一些可以用的,尤其是这种刚性需求的,比如抢险(xiǎn)救灾,特种(zhǒng)的对核辐(fú)射(shè),或者是说有毒有害气(qì)体环境等等,这(zhè)些我觉得现在实际上是可以用的。

大家(jiā)其实想的更多是,技术怎么(me)去提升,然(rán)后怎么它能够(gòu)让人形机器人能够快速适 应更多的(de)场景,然后把成本快速的降下来,只有这样通 过一方面通过技术 的提升(shēng),提(tí)高有更多工(gōng)作效率,让人有(yǒu)更好的体验感,然后更多人愿意用它。

第二方面,就是把成本继续往下降,我觉得让大家更买得起,这(zhè)个我觉(jué)得要是要想的这个(gè)方式。

另外我觉得(dé)还有一种,就是商业模(mó)式上的探(tàn)索,实际上(shàng)人(rén)形机器人(rén)是我觉得是一个集大成者,它基本上涵盖了机器人(rén)和人工智能的绝大部(bù)分的技术领域(yù),然后在人体技术上的研究能够大大的推进这些(xiē)技术的成熟,然 后技术甚至技(jì)术的市场化,我(wǒ)们可以采用“沿(yán)途下蛋”方式获(huò)得这个商业的利润。通过这些(xiē)其他的一些技术,人形机器人(rén)产品上孵(fū)化的其他技术商业化、产业化来 推动(dòng)人(rén)形机器人研究。一个典型的例子,就是我们 现(xiàn)在有一些人形(xíng)机器人公司已经在其他产品上实(shí)现盈(yíng)利,然后已(yǐ)经实现了一个很好(hǎo)的商业(yè)化(huà),这我觉得(dé)是一种非常好的模式。

问(wèn):作为技术人员,我们是否意识到有很多机器(qì)人都有道德(dé)伦理方面的顾虑(lǜ)——我们如何(hé)才能消除这些顾虑?

Marc:我认为(wèi),从最高层面来说,理解所有技术都涉(shè)及一些风险和机(jī)遇是很重要(yào)的。我(wǒ)参加(jiā)了一(yī)个 政府(fǔ)会议,但我听到许多政(zhèng)府的人都在谈论监管人工智能,而压倒性的感觉是关注最糟糕的结果,对吗?

比如在欧 洲,来自英国(guó)一位人士在发言,让我(wǒ)印象(xiàng)深刻的是,人们几乎陷入恐慌,担心(xīn)最糟糕的事(shì)情(qíng)会(huì)发(fā)生,并且不惜一切代(dài)价想 要(yào)阻止这种(zhǒng)事情发生。但我认为,不利用机会的风险与让(ràng)坏事发(fā)生的风险一样大。

所以我认为,正如开发人员(yuán)指出的(de)那样,我们需要找到一种平衡,当我们撰写(xiě)论文时,我们会在开(kāi)头(tóu)列出这(zhè)些(xiē)内容。这些都是(shì)我们工作可能产(chǎn)生的巨大影响,但我们从不谈论我们的工作,可能(néng)产生(shēng)的坏事是什(shén)么。

我们需要诚(chéng)实和(hé)开放,更加(jiā)公平地对待这个问(wèn)题,但随后继续强调这种平衡,并(bìng)以某种(zhǒng)方式 防止我们错 过(guò)机会,我认为由于公众的恐惧,这种机会很容(róng)易发(fā)生。

陈建宇:我觉得(dé)人(rén)们对这个人形(xíng)机器人、或者相应的具身智能(néng)机器人(rén)技术的担忧,其实核心来自于对自身安全性(xìng)的一个(gè)担忧。

安全(quán)其实(shí)有(yǒu)几个(gè)不同的层(céng)次,最底层的层次 是物理的安全,大家担心(xīn)机(jī)器人会不会在(zài)工作的时候(hòu)去伤害到人,那么这是一个层次;当然其(qí)实在它分情况,那(nà)么比(bǐ)如说我们刚才说的如果是工厂里面的话,其实(shí)如(rú)果我们把(bǎ)它跟人工作环境隔开,其实一定程度上能解决这个问题 ;同时,我们也需要从(cóng)我们的算法硬件等等上面(miàn)做的更鲁棒来去优化这个(gè)问题。

那么第二(èr)个层次,其实也是生存上面的问题,但是不是说物理层面的,那么也(yě)是不是说全人类的(de)一(yī)个担忧,而是说(shuō)有一部分人一个担忧,他(tā)担心这个会替(tì)代(dài)咱们的某(mǒu)一些(xiē)工(gōng)作,大家会有担忧(yōu),我觉得这个(gè)事情可能需要(yào)政府或者商号进行有一些引导,我(wǒ)们(men)尽(jǐn)量的开始去做一些确实劳(láo)动力(lì)非常(cháng)紧缺的这样的一(yī)些产业(yè),比如说我们一些(xiē)非常(cháng)恶劣环境工业环境(jìng),或者是比如说养老(lǎo)等。

当然第三(sān)个层面,如(rú)果未来我(wǒ)们的具身智能机器人(rén)真正拥(yōng)有了意识,那么这个会对人类的自我存在(zài)的价(jià)值可能产生(shēng)一(yī)些担忧,我(wǒ)觉得这个事是更(gèng)远的和更大(dà)的topic。

王(wáng)兴兴:我(wǒ)觉(jué)得(dé)机器人(rén)的伦(lún)理道德(dé)和安全性问(wèn)题,是非常重要(yào)的一件事(shì)情,而且我觉得,要(yào)希望(wàng)是在场所有的人都大(dà)家需要共同去维护(hù)的一件事情 ,就有点像现在新能(néng)源汽车(chē)以及无(wú)人驾驶,它其实还是有很(hěn)多(duō)安全性(xìng)问题(tí),并(bìng)且比如说有一辆早些年新能源汽车起火了(le),或者(zhě)有(yǒu)一家新能源汽车(chē)无人驾驶出了交(jiāo)通事故(gù),这个对整个(gè)行业(yè)影响是非(fēi)常大(dà)的,会降低普通老百(bǎi)姓对技术行业(yè)的认(rèn)可(kě)度以(yǐ)及信心。

这个事情(qíng)很容易发生在人形机器人和AI这个领域。所以(yǐ)我一直觉得。当(dāng)下以及未来大家都应该在机器(qì)人安全(quán)性上(shàng),无(wú)论是出台一些规(guī)章政 策,或者做一些更好 的引导,或(huò)者需要全世界政府出台一些相(xiāng)关的政策,都共同(tóng)推动整个行业的健康发展(zhǎn)。

王鹤:所以我就 从技(jì)术的角度,人形机器人它的一个面向(xiàng)终局的技(jì)术必然是大(dà)模型,那(nà)么其实只有(yǒu)大模型才可能实现(xiàn)非常高的通用性,把很多能力全部汇集(jí)在(zài)一(yī)起,把(bǎ)很多模态,从视觉感知,到语言理解,到动作执行,那么融会贯通,那(nà)么(me)今(jīn)天我们(men)在技术上其实(shí)是有方法对大模型的行为进(jìn)行限制,就是“对齐”,我们在大模型(xíng)内部已经进行了深入研究,那么未来,我们会对语言模型、多模态模型(xíng)进行更(gèng)深入的对齐(qí),让(ràng)它(tā)不会伤害到我们的人类,并且他的技能会被局限在服务的范畴内,那么这(zhè)一(yī)些是我们技术上 能做的,在技术上之外,必然(rán)还需要政府社会和国际的合作。

熊友军(jūn):我觉得前面几位都说的 都挺好的,我(wǒ)就(jiù)补充一点(diǎn),就(jiù)是说我觉得应该是有一些行 业组(zǔ)织或者是政府出来,更多在法律法规这方(fāng)面更多的立(lì)法,包(bāo)括(kuò)更多的是做全社会的(de)机器人使用、伦理道德方面的一些教育。因为我觉得(dé),任何一个(gè)机(jī)器人也是一种(zhǒng)工具,放在不同人的手上,它的可能有不同的使用方法,然后(hòu)只有加强(qiáng)教 育,提升大家对(duì)人工智能对人(rén)形机器人(rén)的使用,让大家相对安全角度去考虑,我觉得才是一个(gè)正(zhèng)确(què)的方(fāng)式。

问:您认(rèn)为 5 年后人形机器人行业(yè)会发展到什么程度?哪些经济领域将(jiāng)率先使(shǐ)用它们?

Marc:不,我认为人形机(jī)器人的出现让事情变得复杂。我认(rèn)为机器人(rén)在工业领域(yù)的应用将取得很(hěn)大进展。我认为机器 人(rén)的应(yīng)用非常广泛。人们对此非常关注。正如大家所说,使机器人变得越来越好的技术 确实正(zhèng)在日趋(qū)成熟。我认为工业将(jiāng)继续(xù)取得进步。

我认为人形(xíng)机器人本身总体上仍然非常不成熟。所以我看不到它们。我知道你可以看看一些人形(xíng)机器人公司与汽车公(gōng)司合作的演示。我认为这在某种程度上是一种炫耀,而不是一种生产力。我不知道这是不(bù)是题外话。如果你看看仓库机器人,你会发现最大的挑战之一是系统集成(chéng),特别是如果它不是围(wéi)绕机器(qì)人(rén)设计的全新(xīn)仓库。

我认为许多仓库机器(qì)人供应商都在苦苦挣扎,因为他们需(xū)要一个(gè)系统(tǒng)集成商,而这个(gè)系统集成(chéng)商会(huì)消耗掉太多的预算,因此(cǐ)很难赚钱,这是因为(wèi)运营仓库的 IT 人(rén)员并不(bù)想开放(fàng)他(tā)们的(de)系 统。在(zài)那里工作的人并(bìng)不想改变他们现在做的一切(qiè)。如果(guǒ)机器人可以处理每一项任务,那就意(yì)味着他们仍(réng)然需要一个人来完成(chéng)任务。使用任何类型的机器人对(duì)行(xíng)业来说都具有很(hěn)大的复杂性。我认为这些都(dōu)是重要因(yīn)素。

说实话,我原本以 为(wèi) Spot 会取得(dé)更大的成功,但 Spot 的推出只是一次实验(yàn)。我们之所以设计(jì) Spot,是因为它能够让你(nǐ)连接自(zì)己的传感器,因为我们不(bù)知(zhī)道人们想要什么样的 传(chuán)感器。我们之(zhī)所以设计 Spot,是(shì)因为它(tā)能够让(ràng)你(nǐ)对它 进行编(biān)程,因为我们不知道现在的用户们都有哪些应用程序,而我们对它们的使用方式有了更多(duō)了解(jiě),开(kāi)发人员正专注于巨大机遇,因此 Spot 对人们(men)的接受度确实产生了影响。

也许如果我们(men)没有足够的 商(shāng)人,能够提前进入并评(píng)估它是什么,我们实际上(shàng)是在做一(yī)个实验。也许人形机器人会有更好的记录。

王鹤:我觉得我对(duì)人形机器人(rén)的发展总体(tǐ)是比较乐观的,那么在未来5年,我们要完成真正的大规模应用,这件事情对于整个人形机器人仍然是一个(gè)先慢后快,其中慢的阶段,那么一个里程碑应该是(shì)——在5年的时候我们能达到万台(tái)人形机(jī)器人级别(bié)的应用。

这(zhè)样的一(yī)个市场大约是(shì)对(duì)标现在商业清洁机器(qì)人。我们举个例子,在超市在万 达广场在写字楼一层,我 们看来回去洗地擦地的机器人,那么领先的(de)这个(gè)市场,中国最领先(xiān)的公 司大约是每年出货1万台,那么他做的事情不局限做这么简单(dān)的(de)事情,它能达到在各种场景,不管是商超还是写字(zì)楼,还是很多不同(tóng)的 场景进行清洁,但是当然是平面清洁。

那么(me),对于(yú)我们人形机器(qì)人来说,我们希望能做到一个(gè)立体操(cāo)作,但是它的能力 可能是局限(xiàn)的,我搬运我就是上(shàng)货,我就是(shì)取货,对吧?

我没有更(gèng)多(duō)的能力,但是我也(yě)要(yào)实现跨场景的应用,可以在超市里、可以在工厂里、可以(yǐ)在(zài)服务场景等等。那(nà)么能达到5年1万台的市场规模(mó)的话,我相 信后面有真(zhēn)实世界数据(jù)的回流,那时,我们会看到人形机(jī)器人应用规模会加快,从慢时代(dài)进入快时(shí)代。

熊友军:人形机器人我对它的应用可能会更加乐观(guān)一(yī)点,其实大家看到这两年人形机器(qì)人的进步非常快(kuài),尤其在AI驱动下面,实际上在市场应用方(fāng)面,你们已经(jīng)可(kě)以看到国的有一(yī)些企业,包括全球(qiú)企业已(yǐ)经开始在(zài)一(yī)些场景里面做试点(diǎn)应用了。

比(bǐ)如说在汽车厂,比(bǐ)如在一些商用服务场(chǎng)景,已经开始做(zuò)试点,随着这个试点数据会(huì)形成一个飞轮的效应,所以试点进(jìn)展,然后它会有更多的迭代,然后有更多(duō)数据驱动,机(jī)器(qì)人会在在一些特定(dìng)的环境里面提高效率,它的速度,它的随着量的增长,它的价格会大幅的降低,这样我觉得会更快的去促(cù)进产业(yè)的应用。

我觉得今年年(nián)底,大家应该可以看到,有一 部分的公(gōng)司已经(jīng)能(néng)够在一些(xiē)比如说(shuō)新能源汽车厂,比如说在一些特种领域已经开始应用(yòng),明年我觉得应该可以看到一些可能千台左右量级(jí)的出货。

问(wèn):你(nǐ)能在(zài)我们(men)的年轻观众中(zhōng)“点燃一把火”,让他们也想成为“机器(qì)人专家”吗(ma)?他们应该怎么做?

Marc:我认为伊隆·马斯克本人凭借他的雄心和资源,可能在几年(nián)内推出10000个(gè)机器人,不一(yī)定是因(yīn)为它们会(huì)直接让机器人赚钱,但看看他对电动汽车(chē)所做的一切。他们从无人(rén)相信到现在,我比这里的 任(rèn)何人都更加怀疑,包括我在内,到每家汽车公司都有淘汰内燃机的计划。

我认为这是一件了不起的事情。他似乎(hū)对(duì)此很认真(zhēn)。所(suǒ)以这在整个人形(xíng)机器(qì)人领域都是一个真正不确定性的因素(sù)。我不确定如果他没有抓住机(jī)会,是否会有这(zhè)么多(duō)人形机器人。

我认为(wèi)机器人(rén)玩得越有趣,人们就越能与它们互(hù)动。我到处走走,我没(méi)有带(dài)机器人(rén)来这里 ,但这里有很多机器人,但我到(dào)处发表演(yǎn)讲,发现机器人(rén)在计划中相当无(wú)聊。你总是能吸引(yǐn)一群人,只要你(nǐ)愿意让他们与(yǔ)机器人互动(dòng),他们就会留下来。我认为我们做得越多 ,公众就会(huì)越热情(qíng)。我非常欣(xīn)慰,参加这次活动最令人兴奋的事情可能是有很多人 说你做的(de)工作是我十几岁(suì)时见过的(de),现在我正在(zài)做(zuò)。我们越能展示我们的工作并激(jī)励下一代,这就会实现。

陈建宇:我的一个建议是(shì),因为机会(huì)其实永远是留给有准备的人,那么波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”像Maec做这个事情 做了做(zuò)了好几 十年,然(rán)后(hòu)包括我们其实台上我们几位也都是多年深耕在机(jī)器人或者(zhě)相关领域,所以说,因为人形机器人它其实也是一个非常长周期的事(shì)情(qíng),同时(shí)它也包罗万象,从技术上的软件、硬件、AI再到商业、产品等等 ,其(qí)实(shí)各方面都有,所以(yǐ)说大家应该去(qù)问一问自己的内心在这一步范围内(nèi)到(dào)底(dǐ)自己最有激情,最喜欢的最(zuì)热爱的是什么?然后(hòu)从(cóng)此刻开始就去(qù)积累(lèi)它。最后,要么等待未来,要么总有时(shí)刻你有施展自己的机会。

王兴兴:对于我(wǒ)觉得对(duì)于所有年轻人,包括我们(men)其实这个时代都是非常精(jīng)彩的,而(ér)且想象(xiàng)一下,大家也(yě)知道AI、机器(qì)人 都是阶梯性发展,就像GPT没有出(chū)来之前,大家觉得语言模型(xíng)没什么用,基本上是非常差,但(dàn)突然就是(shì)发生了巨大(dà)进步,非常(cháng)好,其实机器人(rén)、AI也会遵循(xún)这种(zhǒng)规律,所以大家现在可能看到机(jī)器人的 AI 能力都比较(jiào)弱,但实际上 这是好事,为什么?因为大家都有机会去做的(de)更好,可以真正(zhèng)的把这种人类目前 可(kě)以预估的(de)最伟大技术,就在当下,就在未来几年,所以这个事情都(dōu)是非常值得(dé)做的(de),

而且,在机(jī)器人和 AI 另外一 个(gè)比较适合年轻的点,它没有(yǒu)那么多历史包袱(fú),不像数(shù)学领(lǐng)域,有几(jǐ)百上千年的非常天才的数(shù)学家(jiā),你(nǐ)一定要比他(tā)们做得好 ,你才(cái)可以做技术,但(dàn)是当下,AI 和机器人它都非常年轻,尤其 AI 技术就最近几年的东西,所以非常适合年轻人(rén)。我一直感觉(jué)在如果在未来(lái)5年到10年或(huò)者几十年回看我们(men)现在这个时代,所以想想这种感觉,真的非常激动人心。

王鹤:我觉得(dé)其实未来的15年,在我心目中会是人形 机器人,从当下在产业中没有规模化应用,到可(kě)能成长到(dào)跟今天(tiān)汽车的产量一个万亿市(shì)场的过程(chéng)。那么在这个过程中,其实(shí)对年(nián)轻人(rén)来说,那么我 觉得大家(jiā)就是做好自己就可以了,因(yīn)为15年之后很多工(gōng)作都是跟人形机器(qì)人相关的(de),今天可能你负责卖车,那(nà)么15年后(hòu),你可能岗位就(jiù)调到卖人形(xíng)机器人对吧?今天(tiān)你(nǐ)是班级里头的佼佼者,那么(me)你学 AI ,那么你可能发现你的职业(yè)生涯就是围绕着进 一步提升人形机器人(rén)的能力展开的,所以大家做好自己,我们一起共(gòng)享(xiǎng)光明、人形机器人的(de)未(wèi)来。

熊友军:其(qí)实我是 经历过个人电脑时代,我经历智能手机时代,我经历(lì)过移动互 联(lián)网的时代,现在其实我们正在经历智(zhì)能(néng)汽车的(de)时代,电动汽车的时代,我觉得下(xià)一个时代实际上就是聚生智能的时代,而聚生智能时代的典(diǎn)型代表其实(shí)就是人(rén)性机器人,所以我(wǒ)给现在的年(nián)轻(qīng)人建议就是说保持野心,怀揣大梦想。

问:让我们在小(xiǎo)组成(chéng)员之间花几分钟时间讨论一下:你们想要互相问什么(me)问题?

陈建宇:所以我想问Marc,你(nǐ)认为对于机器人和人(rén)工智能来说最(zuì)重要的研究问题是什么,例如,如果你(nǐ)只能选择(zé)一 个研究项目,那(nà)么你选择哪一个?

Marc:让我从(cóng)侧面回(huí)答(dá)一下,这(zhè)也是一种回避你的问题的方式。最(zuì)后(hòu)我没有(yǒu)展示我的最后一张幻(huàn)灯片。我的最后一张幻灯片是一个展示机器(qì)人故障的视频。它展示了,我不知道它大概有(yǒu) 2 分钟长,可能有 25 种不同的故障。我认为故障(zhàng)是工作中最有趣、最有意思、最(zuì)有用的部分,关注它们,然后在你的工作 不(bù)工(gōng)作的时候继续前进,这 真的很重要。这不(bù)是(shì)研究的主题,但它是一种工作精神。所以如果我要问你们所有人这个问题的(de)话,那就是我还没看到任何人在演讲中提到过事情无法正常运转(zhuǎn),而且我敢肯(kěn)定,单一(yī)机器人不会(huì)在不 发生碰撞的情况下完成那些后空翻以及它们所做的所有很酷的事情。你喜欢碰撞吗?

王兴兴:Marc先生(shēng),很荣幸今天(tiān)见(jiàn)到您 ,我其实想有好奇想问一下,您觉得对于人形 机器人的(de)手,您觉得未来几年比较合 适(shì)的有几个手指,或者几个电(diàn)机,这会是比 较好的一个方向?

Marc:再次,我要回答一个略有不同的问题。我们研究所(suǒ)最近举办了一场研(yán)讨会,名为(wèi)“对操纵的反向 观点(diǎn)”。我认为(wèi)灵巧(qiǎo)性(xìng)确实很重要,但基本上它并没(méi)有取得很大进展,尽管 人们至少已经为此努力了 50 年。我认为我们必须以不同的方式思考,再次尝试不同的东西,就像我今天在演讲中开始的那样,也许我们需要更多(duō)的动态操纵,而(ér)不是所有的静态抓握。我认(rèn)为很多学习界的 人在提出他(tā)们正在学习的灵巧性的要求(qiú)时对自己要 求不够。他们做的事情(qíng)很简单,很容易。

我(wǒ)认为那里是有机会的,有多(duō)少只手我不知(zhī)道有多少根手(shǒu)指。我认为(wèi)五 个已经(jīng)很多了。但也许有一(yī)天我会觉得更(gèng)有趣(qù)的问题是手掌(zhǎng)怎么样?我们的手掌功能非常强大,它们不仅仅是静态的块。而且你看到的几乎每个机器人手(shǒu)都有许多手指在做这件事,但仅(jǐn)此而已。

王鹤:之前我(wǒ)提到过,大概 15 年后,世界上会有数百(bǎi)万(wàn)、一千万个人形机器人(rén)。如果人形机器人具有通用目的(de),那(nà)么人形机器人是终极体现,那(nà)么这种通用 目的的终极技术是什(shén)么?对于人类(lèi)噪音(yīn),您是否认为视觉(jué)、语(yǔ)言、动(dòng)作模型,这些端到端模型是人类噪音的(de)终极技(jì)术或(huò)方法?

Marc:我很难相信(xìn),端到端是取得进步的(de)方法。也许最终在渐近线上端到(dào)端是正(zhèng)确的方(fāng)法,但我认为我们知道的太多了。

说实话,我认为人们过(guò)分看重(机器)学习。我知道应(yīng)该(gāi)对学(xué)习持乐观态度,但(dàn)如果你(nǐ)看看当今存在(zài)的解决方案,你会发现最好的解决(jué)方案中学习所起的作用微(wēi)不足道或(huò)微不足道。当然,在波士顿动力公司,今天学习很少,尽管人们正在努力。我认为控制系统、控 制理论、观察器,这些在过去 20 或 30 年建立起来的东西仍然(rán)发挥着巨大的 作用。

我(wǒ)不想就这样把它抛弃。我希望我们能真正拥抱 学习,但要把它与我们已经(jīng)知道的东西结合起来,找到一种方法把它们结合起(qǐ)来(lái),至少在接下来的5年或10年里(lǐ),也许在渐近线上,情况会有所不同。

熊友军:我(wǒ)的一个问题是,Marc作为波士顿动力的创(chuàng)始(shǐ)人,您之前开发了像(xiàng)Atlas这样的非常令人惊奇(qí)的这种产品,但(dàn)是我们前不久我们看(kàn)到波士顿动力终止了这(zhè)个(gè)机器的研(yán)发,然后由原来的液压驱动,转向(xiàng)纯电(diàn)驱动的这种(zhǒng)方式。对这方面是出于(yú)什么样的考虑(lǜ)?是(shì)因为成本的考虑,还是因为出于商业化的考虑?同时我(wǒ)还(hái)想(xiǎng)知道,波士顿动力未(wèi)来5年(nián)的一些这种计划,对商业化的一(yī)些(xiē)计划(huà)。

Marc:我认为,如果你问为什么要进行(xíng)转变,我认为有两个(gè)关键因素:一个是液压机器(qì)人(rén),我喜欢液压技术,我会用液压技术制造很多机器人。我认为,建造人形(xíng)机器人或类(lèi)似(shì)人形机器人仍有空间,它们将继续(xù)使用液压技(jì)术,因为重量和强度等因素(sù)。

但我认为有两点。一是(shì)它们很麻烦,至少对(duì)于像 Atlas 这样的高性能(néng)机器(qì)人来(lái)说,尽管我们(men)付出了无尽的努力,也永远无法让(ràng)它们完(wán)全(quán)不(bù)漏油。当(dāng)你把石油机器人放到 工(gōng)厂和家里(lǐ)时(shí),它们就不能(néng)滴油;同时,很难找到精通液压技术的人,因为(wèi)人们认为 这是非常古老的(de)东西,尽管 Atlas 在液(yè)压(yā)工(gōng)作原理方面有很多创新,从服务器阀门 到 HPU 液压动力装置,一直(zhí)都是如此,确实有创新(xīn)的东西在进行;最后,我认为电(diàn)动汽车在(zài)规(guī)模(mó)上已经足够强大,它们可以参与竞争。我不想代表波士(shì)顿动力发(fā)言,尽(jǐn)管我是创始(shǐ)人之一,并且(qiě)仍然是董事会成(chéng)员,但(dàn)我认为他们必须有自己的计划,说明未来(lái)的计划(huà)以及技术的所有细节。我想随(suí)着事情的发展,你会发现更多这方面(miàn)的(de)内容。

主持人:非常感谢。我想观众肯定会有更 多问题(tí),也许吧,但我们的时间真的不多了。所以(yǐ)非常(cháng)感谢 各位小组成员。非常感谢(xiè)观众的到来和聆听(tīng)。我认为这是一场非常精彩的会议,尤(yóu)其是小组讨论(lùn)。我对组织者的建议是,我们明年再举(jǔ)办一次类似(shì)的会议,然后我(wǒ)们可以回顾进展和未来的步骤。

未经允许不得转载:橘子百科-橘子都知道 波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

评论

5+2=