波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”
8月24日下午,2024世界机器人大会上,举行了一场期待已久的中国、美国“具身智能”与人形机器人领(lǐng)域学者的“世界对谈”。
大名鼎鼎的“机器狗之父”、美国波士顿(dùn)动力创始人Marc Raibert(马(mǎ)克·雷伯特)首(shǒu)次来(lái)到北京(jīng)。他说(shuō),“我简直不敢相信,不(bù)仅是机器人的数量,难以置信,还有这么多热情的人(rén)参加了(le)展览。中国对机器人(rén)的兴奋(fèn)和热情很高。”
而此次与Marc对谈的四位(wèi)CEO所在的公司也(yě)不寻常:除了宇树科技之外,星动纪元、银河通用、北京具身智能机器人创新中(zhōng)心都成立不足2年,一出道就是具(jù)身智能和人形机(jī)器(qì)人(rén)行业的“顶流(liú)”。
而且,星动纪元、银(yín)河通用背后(hòu)也站着中国(guó)最高(gāo)学府:北大和清华,代(dài)表着中国前沿科技创新的重要来源(yuán)。
其中,星动纪元由姚期智带领的清华大学交叉信息研究院孵化成立的,星动纪元创始人 陈(chén)建宇现在还是清华大学交叉信息研究院(yuàn)助(zhù)理教授,公司融资超亿(yì)元,联想(xiǎng)创投已加入其中。
银河通(tōng)用机(jī)器(qì)人创始人的王鹤则是北京大学助理教授,也是(shì)北京智源(yuán)人工智(zhì)能研究院具身智能研(yán)究中心主任,过去半年(nián),银河通用(yòng)完成天(tiān)使(shǐ)轮融资共计7亿元人民币,刷(shuā)新了国内人形(xíng)机器人(rén)领域单轮融资(zī)规模,美团战投、北汽产投、商汤国香基金、讯飞基(jī)金、启明创投、蓝(lán)驰创投、经纬创(chuàng)投、源码资(zī)本(běn)、IDG资本等头部财务机构都参与其中。
而北京具身智能机器人(rén)创新中(zhōng)心则是北京(jīng)市发起成立的机器人“国家队”机构。北(běi)京具身智能机器人(rén)创新中心 总(zǒng)经理熊友军,目前还是“人形(xíng)机器人第一股”优必选科技CTO。
Unitree Robotics(宇树(shù)科技)也是当(dāng)下人形机器人行业的(de)明星企业。公司创始人、CEO、CTO王兴(xīng)兴毕业于上海大学,取得了机械工程硕士,具有近10多年足式机器人研发(fā)经验,拥有产品从0-1-100的(de)研发(fā)与(yǔ)商业化(huà)落(luò)地能力(lì),100+项机器人(rén)相关 专利。
此 次圆桌由德国慕尼黑工业大学教授 Alois.C.Knoll主持,美国波士顿动力(lì)创始人Marc Raibert(马(mǎ)克·雷伯特),与中国四大AI机器人企业领军者——陈(chén)建宇(yǔ)、王兴兴、王鹤、熊友军,五人围绕机(jī)器(qì)人行业、AI 大模型(xíng)驱动机器人(rén)发展 等议题展开讨论。
一(yī)个多小时(shí)的圆桌当中,Marc表示,未来5年,机器人硬件发展仍将非常(cháng)重要,但同时,能(néng)够打破语义(yì)理解障碍的基础模型或其他(tā) AI 方法也将对机器人技(jì)术产生(shēng)更大的影响。不过,要想取得机(jī)器人领域真正的进步,就需要更高的可靠性和安全性,未来人(rén)们(men)需要(yào)投入大量资源努力解决此类(lèi)问题。
Marc非(fēi)常(cháng)不看好人形机器(qì)人行业。他认(rèn)为,工业机器人已经(jīng)非(fēi)常成熟 ,而且能够(gòu)商业化,目前人形机器人(rén)“在某种程度上是一种炫耀,而不是一种(zhǒng)生产力”。
陈建宇表示,过去10年(nián)AI发展很快,从(cóng)简单的图像处(chù)理(lǐ),到深度学习、强(qiáng)化学习(xí),再到ChatGPT技 术,这对(duì)于未来“具身智能”产生很大的影响(xiǎng)。未来(lái)几年,AI、具身智能(néng)会与人形机器人不断融合,去训练一个通用模型。他相信未来5年(nián),我们将迎来(lái)“机器人的(de)ChatGPT时刻”。
王鹤指出(chū),当前 AI 大模(mó)型在机器(qì)人上仍有巨大的局(jú)限,尤(yóu)其是“泛(fàn)化的开瓶盖”技能还没有训(xùn)练出来,但(dàn)同时,这也(yě)是大模型(xíng)带来了重要机会(huì),一旦大模型涌现能(néng)力不断加(jiā)强,他认为未来5年,依然 有一个至少做操作任务的通用机器人机会。
熊友军表示(shì),当前关节性(xìng)能提升(shēng)、高的能量和电池密度的提升非常快,使得机器人的运动控制 能(néng)力(lì)、电机等方面提升非常快。未来5年,机器人关节和能量密度会(huì)持续提升。毕(bì)竟和人类相比,现在机器人(rén)的能量(liàng)执行效(xiào)率还是有非常大的(de)差距。
以(yǐ)下是钛媒体AGI编辑对此次(cì)圆(yuán)桌全文(wén)整理:
问:您(nín)能否向观众简单介绍一下您的工 作:您为什么以及什么时候开始对人形机器人感兴(xīng)趣的?
Alois:我从 2001 年开始担任慕尼黑大学的教授。我对人类噪音的一个方面产生了兴趣,那就是具(jù)象(xiàng)化,对(duì)吧?我的朋友 Pfeiffer 和我(wǒ)们一起从大(dà)学毕(bì)业。苏(sū)黎世退休了,不幸的是,我们坚信具象化。所以(yǐ)我们认为,在我们的人(rén)类类(lèi)型中,智力只会在以非常(cháng)自然的方式与世界相连的人类类型身体(tǐ)中发展(zhǎn)。所以身体应该有同样的(de)动力,同(tóng)样的(de)尺寸,等等。否则,就很难做到这一点,你在这里看到的 Kronos 系列机器人,左边,左下(xià)角的(de) Roll Boy2024 就是这种信念的结果(guǒ)之一。
Marc:我(wǒ)认为你贴出的那张图片(piàn)对我回答这个问题很(hěn)有帮助(zhù)。如果人形(xíng)机器人意味着两只胳膊、两(liǎng)条腿直立向(xiàng)前,那么直到(dào)最近(jìn)我 才对此感兴(xīng)趣。事(shì)实上,我一(yī)直认为现(xiàn)在的公司注重功能(néng)性,作为一名教授,我认为功(gōng)能性才是最(zuì)重要的,机(jī)动性、灵巧性、感知力和智能,而外形和外观则是次要的。另一方面,如果人形机器人意味(wèi)着像腿一样的动态生命,我会把它与世界互动。我一直是人形机器人的粉(fěn)丝,尽管我建(jiàn)造的第一个机器人是弹(dàn)簧(huáng)单高跷的东西。我(wǒ)认为(wèi)人形机器人的许多(duō)基(jī)本要素都在那些弹簧单高跷的东西中。确实,当我们开始建造机器人时,波士顿动力公司 是直立的(de),有两(liǎng)条腿,两只胳膊。有时领(lǐng)先。如果你看看公众的反应(yīng),你会发(fā)现 YouTube 点击量增(zēng)加了 10 倍(bèi),我(wǒ)非常关注这些点(diǎn)击(jī)量或评论,或者只是人们的态度。人们(men)非(fēi)常感(gǎn)兴趣。普通 的非科学家,比如(rú)说(shuō),非工程师,他们对人形机器人很感(gǎn)兴趣,而狗惹恼机(jī)器人却得不(bù)到(dào)同样的赞誉。
熊友军:我是从读博士的时候,2000年(nián)开始做机(jī)器人的研发,当时读博士(shì)的(de)时候,那时候更多的是(shì)做工业领域、特种(zhǒng)领域的一些机器(qì)人,用在一些危险的环境里面,因为那(nà)时候(hòu)机器人技术还是非常不成熟,但在(zài)很多特种(zhǒng)领域和危险(xiǎn)场景里面,是需要用机器人去完成工作(zuò)了,然而那时候机器智能实际上是很差的。所以我们当时想的(de)办法,是将(jiāng)机器人的智能跟(gēn)人的智能结合起来,所以做了(le)一些机器人(rén)要操作的一(yī)些事情(qíng)。
所以当时我们就觉得,如果说有(yǒu)微型机(jī)器人(rén)的话,实际上(shàng)应该(gāi)是能够提供很好的解决工具(jù),或者一种解决方案,但是我们当时那时候也看到了日本本田ASIMO,给我们提供了很多的一些启(qǐ)发,所以那时候我(wǒ)就对人形机器人(rén)非常感兴趣。后(hòu)面(miàn)毕业之后,一直在做机(jī)器人相关的工作,
2012年,我跟优必(bì)选科技CEO周(zhōu)剑先生创立了公司,做人形机器 人研发工作,去年(nián)从深圳到(dào)北京(jīng)开始筹建具身智(zhì)能机器(qì)人创新(xīn)中心,现(xiàn)在也是一直在聚焦人形机器人方面的研发,主要的想法(fǎ)是希望说能够解(jiě)决人形机器人方面的一些共性(xìng)、关(guān)键的技术问(wèn)题,比如本体的(de)一些基础研发不足,其实我(wǒ)们现在微型机(jī)器人在本体在关键的核心(xīn)器件,然后在一些传感器方面其实上有非常(cháng)多要攻克(kè)的地方。另外在运动控制,实际上我们也做了非常多的运动控制的技术研发,采(cǎi)用深度学习强化学习的这种运动控制的方(fāng)式,包括现在也用一些融神经网络的(de)一些方式用去做运动控制,同时(shí)其(qí)实我们现在还在做关于智能方面的一些研发,比如说把用现在具身智能的方式(shì),做一些基础性工作,比如建它的数据集,研发机器人大(dà)模型框(kuāng)架等。所以这就是现在(zài)我在做的(de)一些事情。
陈建宇:其实这(zhè)个兴趣是很小的时(shí)候,就一直对智能机器人(rén)非常感兴趣,我印象很深刻(kè),刚刚(gāng)兴兴说她10岁的时候,我估计也是差(chà)不多类似的时间,不过当时看的不是波士顿动力,当时关注的(de)是ASIMO系列机器人(rén波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”),当时我就非常的去着迷。然后我觉得,创业这(zhè)件事其(qí)实是充满了挑战性的,marc创办了波士顿动力做了40多年,其实(shí)我是非常尊敬的,就是说你没有(yǒu)一个发自内心的、天生热爱的话,其实很难去坚(jiān)持下来的。所以对我来说,对这类机器(qì)人的热爱,我觉得某种程度上是从小(xiǎo)就具备就拥有的。
那么真正开始做机器人其(qí)实是(shì)本(běn)科的时(shí)候。当(dāng)时在(zài)学校里面,我就接触真正意义上的机器人的研究,当时接(jiē)触了双足(zú)机器人,主要是做的就是捕获点步态(tài)规划相关的研究。后来(lái),博士阶段继(jì)续做机器人(rén),虽然不是人形机(jī)器人,但是(shì)也是(shì)相关的一些机器(qì)人的领域,控制(zhì)它的学习,包括无人车和机械(xiè)臂。而真正的去全力(lì)做人形机器人,是在我回国之后,然后在(zài)现在清华正式投入(rù)去做(zuò)人形机器人,还孵化了星动(dòng)纪(jì)元 公司,如今我们已经做了最新一代、第(dì)六代机 器人了,然后我们也在展会上面带来了我们机器人的实(shí)物,欢(huān)迎大(dà)家去关注。
王兴兴:大家好,我是宇树科技创始人(rén)王兴兴,刚才有提到(dào)我大概可能10岁的时候就(jiù)看过(guò)marc先(xiān)生在MIT实验室做的双足(zú),还有单(dān)条(tiáo)腿的机器(qì)人,然后印(yìn)象非常(cháng)深,在(zài)09年、10年(nián)的波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”(de)时候,大概大(dà)一寒假,我就做过一个(gè)小 的人形(xíng)机器人(rén),然后当(dāng)时做的(de)不是特别满意,然(rán)后后来的话(huà),就在研究生期间做了XDog这款机器人,差不多(duō)在13年到15 16年,这款机器(qì)人的话又采(cǎi)用(yòng)了比较低成本的硬件,然后(hòu)运动性能(néng)非常好,可以直接实现关(guān)节的(de)力(lì)控以及整机(jī)的力控。
后来的(de)话(huà),一开始我(wǒ)对(duì)人体机器人的技术还是跟相对来(lái)说比较悲观的,但是后来的话在2022年左右,整个的机器人、AI技术的进步,然后再加上(shàng)ChatGPT出来以后,大家都看到(dào)人形机器人和AI结合的可(kě)能性,所以(yǐ)说(shuō)我们公司又重新开始做人形机(jī)器人。说(shuō)实在的,其(qí)实我真正(zhèng)感兴趣的并不是说人形机器人,而是新的一个智能体机器人的形态。而人形机器(qì)人可能只是说目前大家比较公认的、一(yī)个最 有可能性(xìng)的通用机器人和通用AI的结合体,但是这可能并不是个唯一的,我真正希望能诞生甚至更比人更高级的一个智能体形态,可以大大(dà)推动整个人类(lèi)工业的变革,推动新的工业革命。
王鹤:我是北京大(dà)学计算机学院助理(lǐ)教授(shòu),也(yě)是北大银河通用具身智能联合实(shí)验室的主任王(wáng)鹤,那么,我跟人形机器人、具身智能结缘,主要是从我在斯坦福大学开始读博的时候。那么2016年的(de)时候(hòu),当时深度学习技术已经出来了,也应用在很多图像识别(bié)分类这些任务当中。那么当时作为一个前沿(yán)研究(jiū),我们试图去理解人类是如何把感知思考还(hái)有交(jiāo)互的能力(lì)融合在一起的(de)。
所以我博士期间(jiān)的第一个工作,就用一个(gè)视觉模型来看桌面上人的(de)动作和物体的一个运动,然后推理人下一步想要什么(me),这是一个语言(yán)模型。
最后再用一个简单(dān)的机器人,智能的马(mǎ)克杯去响应人的动作,那么这个工作获得了欧洲图形学的最佳论文(wén)提名,但是我们认为(wèi)它非(fēi)常的不足,就是我们的一个(gè)马克杯(bēi)只能在桌面(miàn)上移动响应人的动作,它没(méi)有跟人交互的能(néng)力,我们的视(shì)觉只能看(kàn)有限的几一种物体,那(nà)么我们的语言(yán)模型只能根据这个人跟这些桌面东 西的一(yī)些动作来做简单的推理。
那(nà)么通过过去(qù)8年我(wǒ)们的研究,在怎么样(yàng)把机器人的操作能力搞得更泛化,什么东西都能抓,都能够放置,那么还有跟现在的多模态(tài)大模型(xíng)技(jì)术结合,真的(de)明白人类(lèi)想让你干什么,那么言出法(fǎ)随的(de)去执行,所(suǒ)以去年我们就孵化了北京银河通用这家人形机器人公司,我们现在也是把视觉、语言、动作这三种不同的模态(tài)融合到大模型当中,真正(zhèng)的赋能(néng)人形机器人,让人(rén)形机器人能够走进千行百(bǎi)业、千家万户,这是我们的愿景。
问 :你认为,我们今天拥(yōng)有的哪些重要技术是 10 年(nián)前没有的,但对(duì)于实用的人(rén)形机(jī)器人来说却至关(guān)重要?它们(men)在未(wèi)来 5 年(nián)将如何发(fā)展(zhǎn)?
Marc:我认 为硬件(jiàn)开发(fā)仍将非常重要。如果我们谈论未来 5 年,毫无(wú)疑问,能够打破语义理解障碍的基(jī)础模型或其他人工智(zhì)能方法将产生最大的影响。
我认为(wèi),人类可(kě)以做的就是,概括和理解(jiě)他们所(suǒ)看到事物的含义,而目前还无(wú)法真正捕捉到这些含义。我相信(xìn),如果人工(gōng)智能(néng)能够(gòu)在(zài)这方面取得(dé)进展(zhǎn),我认为它(tā)将(jiāng)产(chǎn)生巨大的影(yǐng)响(xiǎng)。
实际上(shàng),过去十年来,每(měi)个人都在计算机、传感器(qì)、感知 、控制等(děng)方面取得了巨大进步。电池,我认为人(rén)们忘记了电池。虽(suī)然电池是工业时 代(dài)的(de)产(chǎn)物,但是(shì)它们确实非常重要。是的,所以在电机(jī)方面过(guò)去 5 年里,人们(men)做得很好,我(wǒ)认为电机已经取得了长足的进步,当然,我们将看到更多。
陈建宇(yǔ):我(wǒ)从(cóng)AI的视角来讲一讲,觉得非常大的一个不同。如果按照10年(nián)前(qián)的话,其实是2014年左右(yòu),当时(shí)是DeepLearning刚刚出来不久,它其实解(jiě)决了很大一部分,比如图像处理等等一些(xiē)问题。
那(nà)么(me)后面,其(qí)实有我认为两个(gè)最重要(yào)的里程碑:一个是以16年阿尔法(fǎ)狗为代表的深度学(xué)习,紧接着 把它用在了强(qiáng)化学习上面,做深(shēn)度强化学习,解决了一些问题;第二个是以ChatGPT为代表(biǎo)的大语言模型,所以这点我(wǒ)认为(wèi)是过去10年没有的(de),但又对未来 我们(men)人形(xíng)机器人,或者是具身智(zhì)能起到非常大的决定性作用的两个因素。
那么可能(néng)在接下来的这几(jǐ)年时间,这两项技术(shù)会非常深度的跟人形机器(qì)人、具(jù)身智能融合(hé)起来,但他(tā)们也分别需要经过一定程度的训练,从而能训练比较(jiào)通(tōng)用的一个模型(xíng),那么(me)我们也能(néng)解决更加丰富(fù)的物(wù)理(lǐ)世界的(de)数据程序。那么我相信,在(zài)接下来的5年,这几(jǐ)项技术都能起到非(fēi)常大的一个进(jìn)展(zhǎn),我们可能会在5年内迎来“机器(qì)人(rén)的ChatGPT时(shí)刻”。
王(wáng)兴兴:对过去10年最大的,还是AI技术带来的各种事情有更多的信心。我觉得除(chú)了 AI技术 本身最大(dà)的点,对于人形机器(qì)人,对于整个社会共(gòng)识的增加也(yě)是非常关键的,就是目前大家更加(jiā)相信AI,更加相信人形机器人可(kě)以(yǐ)诞生更多价值,这在10年前是完全不能想象(xiàng)的,那时整个社会基本上对此都完全没有信心。
另外一点的话,我觉得在未来5年,总(zǒng)体上是肯 定整个 AI 机器人、AI模型变化会非常快(kuài),因为目前(qián)的AI真的是日新月异,大家可以(yǐ)用AI集成技术,去搭建 各种(zhǒng)自己的模型(xíng)去做训练,这整个已经变(biàn)成一个(gè)非常(cháng)的扁平化,以(yǐ)及(jí)容易操作的(de)过程(chéng),其实很多人大家都可以参与进(jìn)来,去做机(jī)器人(rén)模型并(bìng)且去做训练,所以我(wǒ)觉得。未来5年(nián)这块的(de)各种AI模型创新,包括更新的一些神经网络模型,包括脉冲神经 网络等都有很大(dà)的(de)一些机(jī)会(huì)。
王鹤(hè):我觉得(dé)10年好快(kuài),10年(nián)前是2014年,其实我们已经看到inbody的AI,甚至不是(shì)一个在西方(fāng)的学术(shù)界比(bǐ)较popular的词汇,那(nà)么(me)过去的十年,我觉得一大技术的进展,就是我们在具身智能(néng)里头已经有一些技能实现了(le)非常强的泛化性。
那么以我个人的研究举例,在抓取问题上,我们取得了比较长(zhǎng)足的进步,那么我们从只(zhǐ)能抓方(fāng)块圆的这些特定形状的物体,到(dào)基于三维视(shì)觉传(chuán)感器(qì),我们可以抓不透(tòu)明、不反光,也就是在深度传感器(qì)里(lǐ)头(tóu)能完(wán)美成像的这些物体,到我们最近的技术能够预测透明、高反光、金属、吸光这些非常有挑战(zhàn)材质的物体,基(jī)于它去做泛化抓取操作。
那(nà)么在今天的(de)展厅,我们都接受(shòu)观众给我们的各种形 状,各种材质随便堆叠乱七八糟的物体,我们的机器人都展示了(le)非常泛化和高成(chéng)功率的抓取能力,那么现在的问题(tí)是,像这样的每一个技能,大家都在分分别的去做开发,那么很(hěn)多人会提(tí)问你(nǐ)能帮我抓水瓶,你能不能帮我把瓶盖给拧开?我非常(cháng)不好意思的(de)说,现(xiàn)在泛化的开瓶(píng)盖技能(néng)我们还没有训练(liàn)出来,这个就是大模型能够带(dài)给我们的机会,那(nà)么大语言模型(xíng)涌现,也就是(shì)这种紧急(jí)行为紧急行为(wèi),他(tā)能够在只见一次或(huò)者是第一次零次的(de)演示的情况下,他都理解你要(yào)生(shēng)成什么样的文字,我们相信未来的5年给我们的机会就是发展机器人(rén)基础大模型,它能够实(shí)现涌现能力(lì),它吞吐足(zú)够量(liàng)的数据后,有灵巧手,它能够抓能够加、能够 拧,能够掰(bāi)各种基本的手的各种运动能力都有(yǒu)了以后,他能涌现,我们给他看(kàn)一个视频,他就能理解这个活(huó)怎(zěn)么干,到那个时候我(wǒ)们真正的就有一个通用(yòng)的、至少做操作任务的的机器人了,这是我认为未来5年(nián)的一个机会。
熊友军(jūn):我觉得这一轮(lún)的机器(qì)人(rén)技术(shù)的进步主要(yào)是由(yóu)AI来(lái)驱动(dòng)的。毫无疑(yí)问(wèn), AI驱动我觉得(dé)体现(xiàn)在几个方面。
第一个(gè)就是它人机交互性能得到了极大的提(tí)升。我记得10年(nián)前我们做人工智能、做机器人的(de)时候的那些交(jiāo)互(hù),如果说我(wǒ)要加语音加视觉,第成本非常高(gāo),第二个我们要(yào)做(zuò)大量(liàng)的研(yán)发的工作,我们需要几个(gè)博士、硕士带着一个团(tuán)队,花很长的时间才能够完成一些物体识别、语音合(hé)成,自然语言理解NLP,还有甚至是TTS、语音合成等(děng)方面的一些工作,甚至包括导航,但是我觉得,现在(zài)随着技术的进(jìn)步(bù),我们现在做(zuò)人形机器人的大模型,我们直接一个端到端的直接语音给指定(dìng)给他,然后很快他就可以有比较好的行 为输出,有很好(hǎo)的意图理解,然后做任务规划等。这是一方面(miàn),我觉得这一(yī)轮对人机(jī)交互、对动物(wù)的规(guī)划、对(duì)执行等方(fāng)面都有巨大提升,在(zài)10年前(qián)基本上(shàng)都(dōu)很难去想(xiǎng)象。
然后第二个(gè)现在(zài)的这些硬件方(fāng)面也有(yǒu)极大的提升(shēng),体现在两(liǎng)个(gè)方向,第一个(gè)现在关节的性能的提升是非常快的,大(dà)家可以(yǐ)看到很(hěn)多公司机器人可以开始去做一些(xiē)非常动态的、剧烈的运动,实际(jì)上离不开关节性能的提(tí)升(shēng)、高能量(liàng)密(mì)度比,然后高的转速、高性(xìng)能等这些技术的提(tí)升,实际上,在10年前(qián)我觉得是很(hěn)难去(qù)做到的。当然了这也有(yǒu)运动控制能力的提升、电机的提升,现在其实也(yě)有采用更多结(jié)构设计的方式,更适合它(tā)的布局等方面都有非(fēi)常大(dà)的进步,包括把腿的转成惯量、把电机往上提等等,有各种各样的结构设计的技术的变化。
另外,刚才还(hái)提到能量,其实(shí)早前我(wǒ)觉得10年前我们做机器人的时候,一个电池就像我们背后要背(bèi)一个非常巨大的电池包能源包(bāo),而且能够持(chí)续(xù)的时(shí)间很短(duǎn)。但是这几年随着新能源汽车对电池技术(shù)的(de)推动作用,其实我(wǒ)们看(kàn)到它的电池能量(liàng)密度大幅提升,我现在一个比较(jiào)小的电池,可以支持比较长的时间,我觉得这是一(yī)个非常重要的技术突破。
未 来(lái),我觉得5年之后(hòu),这(zhè)几个可能(néng)还是一个重大、要突破(pò)的方向(xiàng),像刚才说的人机交互方面,我(wǒ)们希望大模型能提供(gōng)更长(zhǎng)期(qī)的任务规划,然后做意图理解等等(děng)方面,我觉得我们能只要给他一个非(fēi)常(cháng)模糊的指令(lìng),他就可以给我们输出我们很标准的很自(zì)然的这种交互的结果。第二方面,可能就是在规(guī)划实施任务方面是一(yī)个非 常重大、要攻克的方向,我(wǒ)们环(huán)境会经常变(biàn),面对的是一个动态环境,然(rán)后(hòu)机(jī)器人能够(gòu)根据环境变(biàn)化,能够实时去(qù)改变它的一些执行策略(lüè)等。当然,像能(néng)量方面我觉得是一个 持续要(yào)提升(shēng)的,它毕竟现在能(néng)量执行效率(lǜ)和我们人相比,还是有非(fēi)常大(dà)的一个差距。
问:大规模部署人形(xíng)机器人需要完成哪(nǎ)些任(rèn)务?
Marc:但(dàn)是如果你现在从更宏观的角度来看,我(wǒ)刚才说了如果你想致富(fù)你(nǐ)现在就不会着手开公(gōng)司,但是如果你想生存下去(qù)。你至少也得收支平衡。
我想这是一个更长远(yuǎn)的计划,我(wǒ)认为要想取得真正的进步,你(nǐ)必须(xū)暂停,或者我不是(shì)说你必须暂停,我们在我的研究(jiū)所暂停,让机器(qì)人更可靠的(de)本地目标将(jiāng)是一件关键的事情,如果我能指出旧金山的自动驾(jià)驶 汽车(chē),他们杀死了一(yī)个人,这实际上(shàng)甚至不是自(zì)动驾驶汽车的坠落。然后(hòu)克鲁(lǔ)兹完全退出了旧(jiù)金山。我知道现在还有很多事情在进行,但这在机(jī)器人(rén)领域很容易发生。因此,可靠 性是(shì)一个关键因素,这是人们投入大量资源努力解决(jué)的问题之一。但这无助于解决,将我们带入下一代的更大(dà)问题。当(dāng)我说我(wǒ)不(bù)认为每个(gè)人都必须专注于(yú)你所说(shuō)的真正有用(yòng)的东西时。
陈建宇:要做到大规模(mó)应用的话,有非常重要两个事情:一(yī)个是能不(bù)能找到大规模的需(xū)求,另一个能不能有我们技术,足够去实现、满足需 求。
其实现在有很多(duō)零散(sàn)的表演需求,如果需要真的达到max(大规模)的话,我觉得主要还是看劳动力,非常密集(jí)的一些产业(yè),比如三个(gè)阶段(duàn),一个是(shì)工业、商用和服务。
大体我认(rèn)为,技(jì)术也基本上是按(àn)照这样一个方向(xiàng)去(qù)成熟发展(zhǎn),其中我(wǒ)觉得给我(wǒ)的感受,我认为工业的话可能会比(bǐ)较快(kuài)就能够去用上了。其实刚才Marc的报(bào)告中里面也已经展现出来了,不管是人形,还是一(yī)些(xiē)轮式的机器人,在工(gōng)厂搬运的(de)这一类的环境里(lǐ)面,已经(jīng)是达到了非常(cháng)接(jiē)近人类的一个节点,那么在未来(lái),它(tā)可能(néng)会更快更强(qiáng)大,然后以及成本更低,达(dá)到这 个时候的话(huà),其实它的第一个大规(guī)模(mó)应用的点就到了(le)。
王鹤:我觉得(dé)具身智能今天不能讲完全成熟,但是我们今天GPT能力(lì)搭配(pèi)人(rén)形机器人,其实已(yǐ)经能够在很多场(chǎng)合(hé)干事情了。
像我(wǒ)们(men)今(jīn)天在展台展示了就是在一(yī)个(gè)零售的场景,那么用户可以下单,我们的机器人可以根据你的具体下单的内(nèi)容,是拿(ná)一个冰红茶,还(hái)是拿(ná)一个巧克力,那么我们从货架把它取下来(lái),同时我们也可以从地面的篮子里头把(bǎ)这些货不断的上到货(huò)架上(shàng),我(wǒ)们也可以从更大的(de)一个仓储的料架上,抱着(zhe)一箱东(dōng)西放到传送带上。
这些场景其实都展示了,目前具身智(zhì)能对于比较糙的活,就是抓取放置和双手(shǒu)抱持这样(yàng)的能力已经走向成熟。
在这(zhè)种情况下,我(wǒ)们还要问(wèn)一个问题,为什么(me)是这个人形对吧?有(yǒu)很多人 现场问我,你们为什么要(yào)做成(chéng)人形?因为你想如果货(huò)架上的一个商品掉在地(dì)上了,我的机器人得(dé)有能(néng)力去够地面(miàn)这么低的东西,我的货(huò)架可能两米高,我要(yào)能够抓到两米那么高的东西(xī),同时我还能还得来回走(zǒu)动,还要得有两只手才能抱住一个箱子(zi),又有两只(zhǐ)手又能高又能低又能够来回(huí)走,那么(me)它基(jī)本上就把形态往人(rén)基本上非常的靠拢了,那么我们目前用的是一个轮式底盘,没有腿,那么 也(yě)已经(jīng)达到这样的一个能力(lì)了。那么我 们认为像这样的抓取放置搬运的能力,在 很多行业,比如说零售,比如说工厂,比(bǐ)如说(shuō)一些服务的场景(jǐng)全都可(kě)以用起来。
所以我判断,人形机(jī)器人(rén)的大规模应用,2025年、2026年我们(men)将见到从(cóng)百台级到千台级(jí)的一个快速的增长,
王兴兴:我个人的话,总体来说,对目前(qián)整个人形机器人应用落地还是需要一些时间,但当下,包(bāo)括今年和明年对一些简单场景,像特斯拉场景里面把一个电(diàn)池从什么地方装到(dào)什么地方(fāng)里(lǐ)面,这种简单(dān)的,用模仿学习能做的事情,目前(qián)的AI技(jì)术其实成功率还是做的比较高了,今年(nián)或明年(nián)可以做一些应(yīng)用,包括把整个的GPT速度也提升。
但是我觉得,真正要提升(shēng)人形机器人(rén)大规模应用,确实还需要更多的时间,把机器人(rén)的模(mó)型本(běn)身(shēn)做得更(gèng)好一点,让它更通用,基本上无论是更精细化的或者更(gèng)泛用心的(de)一(yī)些事情都(dōu)可以做一起来,所以我(wǒ)还是希望(wàng)社会大众(zhòng)对AI和机器人能(néng)更多一些耐心。但实(shí)际上(shàng)可能中国其实还是有(yǒu)很(hěn)多(duō)人比较心急的,我觉得(dé)还是(shì)大家可(kě)以再多给一(yī)点耐心。谢谢。
熊友(yǒu)军:我(wǒ)觉得人形经济和大规模的应用,其实上这个就涉及到(dào)一个商业化场景选择的问题(tí),实际上,并不是说现在人形机器人不能够应用,而是说要再看什么场景。我觉得在有(yǒu)一些刚(gāng)需的场景,或者对人(rén)不可达(dá)到的这种(zhǒng)场景,还是有一些可以用的,尤其是这种刚性需求(qiú)的,比如抢险救灾,特种的对核辐射,或者(zhě)是说有毒有害气体环境(jìng)等等,这些(xiē)我觉得现在实(shí)际上是(shì)可以用的。
大家其实想的更多是(shì),技术怎么去提升,然后怎(zěn)么它能够让 人形机(jī)器人能够快速适应更多的场景,然后把成(chéng)本快速的降下来,只有这样通过一方面通过(guò)技(jì)术的提升,提高有更多工(gōng)作效率(lǜ),让人(rén)有更好的(de)体验(yàn)感,然后更多人愿意用它。
第二方面,就(jiù)是把成本继续往下(xià)降,我觉得让大家更买(mǎi)得起,这(zhè)个我(wǒ)觉(jué)得要是要想的这个(gè)方式。
另外我觉得还有一种,就是商业模式(shì)上的探索,实际(jì)上人(rén)形机器人是我觉得是一个集大(dà)成者,它基本上涵盖了机器人和人工智能的绝大部分的技术领域,然(rán)后在人体(tǐ)技术上的研究能够大大的推进这些技术的成熟,然后技术(shù)甚至技术的市场化,我们可以采用“沿途下蛋”方式获得这个商业的利润(rùn)。通过(guò)这些其他的一些技术,人形机器人产(chǎn)品上孵(fū)化的(de)其(qí)他技术商业化、产业(yè)化来推动人形机器人研究。一个典型的例子,就是我们现在有一(yī)些人形机器人公司已 经在其(qí)他产品上实现盈(yíng)利,然后已经实现了一个很好的商业化,这我(wǒ)觉得(dé)是一种非常好的模式。
问(wèn):作为技术人员(yuán),我们是否(fǒu)意识到有很多机器人(rén)都有道德伦(lún)理方面的顾虑——我们如何才能消除这些顾虑?
Marc:我认为,从最高层面来说,理解(jiě)所有技术都涉及(jí)一些风险和机遇是很重要的。我参加了一个政府会议,但我(wǒ)听(tīng)到许多政府的人都在(zài)谈论监管人工智能,而压倒性的感觉是关注(zhù)最糟糕(gāo)的结果,对吗(ma)?
比(bǐ)如在欧洲,来(lái)自英国一位人士在发言,让我印象深刻的是,人们几乎陷入恐慌(huāng),担心最糟糕的事情会发生 ,并且不惜一(yī)切代价想要阻止这种事情发生。但我认为,不利用机会的风险与让坏事发生的风(fēng)险一样大(dà)。
所以我认为,正如开发人员指出的那样,我们需(xū)要找到一种平衡,当我们撰写论文时,我们会在开头列出这些内容(róng)。这些都是(shì)我们工作可能产生的巨大(dà)影响(xiǎng),但我们从不谈论我们的工(gōng)作,可能产生的坏事是什(shén)么。
我们需要诚实和开放,更加公平地对待这个问题,但随后继续强(qiáng)调(diào)这种平衡,并以某种方式防止我(wǒ)们错过机会,我认为由于公众的恐惧,这种(zhǒng)机会很容易发(fā)生。
陈建宇:我觉得人们对这个人形机器人、或者相应的具身智能机(jī)器人技术的担忧,其实(shí)核心来自于对自身 安全(quán)性的(de)一个(gè)担忧。
安(ān)全(quán)其实有几(jǐ)个不同(tóng)的层次,最底层(céng)的层次是物理的安全,大家担心机器人(rén)会不会在工作的时候去伤害到人,那么这是一(yī)个层次;当然其(qí)实在它分情况,那么(me)比如说(shuō)我们刚(gāng)才说的如果是工厂里面的话,其(qí)实如果我们把它跟人工(gōng)作(zuò)环境(jìng)隔开,其实一定程度上能解决这个问题;同时,我们也(yě)需(xū)要从我们的(de)算法硬 件等等上面做(zuò)的(de)更鲁(lǔ)棒来去优化这个问题。
那(nà)么第二个(gè)层次,其实也是(shì)生存(cún)上面(miàn)的问(wèn)题,但是不是说物理层面的,那(nà)么(me)也是不(bù)是说(shuō)全人类的一个担忧,而是说有一部 分人(rén)一个(gè)担忧,他(tā)担心这个会替代咱们的某 一些(xiē)工作,大家会(huì)有担忧,我(wǒ)觉得这个事情(qíng)可能需要(yào)政府或者商号进行有(yǒu)一些引导(dǎo),我们尽量的开始去做(zuò)一些(xiē)确实劳动力非(fēi)常紧缺的这样的(de)一些产(chǎn)业(yè),比如说我(wǒ)们(men)一些非 常恶劣(liè)环境工(gōng)业环境,或(huò)者是(shì)比如说养老(lǎo)等。
当然第(dì)三个层面,如果未来我们的具身智能机器人真正拥有了(le)意识,那么这个(gè)会对人(rén)类的自(zì)我(wǒ)存在的价值可(kě)能产生一些 担忧,我觉得这个事是更远的和(hé)更大的topic。
王(wáng)兴兴:我觉(jué)得机器人的伦理(lǐ)道德和安全性问(wèn)题,是非常(cháng)重要的一件事情,而且我觉(jué)得,要希望是在场所有的人(rén)都(dōu)大家需要共同去维护的一件事情,就有点像现在新能源(yuán)汽车以及无(wú)人驾驶,它其实还是(shì)有很多安(ān)全性问题,并且比(bǐ)如说有一辆早些年新能源汽车起火了(le),或者有一家(jiā)新能源汽车无人驾驶出了交通事(shì)故,这个对整个行业影响是非常大的,会降低普通老百姓对技术行业的认可度以及信(xìn)心。
这个事情很(hěn)容易发生在人(rén)形机器人和(hé)AI这个领域。所以我(wǒ)一直觉得。当(dāng)下以 及未来大家都应该在机器人安全性上(shàng),无论是(shì)出台(tái)一些规章政策(cè),或者做一些更好(hǎo)的引导,或者需要全世界政府(fǔ)出台一些相关的政策,都共同推动整个(gè)行业的健康发展(zhǎn)。
王鹤:所以(yǐ)我就从技术的角度(dù),人形机器人(rén)它的一个(gè)面向终局的技术必然是大模型 ,那么(me)其(qí)实只有(yǒu)大(dà)模型才可能(néng)实现非常高的通用(yòng)性,把很多能力全部汇集在一起,把很多模态,从视觉感知,到语言理解,到动作执行,那么融会贯通(tōng),那么今天我们在技(jì)术上其(qí)实是有方法对大模型的行为(wèi)进行限制,就(jiù)是“对齐”,我们在大模型内部已经进行了深入研究,那(nà)么未(wèi)来,我们会对语言模(mó)型、多模态模型进行更深入的对齐,让它(tā)不(bù)会伤害到我 们的人类,并且他的技能会被局限在服务(wù)的(de)范畴内,那么这一些是我们技术上能做的,在技术上之外,必(bì)然还需(xū)要政(zhèng)府社会和国际的合作。
熊友军:我觉得前面(miàn)几(jǐ)位都说的都挺好的,我就(jiù)补(bǔ)充一点,就是说我觉得应(yīng)该是有一些行业组织或(huò)者是(shì)政府(fǔ)出来,更多在法律法规这方面更多的立法,包(bāo)括更(gèng)多的(de)是(shì)做全社会的机(jī)器人(rén)使用、伦理道德方面的一(yī)些教育。因为我觉得,任何一个机器人也(yě)是一种工具,放在不同人的(de)手上,它的可(kě)能有不同的使用方法,然(rán)后只有加强教育,提升大家对人工智能对人形机器人的使用,让大家相对安全角度去考(kǎo)虑,我觉得才是一个正确(què)的方式。
问:您认为 5 年后人形机器人行业会发展到什(shén)么程度?哪些经(jīng)济领域将率先使用它们(men)?
Marc:不,我认为人(rén)形机器人(rén)的出现让事情变得复杂。我认为(wèi)机器人在工业领域的应用(yòng)将(jiāng)取得很(hěn)大进展。我(wǒ)认为(wèi)机(jī)器人的应用非常广泛(fàn)。人们对此非(fēi)常(cháng)关注。正如大家所说,使机器人变(biàn)得越来越(yuè)好的技(jì)术确实正在(zài)日趋成熟。我 认为(wèi)工业(yè)将继续取得进步。
我认为(wèi)人形机器人本身总体上仍(réng)然非常不(bù)成熟。所(suǒ)以我看不到它们。我知道你可以看看一些人形(xíng)机器人公司与(yǔ)汽车公司合作的演示。我认为这在(zài)某种程度上是一种 炫耀,而不是一种生产力。我不(bù)知(zhī)道这是不是题(tí)外(wài)话。如果(guǒ)你看看仓库机器人,你会发现最大的挑战之一是系统集成,特别是如果它(tā)不(bù)是围绕机(jī)器人设计(jì)的全新(xīn)仓(cāng)库。
我认为许多(duō)仓库机(jī)器人供应商都在(zài)苦苦(kǔ)挣扎,因为他们需(xū)要一个系统集成(chéng)商,而这个系统集成 商会消耗掉(diào)太多的预算,因此很难赚(zhuàn)钱,这是因为运营仓库的 IT 人员并不想开放(fàng)他们的系(xì)统。在那里工作的人并不想改变他们现在做的一切。如果机器人 可(kě)以处理每(měi)一(yī)项任务,那(nà)就意味着他们仍(réng)然需(xū)要一个人来完成(chéng)任务。使用任何类型的(de)机器人(rén)对行(xíng)业(yè)来说都具有很大的复杂性(xìng)。我认为这些(xiē)都是重要因素。
说实话,我(wǒ)原本以为(wèi) Spot 会取得更大的成功(gōng),但 Spot 的推出只是一次实验。我们之所以 设计 Spot,是因(yīn)为它能够(gòu)让你连接自己的传感器,因为我们不知(zhī)道人们想要什么样的传(chuán)感器。我们之所以设计 Spot,是因为它(tā)能够让你对它进行编程(chéng),因(yīn)为我们不(bù)知(zhī)道现在的用户们都有哪些应用程序(xù),而(ér)我们对它们的使用方式有了更多了解,开发人员正专注于巨大机遇,因此 Spot 对人们的接受度确实(shí)产生了影响。
也许如果我们没有足(zú)够的商人,能够提前进入并评估它是(shì)什么,我们实际上(shàng)是在做一个(gè)实验。也许人形机器人会有更好的记录。
王鹤:我觉得我(wǒ)对(duì)人形机器(qì)人的发展总体是(shì)比较乐观的,那(nà)么在未来5年,我们要完 成真正的大规模应用,这件事情对于整个人形机器 人仍然是一个(gè)先慢(màn)后快,其中慢的阶段,那么一个里程碑应该是——在5年的时候我们能达到万台人形机器人级别的应用。
这样的一个市场大约是对标现在商业清洁机器人。我们举个例子,在超市在(zài)万达广场在写(xiě)字(zì)楼(lóu)一层,我们看(kàn)来回(huí)去洗地擦地的机(jī)器人(rén),那 么领先的这个市场,中(zhōng)国(guó)最领先的公司大约是每年出货(huò)1万台,那么他 做的事情不局限做这么简单的事情,它能达 到在各种场(chǎng)景,不管是商超还是写字楼,还是很多不同的场景进(jìn)行清洁,但是当然是平面清洁。
那么,对于我们人形机器人(rén)来说,我们希望能做到(dào)一(yī)个立体操(cāo)作,但是它的能力可能是局(jú)限的,我搬运我就是上货,我就是取货(huò),对吧?
我没有更多的能力,但(dàn)是我也要实现跨场(chǎng)景的应(yīng)用(yòng),可(kě)以(yǐ)在超市里、可以(yǐ)在工厂里、可以在服务(wù)场景等等。那么能(néng)达到5年1万台的市场规模的话,我(wǒ)相信后面有真实世界(jiè)数据的回流,那时,我们会看到人(rén)形机器人应用(yòng)规模会(huì)加快,从慢时代进入快时代。
熊友军:人形机器人我对它的应用可能会更加(jiā)乐(lè)观一(yī)点,其实大家看到这(zhè)两年人形机器人的进步非常 快,尤其在(zài)AI驱动下(xià)面,实际上在市场应用方面,你们(men)已(yǐ)经可以看到国的有一些企业,包括全球企业已经开始在一些场景(jǐng)里面做试点应用了。
比如说在汽(qì)车(chē)厂,比如(rú)在一些商(shāng)用服务(wù)场景,已经开(kāi)始做试点,随着这个(gè)试点数据会形成一个飞轮的(de)效(xiào)应,所以试点进展,然(rán)后它会(huì)有更多的迭(dié)代,然后有更多数据驱动,机器人会在 在一些特(tè)定的环(huán)境里面提高效率,它(tā)的速度,它的随着量的增长,它的价格会(huì)大幅(fú)的降(jiàng)低(dī),这样我(wǒ)觉得(dé)会更快的去促进产业的应用。
我觉得今年年底(dǐ),大家应该可(kě)以看(kàn)到,有一部分的公司(sī)已经能够在一些比如说新能源汽车厂,比(bǐ)如说在一些特种领域(yù)已经开始应用,明年我觉得应该可以看(kàn)到一些可能千台左右量级的出(chū)货。
问:你(nǐ)能在(zài)我们的年轻观众中“点(diǎn)燃一把(bǎ)火”,让他们也想成(chéng)为“机器人专家”吗?他们应该怎(zěn)么做?
Marc:我认为伊隆·马斯克(kè)本人凭借他的雄心和资源,可(kě)能在几年内(nèi)推出10000个(gè)机器人,不一定是因为它们会直接让机器人赚钱,但看看他对电动汽车所做(zuò)的一(yī)切(qiè)。他们从无人相信到现在,我比这(zhè)里的任何人都更加怀疑,包括(kuò)我在内,到每家(jiā)汽车公司都(dōu)有淘汰内燃机的计(j波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”ì)划。
我认(rèn)为这是一件了不起的事情。他似乎对此很认真。所以这在整个人形机器人(rén)领域都是一个真正不确定性(xìng)的因素。我不确(què)定如果他没有抓住机会,是否(fǒu)会有这么多 人(rén)形机器人。
我认为机(jī)器 人玩得(dé)越有趣,人们就越能与它(tā)们互动。我到处走走,我(wǒ)没有带机器人(rén)来(lái)这(zhè)里,但 这里有很多机(jī)器人(rén),但我到处发表演讲,发现机器人在计划 中相当无聊。你总是能吸引一群人,只(zhǐ)要你愿意让(ràng)他们与机器人互(hù)动,他们(men)就会留下来。我(wǒ)认为我们做得越多,公(gōng)众就会越热情。我非常(cháng)欣慰,参加(jiā)这次(cì)活动最令人(rén)兴奋的事情可能是有很多人说(shuō)你做的工作是我十几岁时见过的,现在我正在做(zuò)。我们越(yuè)能展示我们的工作并激励下一代,这就会实现。
陈建宇:我的一个建议是,因(yīn)为机(jī)会其实永远是留给有准备的人,那么像Maec做这个事情做(zuò)了做了好(hǎo)几十(shí)年,然后包括我们其实(shí)台上我们几位也都是多年深耕在机(jī)器(qì)人或者相关领域,所以说,因为(wèi)人形机器人它其实也是一(yī)个非(fēi)常长周期(qī)的事情,同时它也包罗万象,从技术上的(de)软件、硬件、AI再到商业、产品(pǐn)等等(děng),其实各方面都有,所以说大(dà)家应该去问一问自己的(de)内心在(zài)这一步范围内到底自己最有激情,最(zuì)喜欢的最热(rè)爱的是(shì)什么?然(rán)后从此刻开始就去积累它。最后,要么等待未来,要么总有时刻你有施展自己的(de)机会。
王(wáng)兴兴:对于我(wǒ)觉得对于所有年轻人,包括我们其实这个时代都是非常精(jīng)彩(cǎi)的,而且想象一(yī)下(xià),大家也知道(dào)AI、机器人(rén)都是阶梯性发展(zhǎn),就像GPT没有(yǒu)出(chū)来(lái)之前,大家觉得语言模型没什么用,基本上是非常差,但突然就是发生了巨大(dà)进步,非常好,其实机器(qì)人、AI也会遵循这种(zhǒng)规律,所以大家(jiā)现在可能看到机器人的 AI 能力都比较弱,但实际上这(zhè)是好事,为什么(me)?因为大家都有机会(huì)去(qù)做的更好,可以真(zhēn)正的把这种人类目前可以预估的最伟大技术,就在当下,就在未来几(jǐ)年,所以这个(gè)事(shì)情都是非常值得做的,
而且,在机器人和 AI 另外一个比较适合年轻的点,它没(méi)有那么多历史包袱,不像(xiàng)数学领域,有几百上千年的非常天才的数学家,你一定要比他们做得(dé)好,你才可以(yǐ)做技术,但是当下,AI 和机器(qì)人它都非常(cháng)年轻,尤其 AI 技术就最近几年(nián)的东西,所以非常适合年轻人。我一(yī)直(zhí)感觉在如(rú)果在未(wèi)来5年到10年或者几十年回看我(wǒ)们现在(zài)这个时代,所以想想这(zhè)种感觉,真的非常激动人心。
王鹤:我觉得其实未(wèi)来的15年,在我心目(mù)中(zhōng)会是人形机器人,从当下在(zài)产业中没有规模化应用,到可能(néng)成长到跟今天汽车的产量一个万(wàn)亿(yì)市场的过(guò)程。那么在这个过程中,其实对 年轻(qīng)人来说,那么我觉得大(dà)家就是做好自己(jǐ)就可以了,因为15年之后很多工作都是跟人形机器人相(xiāng)关的,今天可能你负责卖(mài)车,那么15年后,你可能岗位就调到卖人形机器人对吧?今天你是班(bān)级里头的佼佼者,那么你学 AI ,那么你(nǐ)可能(néng)发现你的职业生涯就是围绕(rào)着进一步提升人形机器人的能(néng)力展开的,所(suǒ)以大家做好自己,我们一起共(gòng)享光(guāng)明、人形机器人的未来。
熊(xióng)友(yǒu)军(jūn):其实我(wǒ)是(shì)经历过个人(rén)电脑时代,我(wǒ)经历智能手机(jī)时代,我(wǒ)经历(lì)过移动互联网的时代,现在(zài)其实我们正在经历智能汽车(chē)的时代,电动汽车(chē)的时代,我觉得(dé)下一个时代实(shí)际上就是聚生智能(néng)的(de)时代,而(ér)聚生智能时代的(de)典型代表(biǎo)其实就是人性机器人,所以我(wǒ)给现在的年轻人建议(yì)就是说保(bǎo)持野心(xīn),怀揣大梦想。
问(wèn):让(ràng)我们(men)在小组(zǔ)成(chéng)员之间花几分钟时间讨论一(yī)下:你们想(xiǎng)要互相(xiāng)问什(shén)么问(wèn)题?
陈建宇:所 以我想问Marc,你认(rèn)为对于机器人和人工智能来说最重要的 研究问题是什么,例如,如果你只能选(xuǎn)择一个研(yán)究项目,那么你选择哪一个(gè)?
Marc:让(ràng)我从侧(cè)面回答一下,这也是一种回避你的问题的方式。最后我没有展示我的最后一(yī)张幻灯片。我的最后一(yī)张幻灯片是一个展示机器人故障的视频(pín)。它展示了(le),我不(bù)知道它大概有 2 分钟长,可(kě)能有 25 种不同的故(gù)障(zhàng)。我认为故障是工作中(zhōng)最有趣(qù)、最有意思、最有用的(de)部分,关(guān)注它们,然后在你的工作不工作的时候(hòu)继续前进,这真的(de)很重要。这不是研究的主题(tí),但它是一种(zhǒng)工作(zuò)精神。所以如果我要问你们所有人这个问题的话,那就是我还没看到任何人在演讲中提到过事情无法正常运转,而且(qiě)我敢肯(kěn)定,单一机器人不会在不发生(shēng)碰撞的(de)情况下完成那些后空翻以及它们所做的(de)所有很酷的事情(qíng)。你喜欢碰撞吗?
王兴兴:Marc先生,很(hěn)荣(róng)幸今天(tiān)见到您,我其(qí)实想有(yǒu)好奇想(xiǎng)问一下,您觉得对于人形(xíng)机器人的手,您觉得未来几(jǐ)年比较(jiào)合适的有几个手指(zhǐ),或者几个(gè)电机,这会是比(bǐ)较好的一个方向?
Marc:再次,我要回答一个略有(yǒu)不同的(de)问题(tí)。我们研究所最近举办了一场研(yán)讨会,名为“对操(cāo)纵的反(fǎn)向观点”。我认为灵巧性确实很重要,但基本上它并没有取得很大进展,尽(jǐn)管(guǎn)人们至少已经为此努力了 50 年。我认为我们必须(xū)以不同的方式思(sī)考,再次(cì)尝试不同的东西,就像我(wǒ)今天在演讲中开始的那样,也许我(wǒ)们需要(yào)更多的(de)动态操纵,而不是所(suǒ)有的静态抓握(wò)。我认为(wèi)很多学习(xí)界的人在提出他们正在学习的(de)灵巧性的要求(qiú)时对(duì)自己要求不够。他(tā)们做的事情很简单,很容易。
我认为(wèi)那里是有机会的,有多少只(zhǐ)手我不知道有多少根手指。我认为五个已(yǐ)经很多了。但也许有一天我会觉得更有(yǒu)趣的问题是手掌怎么样?我们的手掌功能非常强大,它们不仅仅是静态的(de)块。而且(qiě)你看到的几乎每个机器(qì)人手都有许多(duō)手(shǒu)指在做这件(jiàn)事,但仅此而已。
王鹤:之前我提(tí)到过,大(dà)概 15 年后,世界上会有数百万、一千万个人形机器人。如果人形机器(qì)人(rén)具有通用(yòng)目的(de),那么人形机器人是终(zhōng)极体现,那么这种通(tōng)用目的的终极技术是什么?对于(yú)人类(lèi)噪音,您是否认为视觉、语(yǔ)言、动作模型,这些端到端模(mó)型是人类噪音的终(zhōng)极技术或方法?
Marc:我(wǒ)很难相信,端到(dào)端是取得进步的(de)方法(fǎ)。也许最终在渐近线上端到端是正确 的方法,但(dàn)我认为我(wǒ)们知道的太多了。
说实话,我认为人们(men)过分看重(机器(qì))学习。我知道(dào)应该对学习持乐观态度(dù),但如果你看看当今存在的解决方案,你会发现最(zuì)好的解(jiě)决方案中学(xué)习所起(qǐ)的作用(yòng)微(wēi)不(bù)足道或微不足道。当然,在波士顿动力公司,今天学习很少(shǎo),尽管人们正在(zài)努力。我认为控制系统、控制理论、观察器,这些在过去(qù) 20 或 30 年建立起来的东西仍(réng)然发挥(huī)着巨大的作用(yòng)。
我不想就(jiù)这样把它抛弃。我希望我们能真正拥抱学(xué)习(xí),但要把它与我们已(yǐ)经知(zhī)道(dào)的东西结合起来,找到一种方法(fǎ)把它们结合起来,至少在接(jiē)下来(lái)的5年(nián)或10年里,也许在渐(jiàn)近线上,情况会有所不同。
熊友军:我的一个问题(tí)是,Marc作为波士顿动力的创始人,您之前开发了(le)像Atlas这样的非常令人惊奇的这种产品,但是我们前(qián)不(bù)久我(wǒ)们看(kàn)到波士顿动力终止了这(zhè)个机器的(de)研发,然后由原来的液压驱动,转向纯电驱动的这种方式。对这方面是(shì)出于什么样的考虑?是因(yīn)为成本的考虑,还(hái)是因为出于商业(yè)化(huà)的考虑(lǜ)?同时我还想知(zhī)道,波士顿动力未来5年的一些这种计划,对商业化的一些计(jì)划。
Marc:我认为,如果你问为(wèi)什么要进行转变,我认为(wèi)有两个关键因素:一个是液压机(jī)器人,我喜欢(huān)液压技术,我会用液压技术制造很多(duō)机器人。我认为,建造人形机器人或类似(shì)人形(xíng)机器人(rén)仍有空间,它们(men)将继续使用液压技术(shù),因为重量(liàng)和强度等因素。
但(dàn)我 认为有两点(diǎn)。一是它们很麻烦,至少对于像 Atlas 这样的高性能机器人来(lái)说,尽管我们付出了无尽的(de)努力,也永远(yuǎn)无法让(ràng)它们完全不漏油。当你把石油机器人放到工厂和家里时,它们就不能滴(dī)油;同时,很难找到精通液压技(jì)术(shù)的人(rén),因为人们认(rèn)为这是非常古(gǔ)老的东西,尽(jǐn)管 Atlas 在液压工作原理方面有很多创新,从(cóng)服务器阀门(mén)到(dào) HPU 液压(yā)动力装(zhuāng)置(zhì),一(yī)直都是如此,确实有创新的东西在进行;最后,我认为电动(dòng)汽车在规模上已(yǐ)经足够强大(dà),它们可以参与竞争。我不想(xiǎng)代表波士顿动力发(fā)言,尽管我是创始人之一,并且仍 然是董事(shì)会成员,但(dàn)我认为(wèi)他们必须有(yǒu)自己(jǐ)的计划,说明未来的计划(huà)以及技术的所有细(xì)节(jié)。我想随着事情的发展,你会发(fā)现更多这方面的内容(róng)。
主持人(rén):非(fēi)常感谢。我想观众肯定会有更多问题,也许吧,但我们的时间真(zhēn)的不多了。所以非常感谢各位 小组成员。非常感谢观众的到来和(hé)聆听(tīng)。我认为这是一场非常精(jīng)彩(cǎi)的会议,尤其是小组讨论。我对(duì)组织者(zhě)的建议是,我们明年再举办一次类似(shì)的(de)会议,然后我们可以回顾进展和未来的步骤(zhòu)。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了