波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”
波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”8月24日下午,2024世界(jiè)机器人大(dà)会上,举行(xíng)了(le)一场期待已久(jiǔ)的中国、美国“具身(shēn)智能”与人形机器(qì)人领域学者的(de)“世界对谈”。
大名鼎鼎(dǐng)的“机器狗之父”、美国波士顿动(dòng)力创始人Marc Raibert(马克·雷伯特)首次来到北京(jīng)。他说,“我简直不敢相信,不仅是机器人的数量,难(nán)以置 信(xìn),还有这么多热情的人参加了展(zhǎn)览。中国对(duì)机器人的(de)兴(xīng)奋和热情很高。”
而 此(cǐ)次与Marc对谈的四位CEO所在的公司(sī)也不寻常:除了宇树(shù)科技之外,星动纪元、银河(hé)通用、北京具身智能机器人创(chuàng)新(xīn)中心都成立不足2年,一出道就是具身智能和人形机器人行业的“顶(dǐng)流”。
而且(qiě),星动纪元、银河通用背后也站着 中国最高学府:北大和清华,代表着中国前沿科技创新(xīn)的重要来源(yuán)。
其中(zhōng),星(xīng)动纪元由姚期智带(dài)领的清华(huá)大学交叉信息研究院(yuàn)孵化(huà)成立的,星动纪元创始人陈建(jiàn)宇现在还是清(qīng)华大学交叉信息(xī)研究院助理教授,公司融资超(chāo)亿元,联想(xiǎng)创投已加入其中。
银河通用(yòng)机(jī)器人创始(shǐ)人的王鹤则是北京大学助理教授,也是(shì)北京智源人(rén)工智能研究院具身智能研究中心主任,过(guò)去(qù)半年,银(yín)河通用完成天使轮融资共计7亿元人民(mín)币,刷新了国内人形机器人领域单轮融资规模,美团(tuán)战(zhàn)投、北(běi)汽产投、商汤国香基金、讯飞(fēi)基金、启明创投、蓝驰创(chuàng)投、经纬创投、源码资本、IDG资本等头部财务机构都参(cān)与其中。
而(ér)北京具身智能机器人创新中心则(zé)是(shì)北京(jīng)市发起成立的机器人“国家(jiā)队”机构。北京具身智(zhì)能机器人(rén)创新中心(xīn)总经理熊友军,目前还是(shì)“人形机器人第一(yī)股”优必选科技CTO。
Unitree Robotics(宇树科技)也是当下人形机器人(rén)行业的(de)明星企业。公司创始人、CEO、CTO王兴兴毕业于上海大学,取得了机(jī)械工程硕士,具(jù)有近10多(duō)年足式机器人研发经验,拥有产(chǎn)品从0-1-100的(de)研发与商业化落地能力,100+项(xiàng)机器人相关专利(lì)。
此(cǐ)次圆桌(zhuō)由(yóu)德国慕尼黑工业大学教授 Alois.C.Knoll主持,美国波士顿动(dòng)力创始人Marc Raibert(马克·雷伯特),与中国四大AI机器人企业领军者——陈建宇、王兴(xīng)兴、王鹤、熊友军(jūn),五人(rén)围绕(rào)机器人行业(yè)、AI 大模型驱动机器人发展等议题展开讨(tǎo)论。
一个多小时的圆桌(zhuō)当中,Marc表示,未来5年(nián),机器人(rén)硬(yìng)件发展仍将非常重要,但同时,能够打(dǎ)破语义理解障碍的基础(chǔ)模(mó)型或其他 AI 方法也将对机器人技(jì)术产生(shēng)更大的影响。不过(guò),要想取得机器人领域真正的进步,就需要更高的可靠性和安 全(quán)性,未来人们需要投入大量资源努(nǔ)力解决(jué)此类问题(tí)。
Marc非常(cháng)不看好人形机器人行业。他认为,工业机器人已经非常成(chéng)熟,而且能够商业化,目前人形(xíng)机器人“在某(mǒu)种(zhǒng)程度(dù)上是一种炫(xuàn)耀,而不是一种生产力”。
陈(chén)建宇(yǔ)表示,过去10年AI发(fā)展很(hěn)快,从简单的图像处理,到(dào)深度学习、强化学习,再到ChatGPT技术,这对于未(wèi)来“具身智能”产生很大的(de)影响。未来(lái)几年(nián),AI、具身智能会与人形(xíng)机器人不断融合,去(qù)训练一个通用模型。他相信未来(lái)5年,我们将迎来“机器人的ChatGPT时刻”。
王鹤指(zhǐ)出,当前 AI 大模型在机器(qì)人(rén)上仍有巨大的局(jú)限,尤其是“泛(fàn)化的(de)开瓶盖”技能还没有训练出来,但同时,这也(yě)是(shì)大模型带来了(le)重要机(jī)会,一旦大模型涌现能力不断(duàn)加强,他认为未来5年,依然有一(yī)个至少做(zuò)操作任务的通用机器人(rén)机会。
熊友军表(biǎo)示,当前关节性能提升、高的能量和电池密度的提升非常(cháng)快,使得(dé)机器人的运动控制能力、电机(jī)等(děng)方面提升非常快。未来5年,机器人关节和能量(liàng)密度会持续提升。毕竟和人类相比,现在机器(qì)人的能量执行效率(lǜ)还是有非(fēi)常大的差距。
以 下(xià)是钛媒体 AGI编辑对此次(cì)圆桌全文整理:
问:您能否向观众(zhòng)简单介绍一下您的工作:您为什么以及什么时(shí)候开始对(duì)人形机器人感兴趣的?
Alois:我从 2001 年开始担任慕尼黑大(dà)学的教授。我(wǒ)对人类噪音的一个方(fāng)面产生了(le)兴趣,那就是具象化,对吧(ba)?我的朋友 Pfeiffer 和(hé)我们一起从大学毕业。苏黎世退(tuì)休了,不幸的是,我(wǒ)们坚信(xìn)具象化。所以我们认为,在我们(men)的人类类型中,智力只会在以非常自然的(de)方式与世界相连的人类类型身体中发(fā)展。所以身体应该有同样的动力,同样的尺寸,等等。否则,就很难做到这一点,你在这里看到的 Kronos 系列(liè)机(jī)器人,左(zuǒ)边,左(zuǒ)下角的 Roll Boy2024 就是这种信念的结果 之(zhī)一。
Marc:我认(rèn)为你贴出的那张图片(piàn)对我回答这(zhè)个问题很有帮助。如果人形机器人意味着两只胳膊、两条腿直立向前,那么直到(dào)最近我才对此感 兴趣(qù)。事实上,我一直认为现(xiàn)在的公司注重功能性,作(zuò)为一名(míng)教授,我认为(wèi)功能性才是最重要的,机动性(xìng)、灵巧性、感知力和智能,而外形和外(wài)观则是次要的。另一方面,如果(guǒ)人形机器人(rén)意味着像腿一样的动态生命(mìng),我会(huì)把它(tā)与世界(jiè)互动(dòng)。我一(yī)直(zhí)是人形机器人的粉丝,尽管我建造的(de)第一(yī)个机器人是弹簧单高跷的东西。我认为人形(xíng)机器人的许多基本要素都在那些弹簧单高跷的东西(xī)中。确(què)实,当我们开始建造机器(qì)人时,波士顿动力公司是直立的(de),有两(liǎng)条腿,两只胳膊(bó)。有时领(lǐng)先。如果你看看公众的反应,你会发现 YouTube 点击量增加了 10 倍(bèi),我非常关注这(zhè)些点击量或评论,或者只是人们的态度。人们非常感兴趣。普通的非科(kē)学家,比如说,非工程师,他们对(duì)人(rén)形机器人很感兴趣(qù),而狗惹恼机器人却(què)得不到同样的赞誉。
熊友军:我是从读博士的时候(hòu),2000年开始做机(jī)器人的研发,当时读博士的时候,那时候更多的(de)是做工业(yè)领域、特种领域的一些机器人,用在一些危险的(de)环(huán)境里(lǐ)面,因为那时候机器人技术(shù)还是非常不成(chéng)熟,但在 很多特(tè)种领域和(hé)危险(xiǎn)场景里(lǐ)面,是需要用机(jī)器人去完成工作了,然而(ér)那时候机器智能实际上是(shì)很差(chà)的。所以我们(men)当(dāng)时想的办法,是将机器人(rén)的智能跟(gēn)人的智能结(jié)合起来,所以做了一些机器人(rén)要操(cāo)作的一些事情。
所以(yǐ)当时我们就觉得,如果说有微型(xíng)机器人的话,实际上应该是能够提供(gōng)很好的解决工具,或者一种解决方案,但是我们当时那时候也看到了日本本 田ASIMO,给我们提(tí)供了很多(duō)的(de)一些启发(fā),所以那时候我就对人形机器人非常(cháng)感兴趣。后面毕业之(zhī)后,一直在做机器人(rén)相关(guān)的工作,
2012年,我跟(gēn)优必(bì)选(xuǎn)科技CEO周剑 先(xiān)生(shēng)创立了公司,做人形(xíng)机器人研发工作(zuò),去年从深圳到北(běi)京开始筹建具身智能(néng)机器人创新中心(xīn),现在也是一(yī)直在(zài)聚焦人形机器人方面(miàn)的研(yán)发,主要的想法是希望说能够解(jiě)决(jué)人形机器(qì)人方面的一些共(gòng)性、关键的技术问题,比如本体的一些基础研发不足,其实(shí)我们现在微(wēi)型机器人在本体在关键的核(hé)心器件(jiàn),然后在一些传感(gǎn)器方面(miàn)其实上有非常多(duō)要攻克的地(dì)方。另外(wài)在运(yùn)动控制,实(shí)际上我们(men)也(yě)做了非(fēi)常多的(de)运动控制的技(jì)术研发,采用深度学习(xí)强化学习的这种运动控制(zhì)的方式,包括(kuò)现在也用一些融神经网络的一些方式(shì)用去做(zuò)运动控制,同时其(qí)实我们现在还在做关于智能方面的一些研发,比如说把用现在具身(shēn)智能的(de)方式,做一些基础性工作,比如建它的数(shù)据(jù)集,研发机器人大模型框架等。所以这就是现在我(wǒ)在做的(de)一些(xiē)事情(qíng)。
陈建宇:其实这个兴趣是很小的(de)时候,就一直对智能机器人非常感兴趣,我印象很深刻,刚刚兴(xīng)兴(xīng)说她10岁(suì)的时候,我估计也是差不多类似的时间,不(bù)过(guò)当(dāng)时看(kàn)的不是波士顿动力,当时关注的是ASIMO系列机器(qì)人,当时我就非(fēi)常的去着迷。然后(hòu)我觉(jué)得(dé),创业这件事(shì)其实是充满了挑战性的,marc创办了波士顿动(dòng)力做 了40多年,其实我是非常尊敬的,就(jiù)是说你没有一个发自内心的、天(tiān)生热爱的话,其实很难去坚持下来的。所以对我来(lái)说,对这类机器人的热爱(ài),我(wǒ)觉得某种程度上是从小就具备就拥有的(de)。
那(nà)么真正开(kāi)始做机器(qì)人其实是本科的时候。当时在学校里面,我就接触真正意义上的(de)机器(qì)人的研究,当时接触了(le)双足机器人,主要是做的就 是捕获点步态规划相关的研(yán)究。后(hòu)来,博士阶段继续做机(jī)器人,虽然不是(shì)人形机(jī)器人,但是也是相关的一些机器人的领域,控制它的学习,包括(kuò)无人车和机(jī)械臂。而真正的去全力做人形机(jī)器人,是在我回国之后(hòu),然后(hòu)在现在清华正式(shì)投入去做人形机器人,还孵化了星动纪元公(gōng)司,如(rú)今(jīn)我们(men)已经做(zuò)了(le)最新一代、第六代机器人了,然后我们也在展会(huì)上面带来(lái)了我们(men)机器人的实(shí)物,欢迎大(dà)家去关(guān)注。
王兴兴(xīng):大家好,我是宇树科(kē)技创始人王兴 兴,刚(gāng)才有提到我大概可能10岁的时候就看过marc先生在MIT实验室做(zuò)的双足,还有单条腿的机器人,然后印象非常深,在09年、10年的时(shí)候,大概大一寒假,我就做过一个小的人形机器人,然后当时做的(de)不是特别(bié)满意,然后后来的话,就在研究生期间(jiān)做了XDog这款机器人,差不多(duō)在13年到15 16年,这款机器人的话又采用了比较低成本(běn)的(de)硬件,然后运动性(xìng)能非常好,可以(yǐ)直接实现关节的(de)力控(kòng)以及整机的力控。
后来的话,一开(kāi)始我对(duì)人体机器人的技术还是跟相对来(lái)说比较悲观的,但(dàn)是后来的话在2022年左(zuǒ)右,整个的机器人、AI技术的进步,然后再加上ChatGPT出(chū)来以后(hòu),大家都看到人形机器人和AI结合的可能性,所以说我们公司又重新(xīn)开始做人形(xíng)机器人。说(shuō)实在的,其实我真正感兴趣的并不是说人(rén)形机器人,而是新的一(yī)个智(zhì)能体机器人的形态。而人形机器人(rén)可能只是说目前大(dà)家比较公(gōng)认的、一个最有可能性的通用机器人和通用AI的结(jié)合体(tǐ),但是这可能并不是个(gè)唯一的,我真正希望能(néng)诞生甚至更比人(rén)更 高级的一 个智能体形态(tài),可(kě)以大(dà)大推动整个(gè)人(rén)类工业的变革,推动新的工业革命。
王鹤:我是北京大学计算机学院助理教授,也是北大银河通(tōng)用具身智能联合实验室的 主任王(wáng)鹤,那么,我跟(gēn)人形(xíng)机器人、具身智能结缘,主要是从(cóng)我在斯(sī)坦福大学开始读博的(de)时候。那么2016年的时候,当时深度学习技术已经出来(lái)了(le),也应用在很多图像识别分(fēn)类这些(xiē)任务当中。那么(me)当时作为一(yī)个前沿研究,我们试图去理解人类是如何把感知思考还有交(jiāo)互的能力融合在一(yī)起的。
所以我博士期间的第一个工作,就用一个(gè)视觉模型来看桌面(miàn)上人的动(dòng)作和物体的一个运动,然后推理人下一步想要什么,这(zhè)是一个语言(yán)模型。
最后再用一个简单的(de)机器人,智能的马克杯去响应人(rén)的(de)动作(zuò),那么这个工作获得了欧洲图形学的最(zuì)佳论文提名,但是我们认为它(tā)非常的不足,就是我们的一个(gè)马克杯只能(néng)在 桌面上移动响应人的动作,它没有跟人交互的(de)能力,我们的视觉(jué)只能看(kàn)有限的几一种物(wù)体,那么(me)我们的语(yǔ)言模型只能根据这(zhè)个人(rén)跟这些(xiē)桌面东西的一些动作来(lái)做(zuò)简单的推理。
那么通过过去8年我们的研究(jiū),在(zài)怎么(me)样把机器人的操作能力搞(gǎo)得更(gèng)泛(fàn)化,什么东西(xī)都能抓,都能够放置,那么还有跟(gēn)现在(zài)的多模态大模型技术结合,真的明(míng)白人(rén)类想让你干什么,那么言出法随(suí)的去执行,所(suǒ)以去年我们就孵化了北(běi)京银(yín)河通用这家人形机器人公司,我们现在也是(shì)把视(shì)觉、语言、动作这三种不同的模态(tài)融合到大模型当中,真正的(de)赋能人形机器人,让人形机器人能够走进千行百业、千家万户,这(zhè)是我们的愿景。
问:你认为,我们今天拥(yōng)有的哪些重要技(jì)术是 10 年(nián)前没有的,但对于实用(yòng)的人形机器(qì)人 来(lái)说却至关(guān)重要?它(tā)们在未(wèi)来 5 年将(jiāng)如何(hé)发展?
Marc:我认为硬件开发仍将非常重要。如果我们(men)谈(tán)论未来 5 年,毫无疑问,能够打破语义理解障碍的(de)基础模型(xíng)或其(qí)他人工智能方(fāng)法将产生(shēng)最大的(de)影响。
我(wǒ)认(rèn)为,人类可以做的就是,概括和理解(jiě)他们所看到事物的含义,而目前还无法真(zhēn)正捕捉到这些含义。我相信,如果人工智能能够在这方面取得进展,我认为(wèi)它将产生巨大的(de)影响。
实际上,过去十(shí)年来,每(měi)个人都在计算机、传感器、感知、控制(zhì)等方(fāng)面取得(dé)了巨大进步。电池,我认为人(rén)们忘记了电(diàn)池。虽然电(diàn)池是工业时代的产(chǎn)物,但(dàn)是它们(men)确实(shí)非常重要。是的,所以在电机方(fāng)面过去 5 年里,人们做得很好,我认为电机已经取得(dé)了长足的进步,当然,我们将看到更多。
陈建宇:我从(cóng)AI的视角来讲一讲,觉得非常大的一个不同。如果按照10年前的话,其实是2014年左右,当时是DeepLearning刚刚出(chū)来不久,它(tā)其(qí)实解(jiě)决了很大一部分,比如图(tú)像处(chù)理等等一些问题。
那(nà)么后面(miàn),其实有我认为两(liǎng)个最(zuì)重要的里程碑:一个是以16年阿尔法狗为代表的深度学习,紧接着把它用在了强化学(xué)习上面,做深度强化学习,解决了一些问(wèn)题;第二个是以ChatGPT为代表的大语言模型,所以这点我认(rèn)为是(shì)过去10年没有的,但又(yòu)对未(wèi)来我们人形机(jī)器人(rén),或者是具身 智能起到非(fēi)常(cháng)大(dà)的(de)决(jué)定性作用的两个 因(yīn)素。
那么可能在接下来的这几(jǐ)年时间,这两项技术会(huì)非常深(shēn)度的跟人形机器人(rén)、具身智(zhì)能融合起来,但他们也分别需要经过一定程(chéng)度 的训练,从而(ér)能训练比较通用的一个模型,那么我们也能解决更加丰富的物理世界的数据程(chéng)序。那么我相信(xìn),在接下来的5年(nián),这几项技术都(dōu)能起到(dào)非常大的一个进展,我们(men)可能会在5年内迎来“机器人的ChatGPT时刻”。
王兴(xīng)兴:对过去10年最大(dà)的 ,还是AI技(jì)术带来的各 种事情有更多的信心(xīn)。我觉得除了 AI技术本身最大的点,对于人形(xíng)机器(qì)人,对于整个社会共识的增加也是非常关键的,就是目前大家更加相信AI,更加相信人形机(jī)器人可以诞生更多价值,这在10年(nián)前是完(wán)全不能想象(xiàng)的(de),那时整个社会基本上对此都完(wán)全没(méi)有信心。
另外一(yī)点的话(huà),我觉得在未来5年,总体上是肯定整个 AI 机器人、AI模型变化会非常快,因为目前的AI真的是日新月异(yì),大家可以用AI集成技(jì)术(shù),去搭建各种自己的模型(xíng)去做训(xùn)练,这整个已经变成(chéng)一个非常的扁平化,以及(jí)容易(yì)操作的过程,其实很多人大家都可以参与进来,去做机器(qì)人模型并且去做训练(liàn),所以 我觉得(dé)。未来5年这块(kuài)的各种AI模型(xíng)创新,包括更新的一些神经网(wǎng)络模型,包 括脉冲神经网(wǎng)络等都有很大的一些机会。
王鹤:我觉得10年好快,10年前是2014年(nián),其实我们已经看到inbody的AI,甚至不是一个在西方的(de)学术界比较popular的词汇(huì),那么(me)过去(qù)的(de)十年,我觉得一大技术的进展,就是(shì)我们在具身智能里头已经有(yǒu)一些技能实现(xiàn)了非常强(qiáng)的泛化性。
那么 以我个人的(de)研究(jiū)举例,在抓(zhuā)取问题上,我们取得了比(bǐ)较(jiào)长足(zú)的(de)进步(bù),那么我们(men)从只能抓方块圆的这些特定(dìng)形状的物体,到基于三维视觉传(chuán)感器,我们可以(yǐ)抓不透明、不反光,也就是(shì)在(zài)深度传感器里头能完美成像的这些物体,到(dào)我们最近的技术(shù)能够预测透明、高反光、金属、吸光这些非常(cháng)有挑战材质(zhì)的物体,基于它去做泛化抓取操作。
那么在今天的展厅,我们都接受观众给我(wǒ)们的(de)各(gè)种形状,各(gè)种材质随便堆叠乱七八糟的物体,我们的机(jī)器人都展(zhǎn)示了非常泛化和高成(chéng)功率(lǜ)的抓取能力,那么现在的问题是,像这样的每一个技能,大家都在分分别的去做开发,那么很(hěn)多人(rén)会提(tí)问你能帮我抓水瓶(píng),你能不能帮我把瓶盖给拧开?我非(fēi)常不好(hǎo)意思的说,现在泛化的开瓶盖(gài)技能我们(men)还没有训练出来,这个就是大模型能够(gòu)带(dài)给(gěi)我们的机会,那么大语言模型涌现,也就是这种紧急行为紧急行为,他能够在只见一次(cì)或者是(shì)第一次零次的演示的情况下,他都(dōu)理解你(nǐ)要生成什么样的文(wén)字(zì),我(wǒ)们相信未来的5年给我(wǒ)们的机(jī)会就是发展机器(qì)人基础大模(mó)型,它能够(gòu)实现涌现能力,它吞(tūn)吐足够量的 数(shù)据后,有(yǒu)灵巧手,它能(néng)够抓能(néng)够加、能够拧,能够掰各种基本(běn)的手的各种运动能力都有了以后,他能涌现,我们给他看一(yī)个视(shì)频,他就能理解这个活怎么(me)干,到那个时(shí)候(hòu)我们真正的(de)就有一个通(tōng)用(yòng)的、至少(shǎo)做操作任务的的机器人了,这是我认为(wèi)未来5年的一(yī)个机会。
熊友军:我觉得这一轮的机器人技术的进步主要是由AI来驱动的。毫无疑问, AI驱动我觉得(dé)体现在(zài)几个方面。
第一个就是它人机交互性能得到了极大的提(tí)升。我记得10年前我们做人工智(zhì)能、做机器人的时(shí)候的(de)那(nà)些交互,如果说我要加语音加视觉,第成(chéng)本非常高,第二(èr)个我们要做(zuò)大量的研发(fā)的(de)工作,我们需要几(jǐ)个博士、硕士带着一个团队,花很长的时间才能够完成一些物体识(shí)别、语音合成,自然语(yǔ)言理解(jiě)NLP,还有甚(shèn)至是TTS、语音合成等方面的一些(xiē)工作,甚至包括导航,但是我(wǒ)觉得,现在随着技术(shù)的(de)进步,我们现在做人形(xíng)机器人的大模型,我们直接一个端到端的直接语音给指定给他(tā),然(rán)后很快他就可以有(yǒu)比较好的行为输出,有很好的意图(tú)理解,然后做任务规划等。这是一(yī)方面,我觉得这一(yī)轮对人机交互、对动物的规划、对执行等方面都(dōu)有巨大(dà)提升,在10年前基本上都很难去想象。
然后第二个现在的这(zhè)些硬件方面也有极大的提升,体现在两个方(fāng)向(xiàng),第一个现在关节的性能的提(tí)升是非常快的,大家可以看(kàn)到很(hěn)多公司机器人可以开始去做一些非(fēi)常动态的(de)、剧烈的运动,实际上离(lí)不开关节性能的提(tí)升、高 能量(liàng)密度比,然后(hòu)高的转速、高波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”(gāo)性能等这些技术的提升,实际上,在10年前我觉得(dé)是很 难去做到的。当然了这也(yě)有运动(dòng)控制能力的提升、电机的提升,现在其实(shí)也有采用(yòng)更多结构(gòu)设计的方(fāng)式,更适合它的布局等(děng)方面都有非常大的进步,包括把腿的转成惯量、把电机往上提(tí)等等,有(yǒu)各种各样的结构设计的技术(shù)的变化(huà)。
另外,刚才还提到能量,其实早前我觉得10年前我(wǒ)们做机器人的时候,一个电池(chí)就像我们背后要背一个非(fēi)常巨大的电池包能源包,而且能 够持续的时间很短。但(dàn)是这几年随着(zhe)新能源汽车对电池(chí)技术的推动作用(yòng),其实(shí)我们看到它(tā)的(de)电池能量密度大幅提升,我现在一个比较小的电池,可以支持比较长(zhǎng)的时间,我觉得这是(shì)一个非常重(zhòng)要的(de)技术突破。
未来,我觉得5年之后,这几个可能还是(shì)一个重(zhòng)大、要突破的方向(xiàng),像刚才说的(de)人机交互方面,我们希望大模型(xíng)能提供更长期的任务规划,然后做意图理解等等方面,我觉(jué)得我们能只要给他一个非常模糊的指令 ,他就可以给我们输出我们很标准的很自然(rán)的这种交互的(de)结果。第(dì)二方面,可能就(jiù)是在规(guī)划实施(shī)任务(wù)方面是一个非常(cháng)重大、要攻克的方向,我们(men)环境会(huì)经常(cháng)变,面对的是一个动态(tài)环境(jìng),然后(hòu)机器人能够根据环境变(biàn)化,能够实时去改变它的一些执行策略(lüè)等。当然,像(xiàng)能量方面我觉得是一个持续(xù)要提升的,它毕竟现在能量(liàng)执行效率和我们人相(xiāng)比,还(hái)是有非常大的一个差距。
问:大(dà)规模(mó)部(bù)署人形机器人需要完成哪些(xiē)任务?
Marc:但(dàn)是(shì)如果你现在从更宏观的角度来看,我刚才说了如果你想(xiǎng)致富(fù)你现在就不会着手开公司,但是如(rú)果你想生存下(xià)去。你至(zhì)少也得收支平衡。
我想这是一个更长远(yuǎn)的计划,我认为要想取得真正的(de)进步,你必须暂停,或者我不是说你必须(xū)暂停 ,我们在我的研究所暂停,让机器人更可靠(kào)的本地(dì)目标将是一(yī)件关键(jiàn)的事(shì)情,如果(guǒ)我能指出(chū)旧金(jīn)山的自动驾驶汽车(chē),他们杀死了一个(gè)人,这实际上甚至不是自动驾驶汽车的坠落。然后克鲁兹完全退出了旧金山。我知道现在还有很多事情在进行,但(dàn)这在(zài)机器人领域很容易发生。因此,可靠性是一个关(guān)键(jiàn)因素,这是人们(men)投入大量资源努力解决的(de)问题之一。但(dàn)这无助(zhù)于解决,将我们带(dài)入下一代的更大问(wèn)题。当我(wǒ)说(shuō)我不认为每个人都必(bì)须专(zhuān)注于(yú)你(nǐ)所说的真正(zhèng)有(yǒu)用的东(dōng)西时。
陈建宇:要做到大规模应用的(de)话,有(yǒu)非常重要两个事情(qíng):一个是能不能找(zhǎo)到(dào)大规模的(de)需求,另一个能不能有(yǒu)我(wǒ)们技术,足够去实现、满足需求。
其实现在有很多零散(sàn)的表演需求(qiú),如果需要真的(de)达到max(大规模)的话,我觉得主要还是看劳动(dòng)力,非常密(mì)集的一些产业,比(bǐ)如三个阶(jiē)段,一个是工(gōng)业、商用和服务(wù)。
大体我认为,技术(shù)也(yě)基本上是(shì)按照这样一个方向去成熟发展(zhǎn),其(qí)中我觉得给我的感受,我认为(wèi)工(gōng)业的话(huà)可能会比较快就能够(gòu)去(qù)用(yòng)上(shàng)了。其实刚才Marc的报告中里面也已经展现出(chū)来(lái)了,不管是人形,还是一些轮式的机器(qì)人,在工厂搬运(yùn)的这一类的环境里面,已经是(shì)达到(dào)了(le)非常接近人(rén)类(lèi)的一个节点,那么在未来(lái),它可能会更快更强大,然后以及成本更低,达到(dào)这个时候的话,其实它的第一个大规(guī)模应用的点就(jiù)到了(le)。
王(wáng)鹤:我觉 得具身(shēn)智能今天不能讲完全成熟,但是我们今天GPT能力搭配人形机器人,其实已经(jīng)能够在很多(duō)场合干事情了。
像(xiàng)我们今天在展台展示了就(jiù)是在一(yī)个零(líng)售的(de)场景,那(nà)么用户(hù)可以下 单,我(wǒ)们(men)的机器人可以根据你的具体下单的内容,是拿一个冰红茶,还是拿一个巧克力,那么我们从货架把它取下(xià)来,同时我(wǒ)们也可以从地面的篮子里头把这些货不断的上到货(huò)架上,我们也可(kě)以从更大的一个仓储(chǔ)的料架(jià)上,抱着一箱东西放到传送带上。
这(zhè)些场景其实(shí)都(dōu)展示了,目前(qián)具身智能对(duì)于(yú)比较糙的活,就是抓取放置和双手抱持这样的(de)能力已经走(zǒu)向成熟。
在这(zhè)种情况下,我们还要问(wèn)一个问题,为什么是这个(gè)人形对吧?有很多人现场问我,你们为什么(me)要(yào)做成人形?因为你想(xiǎng)如果货架上的一个商品掉在地上了,我的机器人得有能力去够地面这么低的东西,我的(de)货(huò)架可能两米高,我要(yào)能够抓到两米(mǐ)那么(me)高的东西,同时我(wǒ)还能还得来回走动,还要得(dé)有(yǒu)两只手才能抱住一(yī)个箱子,又有两(liǎng)只(zhǐ)手又能高又能低又能够来回走,那么(me)它基本上就把形态往人基本上非常(cháng)的靠拢了,那么我们目前用(yòng)的(de)是(shì)一个轮式底(dǐ)盘,没有腿,那么也已经达到这样(yàng)的一个能力了。那么我们认为像这样的抓取放置(zhì)搬运的能力(lì),在很多行业,比如说(shuō)零(líng)售,比如说工厂(chǎng),比(bǐ)如说一些(xiē)服务的场景全都可以用起来。
所以我判断,人形机器人的大规模(mó)应用,2025年、2026年我们将见到从百台级到千台级的一个快速(sù)的增长,
王兴兴:我个人的话,总体(tǐ)来说,对(duì)目前整个人形机器人应用落地还是(shì)需要一些时间,但当下,包括今年和明(míng)年(nián)对一些简单场景,像特斯拉场景里面把一个电池(chí)从什么地方装到(dào)什(shén)么(me)地(dì)方里(lǐ)面(miàn),这种简单(dān)的,用模仿(fǎng)学习能做的事情,目前的(de)AI技术其实成功率(lǜ)还是做的比(bǐ)较高了,今年或(huò)明年可以做一些(xiē)应用,包括把整个的GPT速度也提升。
但(dàn)是我觉得,真正要提升人(rén)形机器人(rén)大规模应用,确实还(hái)需要更多(duō)的时间,把机器人的模型本身(shēn)做得更(gèng)好(hǎo)一点,让它(tā)更通用,基本上无论是更精细化的或者更泛用心的一些事情都可以做一起来(lái),所以(yǐ)我还(hái)是希望社(shè)会大众对AI和机器人能更多一些耐心。但实际上可能中国其实还是有很多人(rén)比较心急的,我觉得还是大家可以(yǐ)再(zài)多给(gěi)一(yī)点耐心。谢谢(xiè)。
熊(xióng)友军(jūn):我觉得人形经济和大规模的应(yīng)用,其实上(shàng)这个就涉及到(dào)一个商业化场景选择的问题(tí),实际上,并不是说现在人形机器人不(bù)能够应 用,而是 说要再看什么场景。我(wǒ)觉得在有一些刚需的场景,或者对人不可达到的这种场景,还是(shì)有一些可以用的,尤其是这种刚(gāng)性需求的,比如抢(qiǎng)险救灾,特种的对核辐射,或者是说有毒有害气体环境等等,这些我觉(jué)得现在(zài)实际上是可以用的。
大家其实想的更多是,技术怎么去提升,然后怎么它能够让人(rén)形机器人能够(gòu)快(kuài)速(sù)适应(yīng)更多的场景,然后把成本快速的降下来,只有这样通(tōng)过一(yī)方面通过技术的提(tí)升,提高有更多工作效率,让人有更好的体验感,然(rán)后更多人愿意(yì)用它(tā)。
第二方面(miàn),就是把成本继续往下降,我觉得让大家更买得起,这个我觉得要是(shì)要想的这个方式。
另外(wài)我觉得还有一种,就是商业模式(shì)上的探索,实际上人形机器人是我觉得(dé)是一个集大成者,它基本上(shàng)涵盖了机器人和人工智能的绝大部分(fēn)的技术领域,然后在人体技术上(shàng)的研究能够(gòu)大大的推 进这些技术的成熟(shú),然后技术甚至(zhì)技术的市场化,我们可以采用(yòng)“沿途下蛋”方式获得这(zhè)个商业的利(lì)润。通过这些其他的一些技术,人形(xíng)机器(qì)人(rén)产品上孵化的其他技术商业(yè)化、产业化来(lái)推动人形机器人研究(jiū)。一个典型的例子,就是我们现在有一些人形机器人公司已经在其(qí)他产品上实现(xiàn)盈利,然后已经实现了一个很好(hǎo)的商 业化,这我觉得是一种非常好的模式。
问:作(zuò)为技术人员,我们是否(fǒu)意识到有很多机器人都有道德伦理方面的顾(gù)虑——我们如(rú)何才能消除这些顾虑?
Marc:我(wǒ)认为,从最高层面来说,理(lǐ)解所有技术都涉及一些风险和(hé)机遇是很重要的。我参加了一个政府会议,但我听到许多政府的(de)人都在(zài)谈论监(jiān)管人工智能,而压倒(dào)性的感觉(jué)是关(guān)注最 糟糕的结果,对吗?
比如在欧洲(zhōu),来自英(yīng)国一(yī)位人士在发言,让我印象(xiàng)深刻的是,人们几乎陷入恐慌,担心最糟糕的事情会发生(shēng),并且不惜一切代价(jià)想要阻(zǔ)止这种事情发生。但我(wǒ)认为,不(bù)利用(yòng)机会的风险与让坏事(shì)发生的风险一样大。
所以我(wǒ)认为,正(zhèng)如开发人(rén)员(yuán)指(zhǐ)出的那样,我们需要找到一种平衡(héng),当我们撰写论文(wén)时,我们会(huì)在开头列出这些内容(róng)。这些都是我们工作可能产生的巨(jù)大影响,但我们从不谈(tán)论我们的工作(zuò),可(kě)能(néng)产生(shēng)的坏事是什么。
我们需要诚实和开放,更加公平地对待这个问(wèn)题,但随后继 续强调(diào)这种(zhǒng)平衡,并以某(mǒu)种方式防(fáng)止我们错过(guò)机会,我认为由于公众的恐惧,这(zhè)种机会很容易发生。
陈(chén)建宇:我觉得(dé)人们(men)对这(zhè)个人形机器人、或者相应的具身(shēn)智能机器人技术的担忧,其实 核心来自于对自身安全性的一个担忧(yōu)。
安全其(qí)实有几个不同的层次,最底层的层次是(shì)物理的安全,大家担心机器人会不会在工作的时候(hòu)去伤害到人,那么(me)这是一个层次;当然其实在它分情(qíng)况 ,那么比如说我们刚才说(shuō)的如果 是工厂里面的(de)话,其实如果我们把(bǎ)它跟人工(gōng)作环境隔(gé)开,其(qí)实一定程度上(shàng)能解决(jué)这个问题;同(tóng)时(shí),我们也需(xū)要从我(wǒ)们的算法硬件等等上面做的更鲁棒来(lái)去优化这个问题。
那么第二个层(céng)次,其实也是(shì)生存上面的问题,但是不是说物理层面的,那么也是不是说全人类的一个担忧,而(ér)是说有一部分人一个担忧(yōu),他担心这(zhè)个(gè)会替代咱们的某一(yī)些工作,大家会(huì)有担忧,我觉得这个事情可能需要政府或者(zhě)商号进行(xíng)有一些引(yǐn)导,我们(men)尽量的开始去做一(yī)些(xiē)确实(shí)劳动力非常紧缺的这样的(de)一些产业(yè),比如(rú)说我们(men)一些非常恶劣环境工业环境,或者是比如说养(yǎng)老等。
当(dāng)然第三个层面(miàn),如果未来我们(men)的具身(shēn)智能机(jī)器人真正拥有了意识,那么这(zhè)个会对人(rén)类的自我存在的价值可能产生一些担忧,我(wǒ)觉得这个事是更(gèng)远的和更大的topic。
王兴兴:我觉得机器人的(de)伦理(lǐ)道德和安全性问题,是非常重要的一件事情,而且我觉得,要希望是在场所有的人都大家需(xū)要共同去维护的(de)一件事情,就有(yǒu)点像现在新能源汽车以及无人(rén)驾(jià)驶,它其实还是有很(hěn)多安全性问题,并且比如(rú)说有一辆早些年新能源汽车(chē)起火了,或者有一(yī)家新能源汽车无人(rén)驾驶出了交通事故,这(zhè)个对整个行业影响是非常大的(de),会降(jiàng)低普通老百姓对技术行(xíng)业(yè)的认可度以及信心。
这个事(shì)情很(hěn)容易发生(shēng)在人形机器人(rén)和AI这个领(lǐng)域。所以我一直觉得。当(dāng)下以及未来大家(jiā)都应该在机器人安全性上,无论是出台一些(xiē)规(guī)章政策,或者做一些更好的引(yǐn)导,或者需要全世界政府出(chū)台(tái)一些相关(guān)的政策,都共同推动整(zhěng)个行业(yè)的健康(kāng)发展。
王鹤:所以(yǐ)我就从技术的(de)角度,人形机器人它的一个面向终局的(de)技术(shù)必然(rán)是大模型,那么其实只有(yǒu)大模型才可能实(shí)现非常高的通用性,把很多能力全部汇集在一起(qǐ),把很多模(mó)态,从视觉感知,到语言理解(jiě),到动作执行,那么融会贯通,那么今天我们(men)在技术上其实是有方(fāng)法对大模型(xíng)的行为进行限制,就是“对齐”,我们在大模型内(nèi)部已经进行了深入研究,那么未来(lái),我们会对语言模型、多模态模型(xíng)进行更深入的对齐,让它不会伤害(hài)到我们的(de)人类,并且他的技能会被局限在服务的范畴内,那么这一些是我们技术上能做(zuò)的,在技术上之(zhī)外,必然(rán)还需(xū)要政府社会和国际的合作(zuò)。
熊(xióng)友军:我觉得前面几位都说的都挺(tǐng)好的,我(wǒ)就补充一点,就是说我(wǒ)觉得应该是有(yǒu)一些行业组织或(huò)者是(shì)政府出(chū)来,更多在法律法规这方面更多的立法,包括更多(duō)的(de)是做全(quán)社会的机器人使用、伦(lún)理道德方面的一些(xiē)教育(yù)。因为我觉得,任何一个机器人也是一(yī)种工具,放在不同人的(de)手上,它的可能有不同的使用方法,然后只有加强教育,提升(shēng)大家(jiā)对人工(gōng)智能对人形机 器人的(de)使用(yòng),让大家相对安(ān)全角度去考虑,我觉(jué)得(dé)才是一个(gè)正确的方 式。
问:您认为 5 年后人形 机器人行业(yè)会(huì)发展到什么程度?哪些经(jīng)济领域将率先使用(yòng)它们(men)?
Marc:不,我认(rèn)为人形机器人的出现让事(shì)情变得复杂。我认为机器人在(zài)工业领域的应(yīng)用将取得很(hěn)大进展。我认为(wèi)机器人的应用非常广(guǎng)泛。人们对(duì)此非常关注。正如大家(jiā)所说(shuō),使机器人变得越来越好的技术(shù)确实正在日趋成熟。我认为工业将继续取(qǔ)得进步。
我认为 人形机器人本身总体(tǐ)上仍(réng)然非常(cháng)不成熟(shú)。所以我看不到它们。我知道你可以看看一些人形机器人公司与汽车公司合作的演示。我认为(wèi)这在(zài)某(mǒu)种程度上是一种炫耀,而不是一种生产(chǎn)力。我不知道这是(shì)不是题外话。如果你看看(kàn)仓库机器人,你会(huì)发现最(zuì)大的挑战之一是系(xì)统集(jí)成,特别是(shì)如果它不是围(wéi)绕机器人设计的(de)全新仓(cāng)库。
我认为许多(duō)仓库机器人供应商都在苦苦(kǔ)挣扎,因(yīn)为他们(men)需要(yào)一个系统集成商,而这个系统集成商会消耗掉太多的预算,因此很难(nán)赚钱,这是因为运(yùn)营仓库的 IT 人员并不想开放他们的系统。在那里工(gōng)作的人并不想改(gǎi)变他们现在做的一切。如果机(jī)器人可以处理每一项任务,那就意味着他们仍然需要一个人来完成任务(wù)。使用任何类型的机器人对行业来(lái)说(shuō)都具有很(hěn)大的复杂性。我认为这些都(dōu)是重要因素。
说实话,我原本以为 Spot 会取得更(gèng)大的成功 ,但 Spot 的推出只是一次实验。我们之所以设计 Spot,是因为它能够让你连接自己的传感(gǎn)器,因为我(wǒ)们不知道(dào)人们想要什么样的传感器。我们之所以设计 Spot,是因为它(tā)能够(gòu)让你对它进行编程,因为我们不知道现在的用户们都(dōu)有(yǒu)哪(nǎ)些应用程序,而我们对它们的使用方式 有了更多了解,开(kāi)发人员(yuán)正专注于巨大机遇(yù),因此 Spot 对人(rén)们的接受度确实产 生了影(yǐng)响。
也许如果(guǒ)我们没有(yǒu)足够的商人,能够提前进入并评估它是什么(me),我们实(shí)际上(shàng)是在做一个实验。也(yě)许人形机器人会有更好的记录。
王鹤:我觉得我对人形机器人的发展总体是比较乐观的,那么(me)在未来5年,我们要完成真正的大规模应用,这件 事情对于(yú)整个人形机器人仍然(rán)是一个先(xiān)慢后快,其中(zhōng)慢的阶段,那么一(yī)个里(lǐ)程碑应该(gāi)是——在5年(nián)的时候(hòu)我(wǒ)们能达到万台人形机器人级别的(de)应(yīng)用。
这样的一个市场大约是对标现在商业清洁机器人。我(wǒ)们举个例子,在超市(shì)在万达(dá)广场在写字楼一层(céng),我们看来回去(qù)洗地擦(cā)地的机器人,那么领先的(de)这个市(shì)场,中国最领先的公司大约是每年出货1万台,那(nà)么他做的事(shì)情不局限做这么简单的事情,它能(néng)达到在各种(zhǒng)场景,不管是商超还是写字楼,还是(shì)很(hěn)多不同的(de)场景进行清洁,但(dàn)是当然是平面清洁。
那(nà)么,对于我们(men)人(rén)形(xíng)机器人来说,我们希望能做到一个立(lì)体操作(zuò),但是(shì)它的能力可能是局限的,我搬(bān)运我就是上货,我就是取货,对(duì)吧?
我没有更多的能力,但是我也要(yào)实现跨场景的(de)应用,可以在超市里(lǐ)、可以在工厂里、可以在服务场景(jǐng)等等。那么能达到5年1万台(tái)的市场规模的(de)话,我相信后面有真实(shí)世界数据的回(huí)流,那时,我们会(huì)看到人形机器(qì)人应用规模会加快,从慢时代进入快时代。
熊友军:人形机 器人我对它的应用可能(néng)会更加乐(lè)观一点,其实(shí)大家看到这两年人形机器(qì)人 的进步非(fēi)常快,尤其在(zài)AI驱动下面,实(shí)际上在市场应用方面,你(nǐ)们已经可以看到国的(de)有一(yī)些(xiē)企业(yè),包括全球企业已经(jīng)开始在一些场景(jǐng)里面做试点应用(yòng)了。
比如说在汽车厂,比如在一些商用服务(wù)场景,已经开(kāi)始做试点,随着(zhe)这(zhè)个试点数据会(huì)形成一个飞(fēi)轮的效应,所(suǒ)以试点进展,然后它会有更(gèng)多的迭代,然后有更(gèng)多数据(jù)驱动,机器人(rén)会在在(zài)一些(xiē)特定的环境里面提高效率,它的速度(dù),它的随(suí)着量的增长,它(tā)的价(jià)格(gé)会大幅的降(jiàng)低(dī),这样我觉(jué)得会更快的去促(cù)进(jìn)产业的应用。
我觉得今年年(nián)底,大家应该可以看到,有一(yī)部分的公司已经能够在一些(xiē)比如说新能源汽车厂,比如 说在一些特种领域已经开始应用,明年我觉得应该可以看到一(yī)些可能千台左右量级的出货。
问:你能在我(wǒ)们的年轻观众中“点燃一把火”,让他们也想成为“机器人专家”吗?他们(men)应该怎(zěn)么做?
Marc:我认为伊隆·马斯克本人凭借他(tā)的(de)雄心和资源,可能在几年内推出10000个机器人,不一(yī)定是因(yīn)为它(tā)们会直接让机器人赚(zhuàn)钱,但看看他对电动汽车所做(zuò)的一(yī)切(qiè)。他们从无人 相信到现在,我比这里的任何人都更加(jiā)怀疑(yí),包括我在内,到每家(jiā)汽车公司都(dōu)有(yǒu)淘汰内燃机的计划。
我认(rèn)为这是一(yī)件了不起的事情(qíng)。他似(shì)乎对此很认真。所以这在整个人形机器人领域都是一(yī)个真正不确定性的因素。我不确定(dìng)如果他没有(yǒu)抓住机会,是(shì)否(fǒu)会有这么多人形机器人。
我认为机器人玩得越有趣,人们就越(yuè)能与它(tā)们互动。我到处走走(zǒu),我没有带机器(qì)人来这里,但这(zhè)里有很多机器人,但我到处发表演讲,发现机器人在计划中相当(dāng)无聊。你总是能吸引一群人,只(zhǐ)要你愿意让他们(men)与机(jī)器人互动,他 们就会留下来。我认为我们做得越多,公(gōng)众就会越热情(qíng)。我非常欣(xīn)慰,参(cān)加这(zhè)次活动最令人兴奋的事情可能(néng)是有很多人说(shuō)你做的工作是(shì)我十几岁时见过的,现(xiàn)在我正在做。我们(men)越能(néng)展示我们的工作并激励下一代,这就会实现。
陈建宇:我(wǒ)的一个建议是,因为机(jī)会其实永远(yuǎn)是留给有准备的(de)人,那么像Maec做这个事情(qíng)做了做了好几(jǐ)十年,然后(hòu)包(bāo)括(kuò)我 们其实台上我们(men)几位(wèi)也(yě)都是多年深耕在机(jī)器人或者相(xiāng)关领(lǐng)域,所以说,因为人形机(jī)器人它(tā)其实也是(shì)一个非(fēi)常长周期的事情,同时它也包罗万象(xiàng),从(cóng)技术上的软件、硬件、AI再到(dào)商业、产品(pǐn)等等,其实各方面都有,所以说大(dà)家应该去问一问自己的内心在这一步范围内到底自己最有激情,最喜欢的最热爱的是什么?然后从此刻开始就去积累它。最后,要(yào)么等待未来,要(yào)么总有时(shí)刻(kè)你有施展自己的机会。
王(wáng)兴兴:对于我觉得对于所有年(nián)轻(qīng)人,包括(kuò)我们其实(shí)这个时代都是非常精彩(cǎi)的,而且想象一下,大家也知道AI、机器人都是阶梯性发展,就像GPT没有(yǒu)出来之前,大家觉得语言模型没什么用,基本上(shàng)是(shì)非常差,但突然就是发生(shēng)了巨大进步(bù),非常好,其(qí)实机器人、AI也会遵循这种(zhǒng)规律,所以大家现在可能 看到机器人的 AI 能力都比较弱,但实际上这是好事,为什么?因为大家都有机(jī)会去做的更好,可以真正的把(bǎ)这种(zhǒng)人类目前(qián)可以预(yù)估的最伟(wěi)大技术,就在(zài)当下,就在(zài)未来几年,所以这个事情都是非(fēi)常值得做的,
而(ér)且,在机器人(rén)和 AI 另外 一个比较适合年轻(qīng)的点,它没有(yǒu)那么多历史包袱,不像(xiàng)数学领域(yù),有几(jǐ)百上千年的(de)非常天才的数学家,你一定要比他们做得好,你才可以做技术,但是当下(xià),AI 和机器人(rén)它都非常年轻,尤其 AI 技术就最近(jìn)几年的东西,所以非常适合年(nián)轻人。我一直感觉在如果在未来5年到10年(nián)或者几十(shí)年(nián)回看我们现(xiàn)在这个时代,所以想(xiǎng)想这种感觉,真的非(fēi)常激动(dòng)人心。
王鹤:我觉得其 实未来的15年,在我心目中会是人形机器(qì)人,从当下在(zài)产(chǎn)业中没有规模化应 用(yòng),到可能(néng)成长到跟今(jīn)天汽车的产量一个万亿市场(chǎng)的过程。那(nà)么在这个过程中,其实(shí)对(duì)年轻人来说,那么我觉得大家就是做(zuò)好自己就可以了,因为15年之后很多工作都是跟人形机器(qì)人相关的,今天可能你负(fù)责卖车(chē),那么(me)15年后,你可能岗(gǎng)位就(jiù)调到卖人形机(jī)器人对吧?今天你是班级里头的佼(jiǎo)佼者(zhě),那么你(nǐ)学 AI ,那么(me)你可(kě)能发现(xiàn)你的职业生涯就是围绕着进一步提升人形机器人(rén)的能力展开的,所以大(dà)家做好自己,我们一起共享(xiǎng)光明(míng)、人形(xíng)机器人的(de)未来。
熊友军:其实我是(shì)经历过个人电(diàn)脑时代,我(wǒ)经历(lì)智能手机时代,我(wǒ)经历过(guò)移(yí)动互联网的时代(dài),现在其实我们正在经历智能汽车的(de)时代,电(diàn)动(dòng)汽车的时代,我觉得下一个(gè)时代实际上就是聚生(shēng)智(zhì)能的时代,而聚生智能时代的典型代表其实就是人性机器人,所(suǒ)以(yǐ)我(wǒ)给现在的年(nián)轻人建(jiàn)议就是说保持(chí)野心,怀揣大梦想。
问:让(ràng)我们在小组成(chéng)员之间(jiān)花几分钟时间讨论 一(yī)下:你们想要互相问什么问题?
陈建宇:所以我想(xiǎng)问Marc,你(nǐ)认为对于机(jī)器人和(hé)人工智能来说最 重要的研究问题是什么,例如,如果 你只能选择一个研究(jiū)项目(mù),那么你选择(zé)哪一个?
Marc:让我从侧面回答一下,这(zhè)也是一种回避你的问题(tí)的(de)方式。最后我没(méi)有展示我的最后一张(zhāng)幻灯片。我的最后一(yī)张幻(huàn)灯片是一个(gè)展示机器人故障的(de)视频。它(tā)展示(shì)了,我不知道它大概有 2 分钟长,可(kě)能有 25 种不同的(de)故障。我认为故障是工作中最有趣、最(zuì)有意思、最有用的部分,关注(zhù)它们,然后在你的工作不工(gōng)作的时(shí)候继续前进(jìn),这真(zhēn)的很重要(yào)。这不是研(yán)究的主(zhǔ)题,但它(tā)是(shì)一种工作精神。所(suǒ)以(yǐ)如果我要问你们所有人这个问题的话(huà),那就是我还没看到任何人在演讲中提(tí)到过事(shì)情无法正常运转,而且我敢肯定,单一(yī)机器人不会在不发生碰撞的(de)情况下完成那些后空翻(fān)以及(jí)它们所(suǒ)做的所有很酷的事情。你喜欢碰撞吗?
王(wáng)兴(xīng)兴:Marc先生,很荣幸今天见到您,我其实想有好奇想问一下,您觉得对于人形机器人的手,您觉得未(wèi)来几年比较合适的有几个手指(zhǐ),或者几个电机,这会是比较好的一个方向(xiàng)?
Marc:再次(cì),我(wǒ)要回(huí)答一个略有不同的问题。我们研究所最近举办了一场研讨会,名为“对操纵的反(fǎn)向观点”。我认为灵巧性确(què)实很重要,但基本上 它并没有取得很大进展,尽管人(rén)们至少已经为此努(nǔ)力(lì)了 50 年。我认为我们(men)必须(xū)以不同的方(fāng)式思考,再次尝试不同的(de)东西,就像我今天在演讲中开始的那样,也(yě)许我们需要更(gèng)多的动态操纵,而不(bù)是所有的静态抓握。我认为很多学习界的人在提出他们正在学习的灵巧性(xìng)的要求时对自己要求不够。他们做的事情很(hěn)简单,很容易。
我认为那里是有机会(huì)的,有多少只手我不(bù)知道(dào)有多少根手指。我认为(wèi)五个已经很多了。但也(yě)许有一天我(wǒ)会觉得更有趣的问题是手掌(zhǎng)怎么样?我们的手掌功能非(fēi)常强大,它们不仅仅(jǐn)是静态的(de)块。而且你看到(dào)的几乎每个机器人手都有许多手指在做这件事,但(dàn)仅此而已(yǐ)。
王鹤:之前我提到过,大概 15 年后,世界上会有数百万、一千万(wàn)个人形机器人。如果人形机(jī)器(qì)人具有通用目的,那么人(rén)形机器人是终极体现,那么这种(zhǒng)通用目(mù)的(de)的终(zhōng)极技术是什么?对于人类噪音,您是否认为视觉、语言、动作模型,这些端到端模型(xíng)是人类噪(zào)音的终极技(jì)术或方法?
Marc:我很难相信,端到端是取得进步的方法。也许(xǔ)最终在渐近(jìn)线(xiàn)上端到(dào)端是正确(què)的方法,但我认(rèn)为我们知(zhī)道的太多了。
说实话,我认为人们过分看重(机器(qì))学习。我(wǒ)知道应(yīng)该对(duì)学习持乐观态度,但如果你看看当今存在(zài)的解决(jué)方案,你会发现最好的解(jiě)决(jué)方案中学习所起的作用微不足道或微不足道(dào)。当然,在波(bō)士顿动力公司,今天学习很少,尽管人们正在(zài)努力。我认为控制系统(tǒng)、控制理论、观察(chá)器,这些在过去 20 或 30 年建立起来(lái)的(de)东西仍然发(fā)挥着巨大的作用。
我不想(xiǎng)就这样把它抛弃。我 希望 我们能真(zhēn)正拥(yōng)抱学习,但要把它与我们已经知道的东西结合(hé)起(qǐ)来,找到一种方法把它们结合起来,至少在接下来的(de)5年(nián)或10年(nián)里,也许在渐近线(xiàn)上,情况会有所不同。
熊友军:我的一个(gè)问(wèn)题是,Marc作为波士顿动力的创始人,您之前开发(fā)了像Atlas这样(yàng)的非常令人惊奇(qí)的这种产品(pǐn),但是我们(men)前不久我们看到波士顿动力终 止(zhǐ)了这个机器的研发,然后由原来的(de)液压驱动,转向(xiàng)纯电(diàn)驱(qū)动的这(zhè)种方式。对这方面是出于什么样的考虑?是因为成本的考虑,还是因为出(chū)于商业化(huà)的考虑?同(tóng)时我还想知道,波士顿动力未来5年的一些这种计(jì)划,对商业化的一些计划。
Marc:我认为,如果你问为什(shén)么要进行转变(biàn),我认为有两个关键因素:一个是液压机器人(rén),我喜欢液压技术,我会用液压技术制造很多机器人。我认为,建(jiàn)造(zào)人形机器人或类似人形机器(qì)人仍有空(kōng)间,它们将继续使用(yòng)液压技术,因为重量和强度等因素。
但我认为有两点(diǎn)。一是它们很麻(má)烦,至(zhì)少(shǎo)对于像 Atlas 这样的高性能机器人来说,尽管我们付出了无尽的(de)努力,也永远无法让它们(men)完全不(bù)漏油。当你把石油机器人放到工厂和家里(lǐ)时,它们就不能滴油;同时,很难找(zhǎo)到精通液压技术的人,因为人们认为(wèi)这是非常古老的东西,尽管 Atlas 在液压工作(zuò)原理方面有很多创新,从服务器阀门到 HPU 液压动力装(zhuāng)置,一直都是如此,确实有创新波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”的(de)东西在进行(xíng);最后,我(wǒ)认为电动汽车在规模上已经(jīng)足够(gòu)强大,它们可以 参与竞争。我不想代表波士顿动力(lì)发言,尽管我是创始(shǐ)人之一,并且(qiě)仍然是董事会成员,但我认为他们必须有自己的计划(huà),说明未来的计划以及技术的所有细节。我(wǒ)想随着事情的发(fā)展,你会发现更多这方面的(de)内容。
主持人(rén):非常(cháng)感谢。我想观众肯定会有更多问题,也许吧,但我们的时间真的不(bù)多了。所以非常感谢各位小(xiǎo)组成(chéng)员。非常感谢观众的到来和聆听。我认(rèn)为这是一场非常精(jīng)彩的会议,尤其是小组讨(tǎo)论。我对组织者的建议是,我们明年再(zài)举办一次类似的会(huì)议(yì),然后(hòu)我们可以回顾进展和未来的步骤。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了