橘子百科-橘子都知道橘子百科-橘子都知道

高峰:从私域AI到具身智能

高峰:从私域AI到具身智能

专题:2024中国AIGC创新发展论坛

  2024年服贸会(huì)专题论坛之一——“2024中国AIGC创新(xīn)发展论坛”于(yú)9月13日-14日在北京(jīng)举行。智(zhì)子引擎产(chǎn)品副总裁高峰出席并演(yǎn)讲。

  高峰介绍,和大多数大模型(xíng)企业一样,过去一年,智子(zi)引擎在垂直领(lǐng)域中做了很(hěn)多(duō)落地项目(mù),但经过(guò)内部复盘,发现很多多模态大模型的能(néng)力其实还没有被企业充分(fēn)利用。传统企 业和我们AI大模型公(gōng)司之间,似乎隔着一层“窗户纸”。因此(cǐ),公司决定走一条艰 难但有效的路,这条路就是私域AI。“我们重新思考,企业与(yǔ)AI公司的关系不应该是供需关系(xì),而应是共创(chuàng)关系”。

  “积跬步 ,行千里”,高峰说,开(kāi)发私域AI解决 方(fāng)案的过(guò)程,也(yě)是在帮助Awaker逐(zhú)步认识和(hé)理解世(shì)界(jiè)。“我 相信,当我们积累到一定程(chéng)度时,先进的(de)生产力将会爆发,而那时我们就可以进行更为先进的通用层面的整(zhěng)合。那将是一个新的时机,作为一(yī)个(gè)技术创新型(xíng)企业,我(wǒ)们(men)更(gèng)多的是(shì)把自己定位在创新领(lǐng)域,推动AI给产业的赋能(néng)”。

  以下为(wèi)演 讲(jiǎng)实录:

  高(gāo)峰:尊敬的各位(wèi)来宾(bīn),大(dà)家好!非常荣幸能代表智子引擎科(kē)技有限公(gōng)司分享(xiǎng)我们的科(kē)研(yán)成果,今天我演讲的主题是(shì)《从私域AI到具身智能》。

  首先,我想谈谈过(guò)去一年我们(men)所做的(de)工(gōng)作。和(hé)大多数大模型企业一样,我们(men)在垂直(zhí)领域中做了很多落地项目,但经过我们内部的复盘(pán),发(fā)现 很多多模态大模型的能力其实还没(méi)有(yǒu)被(bèi)企业充分利用。传统企业(yè)和我们AI大模型公司之 间,似乎隔着(zhe)一层“窗户纸”。因此,我们决(jué)定走一条艰难但有效(xiào)的路,这条路就是私域AI。我们重新思考,企业与AI公司的关系不(bù)应该(gā高峰:从私域AI到具身智能i)是(shì)供需(xū)关系,而应是共创关系。

  接下来,我将从四个方面展开我的分享(xiǎng)。首先,请允许我简(jiǎn)单介绍一下我们公司。

  智子(zi)引擎科技有限公(gōng)司 的科研人(rén)员主 要来自中(zhōng)国人民大学高瓴(líng)人工智能学院(yuàn),我们的核(hé)心团(tuán)队(duì)曾参(cān)与智源研究院的悟(wù)道·文澜项目。我们研发了国产首(shǒu)个国产多(duō)模态大模型。

  接下来(lái)介绍一下我 们的“孩子”——Awaker,中文名叫觉(jué)醒者(zhě)。我们希望Awaker能像人的(de)大脑(nǎo)一样进行 思考决(jué)策,赋予企业流水线(xiàn)和机器(qì)以生命(mìng)。Awaker可以像普通人一样思考,也可以像领域专家或技(jì)术工人一样思考(kǎo)。它(tā)由三部分(fēn)能力组成:对话能力、检索能力和生成(chéng)能力。你可以从拟人化的 角度来理解它,它能够对 话,能够感 知外(wài)部环境,但这种感(gǎn)知基于数据进行。Awaker还能生成我们需要的一些指令,涵盖感知、理解、决策、规划和控制。这些能力可以应(yīng)用于有形的硬件,比如四足机器人或两足机(jī)器人,也可以应用(yòng)于(yú)无形的系统,比如程(chéng)序大脑、企业大脑,甚至私人管家。重点在于Awaker如(rú)何感知、理解、决策、规(guī)划并(bìng)最(zuì)终实现控制。

  感知可以通(tōng)过语(yǔ)言交流,也可(kě)以通过声音传(chuán)感器接收音频信号(hào),当然还包括温度、湿 度等复杂的传(chuán)感器。Awaker通(tōng)过多模(mó)态数据融合理解外界信息,基于之前学习的知识进行决策(cè)和规划。如果是在(zài)硬件上(shàng),它可(kě)以控制(zhì)机械臂;如(rú)果是(shì)在软件(jiàn)系统中,它可以控制API,执行各种操作。

  这就是我(wǒ)们所(suǒ)谓的“多模态输入(rù)、多模态输出”架构(PPT图示)。输入形式是多模态的,比如文本问答、图片问答、声音问答。在专业(yè)领(lǐng)域,还包括通(tōng)过传感器采集的数据。Awaker通过多模态融合理解这些数据(jù)后,能进行(xíng)决策、规划(huà)和控(kòng)制(zhì)。

  前面提到的共创关系,意味着企业不只是(shì)提供数据,而是提供学习(xí)素材(cái)。大模(mó)型通过学习这些素材得到只是。大模型出厂(chǎng)时,可能就像一个有强烈求知欲望的孩子,但如果没有学习(xí)材料,它仍只是 一个普(pǔ)通的孩子(zi)。我们和(hé)企业共创(chuàng),打造先进的生(shēng)产工具。私域AI为企业提供的不仅是降本增效,更是提升核 心竞争(zhēng)力的关(guān)键。

  接下来(lái),我讲一个实际案例——无人机 巡检。传统无(wú)人机通过摄像头(tóu)、激光雷达(dá)等传(chuán)感器采集农场数据,传输到大模型数据分析中心,检测农作物是否异常。如果异常,传(chuán)统小模型会直接发出警告。而(ér)Awaker具备农业领域的(de)知(zhī)识,它(tā)不仅能识别病虫害,还能生成一整套解决方案,告诉维修 人员需要用什么农药、喷洒多少(shǎo)、具体喷洒位置,并(bìng)通过(guò)API下发工单给相关人员。如果配备了喷洒农(nóng)药的无人机(jī),Awaker可以(yǐ)直接生成报告(gào),并下发任务(wù),自动(dòng)规划喷洒路径并执行作业。

  这套框架还可应用(yòng)于搜救(jiù)任务,如无人机(jī)通过(guò)传感器感知受灾区域并生成救援路径。

  第二个(gè)例子,我们(men)先(xiān)看一段视频。

  (现场播放 视频)

  通过这个视频大(dà)家可以看到,企业内部的系统(tǒng)大多是通过点击功能模块来进(jìn)行操作的。而在AI时代,我们提前预(yù)置了指(zhǐ)令(lìng)。大模型能够(gòu)理解自然语言,在刚才演示的变(biàn)电站(zhàn)案例(lì)中(zhōng),控制的最小动作其实是通过API来实现的。用户(hù)发出的自然语言指令被系统理解为(wèi)中文,之(zhī)后与原子动作相关的API进行(xíng)匹配(pèi),并最终输出结果。对于大模型来说,这(zhè)没(méi)有(yǒu)什么神秘之处,关(guān)键(jiàn)在于 企业需要(yào)为大模型提供学习材料,比如相关的知识(shí)文档。大(dà)模型能(néng)够自主学习这些内容,从而提升其能力(lì)。

  接下来谈一下我(wǒ)们的未(wèi)来(lái)规划。我们希望与传统企业共创,走私域(yù)AI解决方(fāng)案这条路。虽然过程中可能会遇到(dào)很多不确定性,但先进(jìn)的生产力和(hé)优秀的解决方案,往往是在双方(fāng)紧密 合作中迸发出来的(de)。如果仅仅是供需关系,企业可能只会(huì)将自(zì)己认知范围内的问(wèn)题交给大模型处理,但真正有效(xiào)的合作是要让大模型(xíng)参与(yǔ)到企业的核心生产 流程中,重(zhòng)塑整个流水线和生产环境。如果结合云边协(xié)同,整个 大模型将变得更加强大,因为城(chéng)市中的摄像头、巡逻车、无人(rén)机等都(dōu)会成 为大模型的传(chuán)感器,城市中各个单位(wèi)的工作职责和路线关(guān)系都可能 因此发生变化。

  “积跬步,行千里”,我们(men)开(kāi)发私域AI解决方案的过程,也(yě)是在帮助Awaker逐步认(rèn)识和理解世(shì)界。我相信 ,当我们积累到一定程度时,先进的生产(chǎn)力将会爆(bào)发,而那时我(wǒ)们就(jiù)可以(yǐ)进行更为先进的通(tōng)用(yòng)层面的整合(hé)。那(nà)将是一个(gè)新的时机,作为一个技术(shù)创新型企(qǐ)业(yè),我们更多的是把自己定位在(zài)创(chuàng)新领域,推动AI给产业的赋(fù)能。

  最后,我真诚期望有(yǒu)更多的合作伙伴加入到(dào)我(wǒ)们的AI事业中,与我们共同打造(zào)新质(zhì)生产力,推动先进流水(shuǐ)线的发(fā)展。我的分享到此结束,感谢大家的聆听。

  新(xīn)浪声明:所有会议实录均为现场速(sù)记整理(lǐ),未经(jīng)演(yǎn)讲者审阅,新浪网登(dēng)载此文出(chū)于传递(dì)更多 信息之目的,并不意味着赞(高峰:从私域AI到具身智能zàn)同其观点或证实其描述(shù)。

责任编辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能

评论

5+2=