橘子百科-橘子都知道橘子百科-橘子都知道

高峰:从私域AI到具身智能

高峰:从私域AI到具身智能

专题:2024中国AIGC创新发展论坛

  2024年服(fú)贸会专题论坛之一——“2024中国AIGC高峰:从私域AI到具身智能创(chuàng)新(xīn)发展论坛”于9月13日-14日在(zài)北京举行。智子(zi)引(yǐn)擎产品(pǐn)副总裁高峰出席并演讲(jiǎng)。

  高峰(fēng)介绍,和大多数大模型企业一(yī)样(yàng),过去一年,智子引(yǐn)擎(qíng)在垂直领域中做了很(hěn)多落(luò)地项目,但经过内部复盘,发现很多多模态大模型(xíng)的能力其实还没(méi)有被企业充分利(lì)用。传统(tǒng)企业和(hé)我们AI大模型公司之间,似乎隔着一层“窗户纸”。因此,公司决定走一条艰(jiān)难但(dàn)有效的路,这条路就是私域AI。“我们重(zhòng)新思考,企业(yè)与AI公司的关系(xì)不应该是供需关系,而应是共创关系”。

  “积跬步,行(xíng)千里”,高峰说(shuō),开发私域AI解决方案的过程,也是在帮助Awaker逐(zhú)步认识和理解世界。“我相信,当(dāng)我们积累到一定程度时,先进的生产力将会爆发,而那时我们 就可以进行更为先进的通用层面的整合。那将是(shì)一个新的时机,作(zuò)为一个技术创新型企业(yè),我们更(gèng)多的是把(bǎ)自己定位在创新领域,推动(dòng)AI给产(chǎn)业的赋能”。

  以下为演讲实(shí)录:

  高峰:尊敬的各位(wèi)来宾,大(dà)家好!非常荣幸能代表智子引(yǐn)擎科技有限公司分享我们的科(kē)研成(chéng)果,今天我演讲的(de)主题是《从私域AI到具身智能》。

  首先(xiān),我想谈谈过去一年我们所做的工(gōng)作。和大多数(shù)大模型企业一样,我们(men)在(zài)垂直(zhí)领域中做了很(hěn)多(duō)落地项目,但经过(guò)我们内(nèi)部(bù)的复(fù)盘,发现很多多模态大模型的能力其实还没有被(bèi)企业(yè)充分(fēn)利用。传统企业和我们AI大模型公司(sī)之间,似乎隔着一层(céng)“窗户纸”。因此,我们(men)决定走一条艰难但有效(xiào)的(de)路,这条路就是私域AI。我们重(zhòng)新思考,企业与AI公司的关系不应(yīng)该是供(gōng)需关系,而应是共(gòng)创关系。

  接下(xià)来,我将从四个方面展开我的分享。首先,请允许我简单介绍一下我们公(gōng)司(sī)。

  智子引擎科(kē)技有(yǒu)限公司的科研人(rén)员主要来自中国(guó)人(rén)民大学高瓴(líng)人 工智能学院,我们的核(hé)心团队曾参与智源研究院的悟道·文澜项目。我(wǒ)们研发了国产首个国产多模态大模型。

  接下来介绍高峰:从私域AI到具身智能一下我们 的“孩子”——Awaker,中(zhōng)文名叫觉醒(xǐng)者。我(wǒ)们希望Awaker能像人的大脑一样进行思考决策,赋予企业流水线和机器以生命。Awaker可以像普通人(rén)一样思(sī)考,也可以像领域专家或技术工(gōng)人一样思考 。它由三部分能力组成:对话能力、检索能力和生成能力。你可以从拟人化的角度来理解它,它能够对话,能够感(gǎn)知外部(bù)环境,但这种感知基于数(shù)据进行。Awaker还(hái)能生成我们需要的一些指(zhǐ)令(lìng),涵盖感知、理解、决策、规划和控制(zhì)。这些能力可(kě)以应用于有形的硬件,比如四足机器人或两足机器人,也可以应用于无(wú)形的系统,比如程(chéng)序大(dà)脑、企业大脑,甚至私人管家(jiā)。重点在于(yú)Awaker如何感知、理解、决策、规(guī)划并最(zuì)终(zhōng)实现控制(zhì)。

  感知可以通过语言(yán)交流,也可以通过声音传感器接收(shōu)音(yīn)频信号,当然还包括温度、湿度等复杂的(de)传感器。Awaker通过多模态数据融合理解外界信息(xī),基于之前学习的知识进行决(jué)策和规(guī)划。如果是在硬(yìng)件上(shàng),它可以控(kòng)制机械臂;如(rú)果是在(zài)软(ruǎn)件系统中,它可(kě)以控制API,执行各种操作。

  这就是我们所谓的“多模态输入(rù)、多(duō)模态输出”架构(PPT图示)。输入形式是多模态的,比(bǐ)如文本问答、图片问答、声音(yīn)问答。在专业领域,还包括通过传感器(qì)采集的数据。Awaker通过多模态融合理(lǐ)解这些数据后,能(néng)进行决策、规划和控制。

  前面提到的共创关系,意味着企业(yè)不只是提供数据,而(ér)是提供学习素材。大模(mó)型通过学习这(zhè)些(xiē)素材得到只(zhǐ)是。大模(mó)型出厂时,可能就像一个有强烈求(qiú)知欲望的孩子,但如果没有学习材料,它(tā)仍只是一个普通的孩子。我们和企业(yè)共(gòng)创,打造(zào)先进的生产 工具。私域AI为企业提供的不仅是降本增效,更是 提升核心(xīn)竞争力的关键。

  接下来,我讲一个实际案(àn)例——无人机巡检。传统无人机通过摄像头、激光雷达等传感器(qì)采集农(nóng)场(chǎng)数据,传输到大模型数据分析中心,检测农作物是否异常。如(rú)果异常,传统小模型会(huì)直接发出警告。而Awaker具备农业领域(yù)的知识,它不(bù)仅能识别病虫害,还能生成一(yī)整(zhěng)套解决方案,告诉维修人员需要用什么(me)农药(yào)、喷洒多少(shǎo)、具体喷洒位置(zhì),并(bìng)通过API下发工单给相关人员。如果配备了喷洒农药的无人机,Awaker可以直(zhí)接生成报告,并下发任 务,自动规划喷洒(sǎ)路径并执(zhí)行作业。

  这套框(kuāng)架还可应用于搜救任务(wù),如无 人机通(tōng)过传感器感知受(shòu)灾区域并生成救援路径。

  第二个例子,我们先(xiān)看一段视频。

  (现场播放视频)

  通过(guò)这 个视频大家可以(yǐ)看到,企业内部的系统大多是通过点击功能模块来进行(xíng)操作的。而在AI时代,我们提前预置了指(zhǐ)令。大模型能够(gòu)理解自然语言,在刚才演示的变电站案例中,控(kòng)制的(de)最小动作其实是通过API来实现的。用户发出的自然语言指令(lìng)被系(xì)统理解为中文,之后与原子动作相关(guān)的API进(jìn)行匹(pǐ)配,并最终输出结果。对于大模型来说,这没有什(shén)么神秘之处,关键在于(yú)企(qǐ)业需要为大模型提供(gōng)学习 材料,比(bǐ)如相关的知识文(wén)档。大模(mó)型能够自主学习这些(xiē)内容(róng),从而提升其能力。

  接下来谈一下我们的未来规划。我们希望与 传(chuán)统企业共创,走(zǒu)私域AI解决方案(àn)这条路。虽然过程中可能会遇到很多不确(què)定性,但先进的生(shēng)产力(lì)和优秀(xiù)高峰:从私域AI到具身智能的 解决方案,往往是在(zài)双方紧密合作中迸发出(chū)来的 。如果仅仅是供需关系,企业可能只会将(jiāng)自(zì)己(jǐ)认知范围(wéi)内的问题交给大模型处理,但真正有效(xiào)的合(hé)作是(shì)要让大模型参与到企(qǐ)业的核心生产流程中,重塑整个流水线和生(shēng)产环境。如果(guǒ)结合云边协同,整个大模型将变得更加强(qiáng)大,因为城市中(zhōng)的 摄像头、巡逻(luó)车、无人机等都会成为大模型的传感器,城市中各个 单位的工(gōng)作(zuò)职责(zé)和路线关系都可(kě)能因此发生(shēng)变化。

  “积跬步,行(xíng)千里”,我们开(kāi)发私域AI解(jiě)决方案的过程,也是在帮助Awaker逐步认识和(hé)理解世界。我相信,当我们积累(lèi)到一定程度时,先进的生产(chǎn)力将会爆(bào)发,而那时我们就可以进行更为先进(jìn)的通用层面的整合。那将是一个新的时机,作为一个技术创新型企(qǐ)业,我们更多(duō)的是把自己定位在(zài)创新领域(yù),推动AI给产(chǎn)业(yè)的赋(fù)能(néng)。

  最后,我真诚期(qī)望有更多的合作(zuò)伙伴加入到我们(men)的AI事业中,与我们共同打造新质(zhì)生产力,推动先进流水线的发展。我的 分享到此结束,感谢大家的聆听。

  新(xīn)浪声明:所有会议实(shí)录均为现场速记整理,未经(jīng)演讲者审阅,新浪网(wǎng)登载此文出于传递更多信息之目的 ,并不意味着赞同其(qí)观点或证实其描述。

责任编辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能

评论

5+2=