高峰:从私域AI到具身智能
专题:2024中国AIGC创新发展论坛
2024年服贸会专题论(lùn)坛之一——“2024中国(guó)AIGC创新发展论坛”于9月13日-14日在北京举行。智子(zi)引擎产(chǎn)品(pǐn)副总裁高峰出席并演讲。
高峰介绍(shào),和大(dà)多数大模型企业一样,过去一年,智子引擎在垂直(zhí)领域中做了很多(duō)落(luò)地项(xiàng)目,但经过内(nèi)部复盘(pán),发(fā)现很多多(duō)模(mó)态大模型的能力其实还没(méi)有被企业充分利(lì)用。传统企(qǐ)业和我们AI大模型(xíng)公司之间,似乎隔着一层“窗户纸”。因此,公司决定走一条艰难但 有(yǒu)效的路,这条路就是私域AI。“我(wǒ)们重新思考,企业(yè)与(yǔ)AI公司的关系不应该是供需关系(xì),而应(yīng)是共创关系”。
“积跬步,行千里”,高峰(fēng)说,开发私域(yù)AI解决方(fāng)案(àn)的过(guò)程,也(yě)是在帮助Awaker逐步认识和理解世(shì)界。“我相信,当我们积累到一定(dìng)程(chéng)度时,先进的生产力将会爆 发,而那时我们就可以进行更为先进的通用层面的(de)整合。那将是一(yī)个(gè)新的时机,作为一个(gè)技术创新型企(qǐ)业,我们更多的是(shì)把自己定位在(zài)创新领域,推动AI给产业的赋能”。
以下为演讲实录:
高峰:尊敬的各位来宾,大家好!非(fēi)常荣幸能代表智子引擎科(kē)技有限公司分享我们的科研成果,今天我演讲的主题是《从(cóng)私域AI到具(jù)身智能》。
首(shǒu)先,我想(xiǎng)谈谈过去一年我们所做(zuò)的(de)工作。和大多数大模型企业一(yī)样,我(wǒ)们在垂直领域中做了很多落地项目,但经过我们内部的(de)复盘(pán),发现很多多模态大模型的能力其实还没有被企业充分利用。传(chuán)统企业和我们AI大模型公司之间,似乎(hū)隔(gé)着(zhe)一层“窗户纸”。因此,我们(men)决定走一(yī)条艰难但有效的(de)路,这条路就是私域AI。我们重新思考,企业与AI公司的关系不应(yīng)该是供(gōng)需关系,而应是 共创关系。
接下来,我将从(cóng)四个(gè)方面展开我的分享(xiǎng)。首先,请 允许(xǔ)我简单介绍一(yī)下(xià)我们公司(sī)。
智子引擎科技有(yǒu)限公司的科研人员主要来自中国人民大学高瓴人工智(zhì)能学院,我们的(de)核心团队曾参与智源研究院的悟道(dào)·文澜项目。我们研发了国产首个(gè)国产(chǎn)多模态(tài)大模型。
接下来介绍一下我们的“孩子”——Awaker,中文名叫(jiào)觉醒者。我们(men)希(xī)望Awaker能像人(rén)的大(dà)脑一样进行思考决策,赋(fù)予企业流水线和机器以生命。Awaker可以像(xiàng)普通(tōng)人(rén)一样思考,也可以像领域(yù)专家或技术工人一样思考。它由三(sān)部分能力组成:对话能力、检索能力和生成能力。你可以从拟人化的角度来理解它,它能够对 话,能(néng)够感知外部环(huán)境,但这种感知基于数据(jù)进行。Awaker还能生(shēng)成我们需(xū)要的一些指令,涵盖(gài)感知、理解(jiě)、决策、规划和控制(zhì)。这(zhè)些能力可以应用于有形的硬件(jiàn),比如四足机器人或两足机器人,也可以应用于无形的系统,比如程序大脑、企业大(dà)脑,甚(shèn)至(zhì)私人(rén)管(guǎn)家。重点在于Awaker如(rú)何感知、理解、决策、规划并最终实现控制(zhì)。
感知可以通(tōng)过语言交(jiāo)流(liú),也可以通(tōng)过声音传感器接收音频信(xìn)号,当然还包括温度、湿度等(děng)复杂的传感器(qì)。Awaker通过多模态数据融合(hé)理解外界信息,基于(yú)之前学习的知识进行(xíng)决策和规划。如果(guǒ)是在硬件上,它可以控制机(jī)械臂;如果是在软件系统中 ,它(tā)可(kě)以控制(zhì)API,执行(xíng)各种(zhǒng)操(cāo)作。
这就是我们所谓的(de)“多模(mó)态输入、多模态输出”架构(PPT图示)。输入形式是多模态(tài)的,比如文本问答、图片问答、声音问答。在(zài)专(zhuān)业(yè)领域,还包括通过传(chuán)感器采(cǎi)集的数据。Awaker通过多模态融合(hé)理解这些数据后,能(néng)进行决策、规划和控(kòng)制。
前面提到的(de)共(gòng)创(chuàng)关(guān)系,意味着企业不只是提(tí)供(gōng)数据,而是提供学习素材。大模(mó)型通过(guò)学习这些素材得到(dào)只是。大模型出(chū)厂时,可能就像一个(gè)有强烈求知欲望的(de)孩子(zi),但如果没有(yǒu)学习材(cái)料,它仍只是一个普通的孩子。我们(men)和企业共创,打造先进的生产工具(jù)。私域AI为企(qǐ)业提供的不仅(jǐn)是降本增效,更是提升核心竞(jìng)争(zhēng)力的关键。
接下来,我讲一个实际案例——无人机巡检。传统无人机通过摄(shè)像头、激光雷达等传感器采集农场数据,传输到(dào)大模型(xíng)数据分析中(zhōng)心,检测农作物是否异常。如果异常,传统小模(mó)型会直接发出警告。而Awaker具备农业领域的知识(shí),它不仅能识别病虫害,还(hái)能生成一整套解(jiě)决方案,告诉维修人员需(xū)要用什么(me)农药、喷洒多少、具体喷 洒位置,并通过API下发工单给相关人员。如果配备了喷洒农药的(de)无人机,Awaker可以直接生成报告(gào),并(bìng)下发任(rèn)务(wù),自动规划喷洒路径(jìng)并执行作业。
这套框架还可应用于(yú)搜(sōu)救任务,如无人机通过传感器感知受灾区域并(bìng)生成救援路径 。
第二个例子,我们先(xiān)看一段(duàn)视频。
(现场播放视频)
通过这个视(shì)频大家可以(yǐ)看到,企(qǐ)业内部的(de)系统大多是通过(guò)点击功能模块来进行操作的(de)。而在AI时代,我们提前预置了指令。大模型能够理解自然语言,在刚才演示的变电站(zhàn)案例中,控制的最小动作其实(shí)是通过API来(lái)实现的。用户发出的自然语言指令被系(xì)统理解为中文(wén),之后与原(yuán)子动作相关的API进行匹配,并最终输出结果 。对于大模型来说(shuō),这没有什(shén)么神秘之处,关键在于企业需要为大(dà)模型提供学(xué)习材料,比如相关的知(zhī)识文档。大模型能够自主 学习 这些内容,从而提升其能(néng)力。
接下来谈一下我们的(de)未(wèi)来规划。我们希望与传统企业(yè)共创(chuàng),走私域AI解决方案这条路。虽(suī)然过程中可能会遇到很多不 确定性(xìng),但先进(jìn)的生产力和(hé)优秀的解决方案,往往是在双(shuāng)方紧密合作中 迸发出来的。如果仅仅是供需关系,企业可能只会将(jiāng)自己认知范围(wéi)内的问题交给大模(mó)型处理,但真正有效的合作(zuò)是要让大模型参与(yǔ)到企业的(de)核心生(shēng)产流程中,重塑(sù)整个流水线和生产(chǎn)环境。如果结合云边(biān)协同,整个大模型将变得更(gèng)加强大,因为(wèi)城市中的摄像头、巡逻车、无人(rén)机等都会成(chéng)为大模型的传(chuán)感器,城市中各个单位的工作职责和路线关系都可能因此发(fā)生变(biàn)化。
“积跬步,行千里”,我(wǒ)们开发私域AI解决方案的过程,也是在帮助Awaker逐步(bù)认识和(hé)理解世界。我相信,当我们积累到一定(dìng)程度时(shí),先进的生产力(lì)将会爆发(fā),而那时我们就可以进行更为先进(jìn)的通用(yòng)层(céng)面的整合。那将(jiāng)是一个新的时机,作为一个技术创新型企业,我们更多的是把自己定位(wèi)在创新领域,推(tuī)动(dòng)AI给产业的赋(fù)能。
最后(hòu),我真诚期望有更多的合作伙伴加入到我们的AI事业中,与我们(men)共同打造新质生产力,推动先进流水线的(de)发(fā)展。我的分享到此结束,感谢(xiè)大家的聆听。
新浪声明:所有会议实录均为现场(chǎng)速记整理,未经演讲者(zhě)审阅(yuè),新浪(làng)网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
责任编辑:梁斌 SF055
未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了