高峰:从私域AI到具身智能
专题:2024中(zhōng)国(guó)AIGC创新发展(zhǎn)论坛
2024年服(fú)贸会专(zhuān)题论坛之一——“2024中(zhōng)国AIGC创新发展论坛”于(yú)9月13日-14日在(zài)北京举(jǔ)行。智子引擎产品(pǐn)副总裁高峰出席并演讲(jiǎng)。
高峰介绍,和大多数大模(mó)型企业 一样,过去一年,智子(zi)引擎在垂直领域中做了很多落地项目,但经过内部复盘,发现很多多模态(tài)大模型的能(néng)力其(qí)实(shí)还没有被企(qǐ)业充分(fēn)利用。传统(tǒng)企业和我们(men)AI大模型(xíng)公司之间,似乎隔着一层“窗户纸”。因此,公司决定走一条艰难但有效的路,这条路就是私(sī)域(yù)AI。“我们重(zhòng)新思考,企业与AI公司的关系不应该(gāi)是供需关系,而应是共创关系”。
“积跬步,行千里”,高峰(fēng)说,开发私域AI解决方案的过程,也是在帮助Awaker逐步(bù)认(rèn)识和理解 世界。“我相(xiāng)信,当我们积累到一定程(chéng)度时,先进(jìn)的生产力将会爆发,而那时我们就可以进行更为先进的通用层(céng)面的整合。那将是一个新的时机,作为一个技(jì)术创新型企业,我们更多(duō)的是把自己定位在创新领域(yù),推动AI给产业的(de)赋能(néng)”。
以下(xià)为(wèi)演讲实录:
高峰:尊敬(jìng)的各位来宾,大家好!非常荣幸(xìng)能代表智子引擎科技有(yǒu)限公(gōng)司(sī)分享我们的科研(yán)成果,今天(tiān)我演讲的主题是《从私域AI到具身智能》。
首先,我想谈(tán)谈过去(qù)一年我们(men)所做的工作。和大 多数大模型企(qǐ)业一样(yàng),我们在(zài)垂直领域(yù)中做了(le)很 多(duō)落地项目,但经过我们内部的复盘,发现很多多模态 大模型的能(néng)力(lì)其实还没有被企(qǐ)业(yè)充分利用。传统企业和 我们(men)AI大模型公司之间,似乎隔着一(yī)层“窗户纸”。因此(cǐ),我们决定(dìng)走一条艰难但有效的路,这条路就是私(sī)域AI。我们重新思(sī)考,企业与AI公司的关系不应该(gāi)是供需关系,而应是共创关系。
接下来,我将从四个方面展开我的(de)分享。首先,请允许我简单介绍一下我们公司。
智子引擎科(kē)技有限公司的科研人员主 要来自中国(guó)人民大学(xué)高瓴人工智能学院,我们的核心团队曾参与(yǔ)智源研究院的悟道(dào)·文(wén)澜项目(mù)。我们研发了(le)国产首个(gè)国产多(duō)模态大模型。
接下来介绍一下我们的“孩子”——Awaker,中文名叫觉醒者。我们希望(wàng)Awaker能像人的大脑一样进行思(sī)考决策,赋予企业流水线和机器以(yǐ)生命。Awaker可以像普通人一样(yàng)思考,也可以像领域专家或技术工人一样思考(kǎo)。它(tā)由三部(bù)分能力组(zǔ)成:对话能力(lì)、检索能力和生成能力。你可以从拟人化(huà)的(de)角度来理解它(tā),它能够对话,能够感知外部环境,但这种感知基于(yú)数(shù)据(jù)进行。Awaker还能生成我们需(xū)要的一些指(zhǐ)令(lìng),涵盖感知、理解、决策、规划和控制。这些能力可以应用于(yú)有形(xíng)的硬件,比如四足
感知可以通(tōng)过语言(yán)交流,也可以通过(guò)声音(yīn)传感器接收音频信(xìn)号,当然还包括温度(dù)、湿(shī)度等复杂的传感器。Awaker通过多模态数据融(róng)合理解外界信(xìn)息,基于之前(qián)学习的知识进行(xíng)决策和规划。如果是在硬件上,它可以控制机械(xiè)臂;如果是(shì)在软件系统中,它可以控(kòng)制API,执行(xíng)各种操作。
这就是我们所谓的“多模 态(tài)输(shū)入、多模态输出”架构(PPT图示)。输入形(xíng)式是多模态的(de),比如文(wén)本问答(dá)、图片问答、声音问答(dá)。在专业领域,还包括通过传感器采集的数据。Awaker通过多模态融合理解这(zhè)些数据后,能进行决策、规划和控制。
前面提到的共创关系,意味(wèi)着企业(yè)不只是(shì)提供数据,而是提供学习素材。大模型通过学习这些素材得到只(zhǐ)是(shì)。大模型出厂时,可能就像一(yī)个(gè)有强烈求知欲望的孩子,但如果没有学习材料(liào),它(tā)仍只是一个普(pǔ)通的(de)孩子。我们和企业(yè)共创,打造先(xiān)进的生产工具。私域AI为企(qǐ)业提供的不(bù)仅是降本增效,更是提升核心竞争力的关键。
接下来(lái),我讲一个实际(jì)案例——无人机巡检。传统无人机通(tōng)过摄(shè)像(xiàng)头、激光雷达等传感器采集农场数据,传输到(dào)大模型数(shù)据分(fēn)析中心,检测农作(zuò)物是否异常。如果异常(cháng),传(chuán)统小模(mó)型会直接发出警告。而Awaker具备农业领域的知识,它不仅能识(shí)别 病虫(chóng)害,还能生成(chéng)一整(zhěng)套解决方案,告诉维修人员(yuán)需要用什么农药、喷洒多少、具体喷洒位置,并通过API下(xià)发工单给相关人(rén)员。如果配备了喷(pēn)洒农药(yào)的无(wú)人(rén)机(jī),Awaker可(kě)以直接生成报告,并下(xià)发(fā)任务(wù),自动规划(huà)喷洒路径并(bìng)执行作业(yè)。
这(zhè)套框架还可应用于搜救任务,如(rú)无人(rén)机通过(guò)传感器感知受灾区域并生成救援路径。
第(dì)二个(gè)例子,我(wǒ)们先看(kàn)一段视频。
(现(xiàn)场播放视频)
通过这个(gè)视频大家(jiā)可以看到,企业内部的(de)系统大多是(shì)通过(guò)点击功能模块(kuài)来进行操(cāo)作的。而在AI时代,我们提前预(yù)置了(le)指令。大模型能够理解自然语(yǔ)言,在刚才演示的变电站案例中,控制的最(zuì)小动作其实是通过API来实现(xiàn)的(de)。用户(hù)发出的自然语言指令被(bèi)系统理解为中文,之后(hòu)与(yǔ)原子动作相关的API进行匹配,并最终(zhōng)输出结果。对于大模型来说,这没(méi)有什(shén)么神(shén)秘(mì)之处,关键在于企业需要(yào)为大模型提供(gōng)学习材料,比(bǐ)如相关的知识文档。大模型能够自主学习这些内容,从而提(tí)升其(qí)能力。
接下(xià)来谈一下我们(men)的未来规(guī)划。我们希望与传统企业共(gòng)创,走私域AI解决方案(àn)这条路。虽然过程中(zhōng)可能会遇到(dào)很(hěn)多不(bù)确(què)定性(xìng),但先 进的生产力和优秀的解决方案,往往是在(zài)双方紧密合作中迸发出来的。如果仅仅是供需关系(xì),企业可能只会将自己认知范围内的问题交给大模型处理,但真正有效的合作是要让大模型参与到 企业的核心(xīn)生产流(liú)程中,重塑整个流水(shuǐ)线和生产环境。如果结合云边协同,整个大模型将变得更加强大,因为城市(shì)中的摄(shè)像头、巡逻车(chē)、无(wú)人机等都会成为大模型的传感器,城市中各个单位的(de)工作职责和路(lù)线关系都可能因此发生变化。
“积跬步,行千里”,我们开发私域AI解决方案的过程,也是在帮助Awaker逐步认识和(hé)理解世界。我相信,当我们积累到一定程度时,先进(jìn)的生(shēng)产力将(jiāng)会爆发,而那时我们就可以进行更为先进的通(tōng)用层面(miàn)的整合。那将是一个新的时机,作为一个技术创新(xīn)型企业(yè),我们更多的是把自己定位在创新领域,推动AI给(gěi)产业的赋能。
最后,我真诚期望有更多的合作伙(huǒ)伴加入到我们的AI事(shì)业中,与我(wǒ)们共同打造(zào)新质生产力,推(tuī)动(dòng)先进(jìn)流水线的发展。我的分高峰:从私域AI到具身智能享到此结束,感谢大家的聆听(tīng)。
新(xīn)浪声明:所有(yǒu)会议实录(lù)均为现场(chǎng)速(sù)记整理,未经 演讲者(zhě)审阅,新浪网登载此文出于传递更多信(xìn)息之(zhī)目的,并不意味着赞同其观点或证(zhèng)实其(qí)描述。
责任编辑:梁斌 SF055
未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了