橘子百科-橘子都知道橘子百科-橘子都知道

高峰:从私域AI到具身智能

高峰:从私域AI到具身智能

专(zhuān)题:2024中国AIGC创(chuàng)新(xīn)发展论坛

  2024年服(fú)贸会(huì)专题论(lùn)坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行(xíng)。智子引擎产品副总裁高峰出席并演讲。

  高峰介绍,和大多(duō)数大模型企业一样,过去一年,智 子引擎在垂直领域中做了很多落地 项目,但经过内部复盘,发现很多(duō)多模态大模型的能力其实还没有被企(qǐ)业充分(fēn)利用。传统企业和我们AI大模(mó)型公司之间,似(shì)乎隔着一层“窗户纸”。因此,公司决定走一(yī)条艰难但有效的路(lù),这条路就是私(sī)域AI。“我们(men)重(zhòng)新思考,企业与AI公司的关系不应该是供需(xū)关系,而应是共创关系”。

  “积 跬步,行千里”,高峰(fēng)说,开发私域AI解决(jué)方案(àn)的过程,也是在帮助(zhù)Awaker逐步认识和理 解世界。“我(wǒ)相信,当我们积累到一定程度(dù)时,先进的(de)生产力将会爆发,而那时我们就可以进行更 为先进(jìn)的通用层面的整合。那将是一个新的时机,作为一个(gè)技术(shù)创(chuàng)新型企业,我(wǒ)们更多的是把自己定(dìng)位在创新领域,推动AI给(gěi)产业的赋能”。

  以下为(wèi)演讲实录:

  高峰(fēng):尊敬 的各位(wèi)来宾,大家好!非常荣幸能代表智子引擎科技有限公司分享(xiǎng)我(wǒ)们的科研成果,今(jīn)天(tiān)我演讲的主题是《从私域AI到具身智能》。

  首先,我想(xiǎng)谈谈过去一年我们所做的工作。和大(dà)多数大模型企(qǐ)业一样,我们在垂直领域中做了很多落地项目,但经过我们内部(bù)的复(fù)盘,发现很(hěn)多多模态大模型(xíng)的能力其实还没有被企业充分利用。传统(tǒng)企业和我们AI大模型公司之间,似乎(hū)隔着一层“窗户纸(zhǐ)”。因此,我们决定走一条艰难但有效的路,这条路就是(shì)私域AI。我们重新思考,企业与AI公司的关系不应该是供需(xū)关系,而应是(shì)共创关(guān)系。

  接下(xià)来,我将从四个方面展开我的(de)分(fēn)享。首先,请允许我简单介绍一下我(wǒ)们公司(sī)。

  智(zhì)子引擎(qíng)科技有限公司的科研人员主要来自中国人民大学高瓴人工智能学院,我们的核(hé)心团(tuán)队曾参与智源研究院的悟 道·文澜项目(mù)。我们研发了国产首个(gè)国产多模态大模型(xíng)。

  接(jiē)下来介绍(shào)一下我们的(de)“孩(hái)子”——Awaker,中文名叫觉醒(xǐng)者(zhě)。我们希望Awaker能像人的大脑一样进 行思考决(jué)策,赋予企业流水线和机器以生命。Awaker可以(yǐ)像普(pǔ)通人一样思(sī)考,也可以像领域专家或技术工人一(yī)样思考。它由三部分能力组成:对话能力、检索(suǒ)能(néng)力和生成(chéng)能力。你(nǐ)可以从拟人化的(de)角度来理解它,它能够对话,能够感(gǎn)知外部环(huán)境,但这种感知基于数据进行(xíng)。Awaker还能生成我们(men)需要(yào)的一些指令,涵盖感知、理解(jiě)、决策、规划(huà)和控制。这(zhè)些(xiē)能力可以(yǐ)应用于有形的硬件,比如四(sì)足机器人或两足机器人,也可以应 用于无形的系统,比如程序大(dà)脑、企业大脑,甚至私人管家(jiā)。重点在于(yú)Awaker如何感(gǎn)知、理解、决(jué)策、规划并最终实(shí)现控制。

  感知可以通过语言交流,也可以通过声 音传感器接收音频信号,当(dāng)然(rán)还包括温度、湿度等复(fù)杂的传感器。Awaker通过多模态数据融合理(lǐ)解外界信息,基于之前学习的知识进行决策和(高峰:从私域AI到具身智能hé)规划。如果是在硬件上(shàng),它可以控制机 械臂;如果是在软件系统中,它可(kě)以控制API,执行各种操作。

  这(zhè)就是我们所谓的“多模(mó)态输入、多(duō)模态输出”架构(PPT图示)。输入形式是多(duō)模态的,比如文本问答、图片问答、声音问答。在专业领(lǐng)域(yù),还包括通过传感器采集的数据。Awaker通过多模(mó)态融合理解这些数据后,能进行决策、规划(huà)和控制。

  前面提到的共创关系,意味(wèi)着企业不只是提供数据,而是提供(gōng)学习素材 。大模(mó)型通过(guò)学习这些素(sù)材得到只是。大模型出(chū)厂(chǎng)时,可能就像一个有强烈求(qiú)知欲望的(de高峰:从私域AI到具身智能)孩子,但如果没有学习材料,它仍只是一个普通的(de)孩子。我们(men)和企业共创,打造先进的生产工具。私域AI为企业提供的不(bù)仅是降本增效,更是提升核心竞争力的关键。

  接下来,我 讲一个实际案例——无人机巡检。传统无人机通过摄像头、激光雷达等传感器(qì)采集(jí)农场(chǎng)数(shù)据,传输到大模型数据分(fēn)析中心,检测(cè)农作(zuò)物是(shì)否异常。如(rú)果异常,传统小模型会直接发出(chū)警告。而Awaker具备农(nóng)业领域的知(zhī)识,它不仅能识别(bié)病虫害(hài),还能生成一整套解决方(fāng)案,告诉维修人员需要用什么农药、喷洒多少、具体喷洒位置,并(bìng)通过API下 发工单给相关人员。如果配 备(bèi)了喷洒农药的无人机,Awaker可以直接生成报告,并下发(fā)任务,自动规划喷洒路径并执行作业。

  这套(tào)框架还可应用于搜救任(rèn)务,如无人机通过传感器感知受灾区(qū)域并生成救(jiù)援路径。

  第二个例子,我们先看一段视频。

  (现场播放视频)

  通过这个视频大家(jiā)可以看到,企业内(nèi)部的系统大多是通过点击功能模块来进行操作的。而(ér)在AI时代,我们提前预置(zhì)了指令。大模型能(néng)够(gòu)理解(jiě)自然语言,在(zài)刚才演示的变电站案例中,控(kòng)制的最小动作其(qí)实是通过API来(lái)实现的。用户发出的自然语言指令被系(xì)统理解(jiě)为中文,之后(hòu)与(yǔ)原子动作相关的API进行匹配,并最终(zhōng)输出(chū)结果。对于(yú)大模型来说,这(zhè)没有(yǒu)什么神(shén)秘之处,关键在(zài)于企业需(xū)要为(wèi)大模型提供学习材料,比如相关的知识文档。大(dà)模型(xíng)能够自主学习这(zhè)些内容,从而提升其(qí)能力。

  接下来谈一下我们的(de)未(wèi)来规划。我们希(xī)望与传统(tǒng)企(qǐ)业共创,走私域 AI解决(jué)方案这条路 。虽然过程中可能会遇到很 多不确定性,但先进(jìn)的生产力和优秀的解决方案,往往是(shì)在双方(fāng)紧密(mì)合作中迸发出来的。如 果仅(jǐn)仅是供需关(guān)系(xì),企业可能只会将自己(jǐ)认知范围内的问题交给大模型处理,但(dàn)真正有效的(de)合作是(shì)要让(ràng)大模(mó)型参(cān)与到企业的(de)核心生(shēng)产流(liú)程中,重塑整个流(liú)水线和生产(chǎn)环境。如果结合(hé)云边协同,整个大模(mó)型将变得更加强大,因为城市中的摄像头(tóu)、巡逻车、无人(rén)机等都会(huì)成为大模型的传(chuán)感器,城市(shì)中各个(gè)单位的工作职责和路线关系都可能因此发生变化。

  “积跬(kuǐ)步,行千里”,我 们开发私域(yù)AI解决方案的过程,也是在(zài)帮助Awaker逐步 认识和理解世界。我相信,当我们积(jī)累到一定(dìng)程度时,先进的生产力将(jiāng)会爆发,而那时我们(men)就(jiù)可以进行(xíng)更为先进的通(tōng)用层面(miàn)的整合。那(nà)将是一(yī)个新(xīn)的时机,作为一个技术创新型(xíng)企业,我们更多的是把(bǎ)自己定(dìng)位在创新领域,推动(dòng)AI给产业的赋能(néng)。

  最后(hòu),我真诚期望有更多的合作伙伴加入到我们的AI事业中,与我们共同打造新质生产力,推动先进(jìn)流水线的发展。我(wǒ)的分享到此结束,感谢大家的(de)聆听。

  新浪声明:所有会议实(shí)录均为现场速记整(zhěng)理(lǐ),未经(jīng)演讲者审(shěn)阅,新浪网登载 此文出于传递更多信息之 目(mù)的,并不意味着赞同其观点或证实其描述。

责任编辑:梁(liáng)斌 SF055

未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能

评论

5+2=