橘子百科-橘子都知道橘子百科-橘子都知道

高峰:从私域AI到具身智能

高峰:从私域AI到具身智能

专题:2024中国AIGC创新(xīn)发展论坛

  2024年 服贸会专题(tí)论坛之一(yī)——“2024中国AIGC创新发展论坛”于(yú)9月13日-14日在北京(jīng)举行。智(zhì)子引擎(qíng)产品副 总裁高(gāo)峰出席并演讲。

  高峰(fēng)介绍,和大多数大模型企(qǐ)业 一样,过去一年,智子引擎在垂直领域中做了很多(duō)落地项(xiàng)目,但经过内部复盘,发现很多多(duō)模态大模型的能力其实还没有(yǒu)被企业 充分利用。传统企业和我们(men)AI大模型公司之间,似乎(hū)隔(gé)着一层“窗户纸”。因此,公司决定走一条(tiáo)艰难但有(yǒu)效的路,这条(tiáo)路就是私域AI。“我们重新(xīn)思考,企业与AI公司的关系不应该是供需关系,而应是共创(chuàng)关系”。

  “积跬步(bù),行千里”,高(gāo)峰说,开发私域AI解决方(fāng)案的过程,也是在帮助Awaker逐步认(rèn)识和理解世界。“我相信,当我们积累到一定程度时,先进的生产力将会爆发,而那时我们就可以进行更为先(xiān)进(jìn)的(de)通用层(céng)面(miàn)的整合。那将 是一个(gè)新的时 机,作为一个技(jì)术创新型企业,我们更多(duō)的(de)是把(bǎ)自己定位在(zài)创新领域,推动AI给产(chǎn)业(yè)的赋能(néng)”。

  以下(xià)为演讲实录:

  高峰:尊(zūn)敬的各位来宾,大家好(hǎo)!非常荣幸能代表智子(zi)引擎科技有限公司分享我们的科研(yán)成果,今(jīn)天我演讲的主题是《从私域(yù)AI到具身智能 》。

  首先,我想谈谈过(guò)去一年我 们所做的工作。和大多数大(dà)模型企 业一(yī)样,我们在垂直领域中做了很(hěn)多落地项(xiàng)目,但经过(guò)我(wǒ)们内部的复盘,发现很多 多模态大(dà)模(mó)型的能力其实还没有(yǒu)被企业 充分利用。传统企业和我们AI大模型公司之间,似乎隔着一层“窗户纸”。因此,我们决定走一条(tiáo)艰难但(dàn)有(yǒu)效的路,这条路就是私域AI。我(wǒ)们 重新思考,企业与AI公司的关系不应该是(shì)供(gōng)需关系,而(ér)应是共创关系。

  接下来,我将从四个方(fāng)面展(zhǎn)开 我(wǒ)的分(fēn)享。首先,请允许我简单 介绍一(yī)下我们公司。

  智子引擎科技有限(xiàn)公司(sī)的(de)科研人员主要(yào)来自中国人民大学高瓴(líng)人工智能学院,我们的核心团队曾参与智源研究院的悟道·文澜项目。我们研(yán)发了国产首个国(guó)产多模态大(dà)模(mó)型。

  接下来介绍一下我们的“孩(hái)子”——Awaker,中文名叫觉醒者。我们(men)希(xī)望Awaker能像人的大脑一样进行(xíng)思考决策(cè),赋予企业流水线和 机器以生命。Awaker可以像普(pǔ)通人一样思考,也可以像领域专家或技术工(gōng)人一(yī)样思考(kǎo)。它由三部分能力组成:对(duì)话能力(lì)、检索能 力和生成(chéng)能力。你(nǐ)可(kě)以从拟人化的角度来理解它,它能够对话,能够感知外部环境,但这种感知基于数(shù)据进行。Awaker还能生(shēng)成我(wǒ)们需要的一些指令,涵盖感(gǎn高峰:从私域AI到具身智能eight: 24px;'>高峰:从私域AI到具身智能)知、理解、决策、规划和控制(zhì)。这(zhè)些 能力可以应用于有形 的(de)硬件,比如四足机器人或(huò)两足机器人,也 可(kě)以应用于无形(xíng)的系统(tǒng),比如(rú)程序大脑、企(qǐ)业大脑,甚至私人管家。重点在 于 Awaker如何感知(zhī)、理解、决(jué)策、规划并最终(zhōng)实现控制。

  感知可以通过语言交流,也可以通过声音传(chuán)感器 接收音频信号,当然还包(bāo)括温 度、湿度等复 杂的传感器(qì)。Awaker通过多模 态数(shù)据融合理(lǐ)解外(wài)界信息,基于之前(qián)学习的知识进行(xíng)决策和规划。如果是在硬(yìng)件上,它可以(yǐ)控制机械臂;如果是在软件系统中,它可(kě)以控制(zhì)API,执行各种操作。

  这就是我们所谓的“多模态输入、多模态输出”架构(PPT图示)。输入形式是多模态的,比如文本问答、图片问答、声(shēng)音(yīn)问答(dá)。在专业领域,还(hái)包括通过传感器采集的数据。Awaker通(tōng)过(guò)多 模态融合理(lǐ)解这些数据后(hòu),能进行决策、规划和控(kòng)制。

  前面提到的共(gòng)创关系,意味着企(qǐ)业不只是提供数据,而是提供学习(xí)素材。大模型通过学习这些素材得 到(dào)只是。大模型出厂(chǎng)时,可能(néng)就像一(yī)个有强烈求(qiú)知(zhī)欲望的孩子(zi),但如果 没(méi)有学习材料(liào),它仍只是一个普通的孩子。我们和企(qǐ)业共(gòng)创,打造先进(jìn)的生产工具。私域AI为企业提供的不仅是(shì)降本增效,更是提升核心竞争(zhēng)力的(de)关键。

  接下来,我讲一个实际案例——无人机巡检。传统无人(rén)机通过(guò)摄像头、激光雷达等传感器采集农场(chǎng)数(shù)据,传输到大模型数据分析中心,检(jiǎn)测农作物是否异常。如果异常,传统(tǒng)小模型(xíng)会直接发出(chū)警告。而Awaker具备农业领域的知识,它不仅能(néng)识别(bié)病虫害(hài),还能生(shēng)成一(yī)整套解(jiě)决(jué)方案,告诉维(wéi)修人员需要用什(shén)么农药、喷洒多少、具体喷洒位置,并通过API下发工单(dān)给相关人员。如果配备了喷洒农药的 无人机(jī),Awaker可以直接生成报告(gào),并(bìng)下发任务,自动规划喷洒路径并执(zhí)行作业。

  这套框架还可应用于搜救任务,如无人机通过传感器感知受灾区(qū)域并生成救援路径。

  第(dì)二(èr)个 例子,我们先看一段视(shì)频。

  (现场(chǎng)播放视频(pín))

  通过这(zhè)个视频大家可以(yǐ)看(kàn)到,企业内部(bù)的系统大多(duō)是通过点击功(gōng)能模块来进(jìn)行操作的。而 在AI时(shí)代,我们(men)提前(qián)预置了指令。大模(mó)型能够理(lǐ)解自然语言,在(zài)刚才演示(shì)的变电站案例(lì)中,控制的最小动作其实是(shì)通(tōng)过API来实现(xiàn)的。用户发出的自然语言(yán)指令被(bèi)系统理解为中文,之(zhī)后(hòu)与原子 动作(zuò)相关的API进(jìn)行匹(pǐ)配,并最终输出结(jié)果。对(duì)于大模型来说,这没(méi)有(yǒu)什么神秘之(zhī)处,关键(jiàn)在于企业需 要(yào)为大模(mó)型提供学习材 料,比(bǐ)如相关的知识(shí)文档。大(dà)模型能够自主学习这(zhè)些内容,从而(ér)提升(shēng)其(qí)能力。

  接(jiē)下来谈一下我们(men)的(de)未来规(guī)划。我们希望(wàng)与传统企业共创,走私域AI解(jiě)决方案这条路。虽(suī)然过程中可能会遇到很多不确定性,但先进的生产力和优(yōu)秀的解决方案,往往是在双方紧 密合作中迸发出来的。如果仅仅是供需关系,企业可能只会将自(zì)己(jǐ)认知范围内(nèi)的问题交给(gěi)大模型(xíng)处理,但真正有效的合(hé)作是要让大模型参(cān)与到企业(yè)的(de)核心生产流程中(zhōng),重塑整个流水线和生产环境。如果结合云(yún)边协同(tóng),整个大模(mó)型 将变得更加(jiā)强大,因为城市中的摄像头(tóu)、巡逻车、无人机等都(dōu)会成为(wèi)大模(mó)型(xíng)的传感器,城市中各个单位的工作职责和路线关系都可能因此发生变化。

  “积跬步,行千里”,我们开发私域AI解(jiě)决方案的过程,也 是(shì)在帮(bāng)助Awaker逐步认(rèn)识和理解世(shì)界。我相信,当我们积累到一定程度 时(shí),先进的生产力将会爆发,而那时我(wǒ)们(men)就可以进行更为先进的通用层面的整合。那将 是一(yī)个 新的时机,作为(wèi)一个技术创新型企业,我们更多的是把自己定位在创新(xīn)领域,推动AI给产业的(de)赋能。

  最后,我真(zhēn)诚(chéng)期望有(yǒu)更(gèng)多的合作伙伴加入到(dào)我们(men)的(de)AI事(shì)业中,与我们共同打造新质生产力,推(tuī)动先进流水线的发展。我的分(fēn)享(xiǎng)到此结束,感谢大(dà)家的聆听。

  新浪声明:所有 会议实录均为现场速记(jì)整理,未经演讲者(zhě)审阅,新浪网(wǎng)登载此(cǐ)文出于传递更多信息之目的,并(bìng)不意味着赞同其观点或证实其描述(shù)。

责(zé)任(rèn)编辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能

评论

5+2=