高峰:从私 域AI到具身智能
专 题:2024中国AIGC创新发展(zhǎn)论坛
2024年服贸会专(zhuān)题论坛 之一——“2024中国AIGC创新发展(zhǎn)论(lùn)坛”于9月(yuè)13日-14日在北京举行。智子引擎产品副总裁高峰出席并演(yǎn)讲。
高峰介绍,和大多(duō)数大模型企(qǐ)业一样,过去一年,智子引擎在垂直领(lǐng)域中做了很多落地项目,但经(jīng)过内部复(fù)盘(pán),发现很(hěn)多多模态大模型的能力其实(shí)还没有被企(qǐ)业(yè)充分利用。传统企业和我们AI大(dà)模型公司之间,似乎隔着(zhe)一层“窗户纸”。因(yīn)此,公司决定走一条艰难但有效的(de)路,这条路(lù)就是私域AI。“我们重新思考,企业与(yǔ)AI公(gōng)司的关系不应该是供需(xū)关系,而应是共(gòng)创关系”。
“积跬步,行千(qiān)里”,高峰说,开(kāi)发私域AI解决(jué)方案的过程,也(yě)是在帮(bāng)助Awaker逐步(bù)认识和理解(jiě)世界。“我相信,当我们(men)积累到一定程度(dù)时,先进的生产力(lì)将会爆发,而那时我们就可以进行更为先进的通用层(céng)面(miàn)的整合。那(nà)将是一(yī)个新的时机,作为一个技术创新型企业,我们更多(duō)的是把自己定(dìng)位在创新领域,推动AI给产业的赋能(néng)”。
以(yǐ)下为演讲实录:
高峰:尊敬的各位来宾,大家(jiā)好(hǎo)!非常荣(róng)幸能代表智子(zi)引擎科(kē)技(jì)有限公司分享(xiǎng)我们的科研成 果,今(jīn)天我演讲的主题(tí)是《从私域AI到具身智能》。
首先,我想谈谈过去一年我们所(suǒ)做的工(gōng)作。和大多(duō)数大模型企业一(yī)样,我们在垂直领域中做了很多落地项目,但(dàn)经过我们内部的复盘,发现很多多模态大模型的能力其实还没有(yǒu)被企(qǐ)业充分利用。传统企业和我们AI大模型公司(sī)之间,似(shì)乎隔着一层“窗户纸”。因此,我们决定走一条艰难但有(yǒu)效的路,这条路就是私域AI。我们重(zhòng)新思(sī)考,企业与AI公(gōng)司的关系不应该是供需关系,而应是共创关系(xì)。
接下来,我将从四个方面展开我的分享。首(shǒu)先,请允许我简单 介绍一下我们公司。
智子(zi)引擎科技有(yǒu)限公司的科研人员主要来自中(zhōng)国人(rén)民大学高瓴人工智(zhì)能学院,我(wǒ)们的核心团队曾参与智源研究院的悟道·文澜项目。我们研发了国产首个(gè)国产多模态大模型。
接下来介绍一(yī)下我们的“孩子(zi)”——Awaker,中文名叫觉醒(xǐng)者。我(wǒ)们希望Awaker能像人的(de)大脑一样进行思考(kǎo)决策,赋予企业流水线和机器以生(shēng)命。Awaker可以像(xiàng)普(pǔ)通人一样思考(kǎo),也可以像领域专家或技术工人一样(yàng)思考。它(tā)由三部(bù)分能力组成:对话能(néng)力、检(jiǎn)索能力和生成能力(lì)。你可以从拟人化的角度来理解它,它能够对(duì)话,能够感知(zhī)外部环境,但这种(zhǒng)感知基于数据进行 。Awaker还能生成我们需要的一些指令,涵盖感知、理(lǐ)解、决策、规划和控制(zhì)。这些能力可以应用于有形的硬件,比(bǐ)如四足机器人或(huò)两(liǎng)足机器人,也可以应用于(yú)无形的系统,比如程序大脑(nǎo)、企业大脑,甚至私人(rén)管家。重点在于Awaker如何感知、理解、决策、规划并最终实现控制。
感知可以通过语言交流,也可以(yǐ)通过声音传(chuán)感器(qì)接收音频信号,当(dāng)然还包括温(wēn)度、湿(shī)度等复杂的传感器。Awaker通过多模态数据融合理(lǐ)解外界信息,基于之前学习的知识进行决策和规划。如果是在硬件上(shàng),它可以控制机械臂;如果(guǒ)是在(zài)软件系(xì)统中,它可(kě)以控制API,执行各种操作(zuò)。
这就是我们所谓的“多模态输入、多模态(tài)输出”架构(PPT图示 )。输入形式是多(duō)模态(tài)的,比如文本问答、图片问答(dá)、声(shēng)音(yīn)问答。在(zài)专业领域,还(hái)包括通(tōng)过传感器采集高峰:从私域AI到具身智能的数据。Awaker通过多模态融(róng)合(hé)理解这些数据后,能(néng)进行决策、规划和控制(zhì)。
前面提到的共创关系,意味着企业(yè)不(bù)只是(shì)提供数据,而是提供学习素材。大模(mó)型(xíng)通(tōng)过(guò)学习这些素材得到只是。大模型出厂时,可能就像一个有强烈求(qiú)知欲望 的孩(hái)子,但(dàn)如果没(méi)有学习材料,它仍只是一个普通的孩子。我们和企(qǐ)业共(gòng)创,打造先进的生产(chǎn)工具。私域A高峰:从私域AI到具身智能I为企业 提供的不仅(jǐn)是降本增效,更是提升核心竞争力的关键。
接下来,我讲一个(gè)实际案例——无人(rén)机巡(xún)检。传统无人机通过摄像头、激光雷达等传感器采集农场数据,传(chuán)输到大模型数据分析中(zhōng)心,检测农作物是否异常。如果异常,传统(tǒng)小模型会直接发(fā)出警告。而Awaker具备农业领域的知(zhī)识,它不仅能识别病虫害,还能生成一整套解决方案,告(gào)诉维 修人员需要用什(shén)么农药、喷洒多少、具体喷(pēn)洒(sǎ)位置(zhì),并(bìng)通过(guò)API下发工单给相关人员。如果(guǒ)配(pèi)备了喷洒农药的无人机,Awaker可以直接生成报告,并(bìng)下发任务,自动规划喷洒路(lù)径并(bìng)执行作(zuò)业。
这套框架还可应用于搜(sōu)救任务,如无人(rén)机通过传感器感知(zhī)受灾区域(yù)并生成(chéng)救援路径(jìng)。
第二个例子,我(wǒ)们先(xiān)看(kàn)一段视频(pín)。
(现场播放视频)
通过这(zhè)个视频大家可以看到,企业内部的系统大多(duō)是通过点击功能模块来进行(xíng)操作(zuò)的(de)。而在AI时代,我们提前预置了(le)指令。大模型能够理解自然语言,在(zài)刚才演示的变电站案例中,控 制的最小动作(zuò)其实是通过API来实现的。用户发出的自然语言指令被系统理解为(wèi)中文,之后与原子动作相(xiāng)关的API进行匹配,并最终输(shū)出结果。对于大(dà)模型来说,这没有什么神秘之处,关键在于企业需要为大(dà)模(mó)型提供学习材(cái)料,比(bǐ)如相(xiāng)关的知识文档。大模型能够自主学习这些内(nèi)容,从而提升其能力。
接下来(lái)谈一下我们的未来(lái)规划。我们(men)希望与传统企业共创,走私域AI解决(jué)方案这条路。虽然过程中可(kě)能会(huì)遇到很多不确定性,但先进的生产力和优秀的解决方案,往往是在双 方紧密合作中迸发出来的。如果仅仅是供需关系(xì),企业可能只会将自己认知(zhī)范围内的问题(tí)交给大模型(xíng)处(chù)理,但真正有效的合作是要让大模型参(cān)与到企业(yè)的核心(xīn)生产(chǎn)流(liú)程中,重(zhòng)塑整个流水(shuǐ)线和(hé)生产环境。如果(guǒ)结合云边协同,整个大模型(xíng)将变(biàn)得更 加强大,因为城市中的摄像头、巡逻车、无(wú)人机等(děng)都会成为大 模 型的传感器,城(chéng)市中各(gè)个单位(wèi)的工作职责和路线关系都(dōu)可能因此发(fā)生变化。
“积跬步,行千里(lǐ)”,我们(men)开发私域AI解决方案的过程,也(yě)是在帮助Awaker逐步认识和(hé)理解 世界。我相信,当我们积累到一定程度时,先进的生产力将会爆发,而(ér)那时我们就可以进行更为先(xiān)进的通用层面的整合。那将是一个新的时机,作为一个(gè)技术创(chuàng)新(xīn)型企业(yè),我们更多的是把自己定(dìng)位在创新(xīn)领域,推动高峰:从私域AI到具身智能AI给产业的赋能。
最后,我真诚期望有更多的合(hé)作伙伴加入到我们的AI事业中(zhōng),与(yǔ)我(wǒ)们共同打造新(xīn)质生产力,推动先进(jìn)流水线的发展。我(wǒ)的分享(xiǎng)到此结束(shù),感 谢大家的聆听。
新(xīn)浪声明:所有会议实录(lù)均为现场(chǎng)速(sù)记整(zhěng)理,未经演讲者审阅,新浪网(wǎng)登载此文出于传递更多信息之目的,并不意味(wèi)着赞同其观点或证实其(qí)描述。
责任编辑:梁斌(bīn) SF055
未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了