王欣:通用大模型最后只会变成少量的一两家
专题:2024中国AIGC创新发(fā)展论坛
2024年服贸会专题论坛之一——“2024中国AIGC创新发(fā)展(zhǎn)论坛”于9月13日-14日在北京举行。安恒信息中央研究院(yuàn)院长王(wáng)欣出席(xí)并演讲。
王(wáng)欣认为,国内有很多厂商在做通用大模型,但通用大模(mó)型最后只会剩下成少量的一两家,“我们看到各个垂直领域(yù)反而在做各类的垂直模型,我认为这路是对的”,他认为,最终是围绕通用大模型或者相对小参数的模型围绕业(yè)务(wù)下(xià)沉的模(mó)型。
以下为演讲实录:
王欣:大家(jiā)下午好,刚才两位专家都介绍了围(wéi)绕AI大模型运营这块的很多时间,我今天围绕这个话(huà)题继续延伸(shēn)。
过去两年多时间AI很火,AI破圈,我不(bù)是(shì)做人工智(zhì)能,我是做攻防出身的,但现 在我也加(jiā)入到人工(gōng)智能序列里,因为各行各业在(zài)看到AI这块技术的革新(xīn)之后,我们看到了原来(lái)做不好的技术围绕着现在整个大模型出现(xiàn)可以达到非常好的(de)效果。
我在比较早(zǎo)期的时候针对于AI已经做了很多(duō)战略(lüè)层面的铺垫。但客观地讲,从大模型这件事情上,我们距离国外还是有比较远的距离。从(cóng)ChatGPT出现(xiàn)之后(hòu),我国各大(dà)互(hù)联(lián)网(wǎng)公司王欣:通用大模型最后只会变成少量的一两家、各大行业在训练自己的大模型 ,去年的时候可以理解(jiě)为是国内外大(dà)模型的(de)技术元年,去年(nián)一年时间内,我(wǒ)看到最多的是几乎每天都(dōu)有新的(de)大模型出现,在(zài)每天技术不断(duàn)更新过程中,我们思(sī)考我们 为什么要去做这(zhè)件事情。所以这个PPT里面第一页看到所有浪潮退去之(zhī)后要回归到(dào)价值本质。
对于AI来说,本(běn)质是一个工具(jù),工具(jù)的核心是(shì)解决业务问题,无论是在安全行业还是在其他行业,包括前(qián)一(yī)段(duàn)时间我参加(jiā)了Gartner一个会,在很(hěn)多企业 里面,大家(jiā)对于AI有什(shén)么期待?核(hé)心总结起来是三个方面:第一是降低生产成本,第二是(shì)提高产品质量,第三是推动产业转(zhuǎn)型。
我们看到各个垂直领域(yù)反(fǎn)而在做各(gè)类的垂直(zhí)模型,我认为这(zhè)路是对的,我们可以看到国内有很多厂商过去在做通用(yòng)大模型(xíng),我认为通用大模型(xíng)最后只会变成少量的一(yī)两家,最终围绕(rào)通用大模(mó)型或者相(xiāng)对小参数的模型围绕业务往下走(zǒu)的模型。
安全行业也一样(yàng),安全行业(yè)发(fā)展了二十多年,我大学毕业前(qián)就开始接触安(ān)全,也(yě)将近二十年左右的时间,在整个感触里面,其实安全是存在(zài)一个天平的问题,很多时候我们希望告警比(bǐ)较少,但又不希望有(yǒu)漏洞,我们(men)希(xī)望业务优先但又希(xī)望安全第一,我们(men)希望用更(gèng)少的成(chéng)本又希望(wàng)安全整体防御做的更好(hǎo)。
在整个技术迭代过程中可以看到,原(yuán)来出现了很多(duō)安全产(chǎn)品,但这些安全产品有(yǒu)时候不能(néng)完全去解决客户问题,在(zài)这个情(qíng)况下怎么办?堆(duī)人。但人是不(bù)是一个最优解(jiě)?很多,包括 后面会(huì)讲到一些case,我们铺了很多产品不够人去凑,但人(rén)的成本持续上(shàng)升,很难(nán)通过人去填补最后(hòu)一(yī)公里。所以我(wǒ)们就在看,围绕着安全现在这样一个痛点现(xiàn)状,我们大模型能否带来这里面的变(biàn)化,我们把AI作为一个(gè)工具,我们核心分析了(le)痛点(diǎn),看大(dà)模(mó)型能不能解决(jué)。
大模型(xíng)我总结(jié)了几个点,第一个,就之 前人工智能技(jì)术(shù)有(yǒu)更强的理解指(zhǐ)令的能力,这里(lǐ)我(wǒ)认为是两层:一是(shì)本身为软件工程,对机器理解的指令更强;二是人工(gōng)智能为拟人化(huà)的(de)学(xué)科(kē),本身更接近于跟人的对话。第二个(gè),理解意(yì)志。就是它有更强的泛化能力,所以我们在安全很多(duō)的业务很难(nán)做(zuò)到非常标准的SOP。所以我们(men)是希望掌握一些知识(shí)之后(hòu)还有更强的(de)泛化(huà)能力。第三个,具(jù)有更(gèng)强的COT能力,因为很(hěn)多安全任务不是一个简单的(de)问题,其实是一个复杂问题,所以在很(hěn)多安全任务处(chù)理过(guò)程中需要加一(yī)个复杂(zá)问题把它拆解成(chéng)更加简单的(de)问题、多个问题,大(dà)模型思维链的问题本身比较(jiào)适(shì)合做安全相关任务。第四个,有快速的学习成长跟(gēn)复制的能力(lì)。很多(duō)安全行业(yè)里面,人的经验复制是很难的,如何从数据驱动到知识驱动,到变(biàn)成一个平台级的能(néng)力,这个层面我觉得是大模型对这个行业来说很(hěn)大(dà)的价值。
所以围绕着(zhe)上面(miàn)所有,我认为人工智能可以(yǐ)填(tián)补这里面的鸿沟,建立起一座桥梁之后,向左可以提高我们整个产品质量,向右可以提高整个(gè)服务的能效。所(suǒ)以我们不断(duàn)地在思考、在(zài)探索,在具体的每个业务链上到底有什么样(yàng)的安全问题。
在另外一个层面,刚才余总也介绍到,大模型本身偏向于是人(rén)的大脑(nǎo),偏(piān)向于类似于咨询专家。但我(wǒ)们更希望,具体的一些咨询专家能不能动手帮助完成所有任务,所以我们(men)这上面的思考是通过智能体的放,通 过连接下层原来的产品,围绕着上述业务场景构(gòu)建相关智能体(tǐ),融入原来的安全(quán)体系。
所以这里我(wǒ)想抛一个观点,新的技术出(chū)现不是去解决新的问题,而是更多和原来产(chǎn)品进行结合,解(jiě)决原来传统解(jiě)决不好的问题,这是(shì)王道、是正道(dào)。另外,很多时候对于大(dà)模型来说,是不(bù)是可以提高很高的效率?在这个点上,我(wǒ)原来跟很多业内专家去聊,其实它提升(shēng)的是(shì)机器做不好的、需(xū)要人介入的这(zhè)一块的工作效率,对于现在大模型本身(shēn)推理和各方(fāng)面性能原因(yīn),原来机器性能已(yǐ)经这样,在(zài)机器性能(néng)上再叠加,这在当(dāng)前技术阶段(duàn)不是特别成熟。
第二个层面,在整个AI这一块,我在很多客户聊,大模型是不是(shì)很多原来解决不(bù)了的问(wèn)题(tí)现(xiàn)在(zài)都可以(yǐ)通过人工 智能来解决了?其实远远不够,我们的梦(mèng)想非常高(gāo),但大模 型现在还在一个技术的爬坡阶(jiē)段,有(yǒu)很多问题,无(wú)论是幻(huàn)觉问题、性能问题、指令遵循(xún)问题等等(děng)一系(xì)列 ,并不是(shì)在所(suǒ)有任(rèn)务上(shàng)都能处理得很好,但不能低估了(le)这(zhè)个技术未来发展空间。所(suǒ)以当前阶段要看 有哪些痛点,大模型(xíng)当前阶段最合适做什(shén)么工作,主编边走边爬坡,边跟(gēn)现在的(de)业务结合,给现在业务(wù)痛点带来相关(guān)价值。
过(guò)去我们内部做了很多(duō)头脑风暴,思考现(xiàn)在有什么样(yàng)的痛点(diǎn),大模型能否解决什(shén)么问题,如果可以,我们就开始组织预演,组(zǔ)织预演可以(yǐ),然后工程化,工程化再可以给客户(hù)一个持(chí)续的优化过程。所以(yǐ)我们其实做了好多好多的(de)尝试,这里面有很多也是失(shī)败了,包括最早的时候我们(men)想说原始流量是否可以直接丢给(gěi)大模型,大模型是否能够独立针对于大型(xíng)的软件工程,然后(hòu)进行(xíng)源代码的挖掘,包(bāo)括能不能做全自(zì)动化复杂场景的渗(shèn)透。刚才我说(shuō)的这个场景分别代(dài)表了大模型现在的三个缺陷。这里不展开详细去聊这个话题了。
实(shí)践过程中有几个点做的还可以,第一个是安全运营相关的场(chǎng)景,安全运营(yíng),刚才两位专家也(yě)提到,我们(men)越来(lái)越关注安全,整(zhěng)个(gè)法律体系的(de)构建越来越完善,采集到的日志越来越多,形成的 告警越来越多。第二个是我们对手整个攻击越来 越智(zhì)能化、自动化,包(bāo)括(kuò)互联网上攻击攻防(fáng)之间的博弈越来越强烈,所以我们(men)其 实(shí)在(zài)现在发现告警越来越多,我走访了很多客户,一天告警可(kě)能在几十(shí)万到几百万,但(dàn)是一个工程师一天大概只(zhǐ)能处理个一千个左右的告警(jǐng),所以我看(kàn)了(le)很多客户招了几十个人专门做安全运营,但是几十(shí)个人(rén),假设我们要把(bǎ)所有的日(rì)志(zhì)告警分析的话,远远不够(gòu)。我们在思考大模型(xíng)在这个点(diǎn)上可以解(jiě)决很好的问题,因为(wèi)它本身的分析逻辑、它的技能是可以相对的(de)通过一些知识(shí)经验传递(dì)的方式给到大(dà)模型。但(dàn)这一块(kuài),就不展开讲了,因为前面两位专家主要是围绕这个话题来讲。
大家对于安全运营期待的(de)第二点是未知(zhī)威胁的发现。今年8月份我们团队(duì)去BlackHat(全球一个顶(dǐng)尖的黑帽 子(zi)大会),当时做了一个分(fēn)享,就是利用大(dà)模型进行威胁狩猎。这个相关技术成(chéng)果在2024年国家网络安全宣传周上进行了公布,这个赛道我们也是(shì)拿到了第一名。因为大模型有(yǒu)比较强的泛化的能(néng)力(lì),对于原来很多规则都是从已(yǐ)知(zhī)到已知问题的发现(xiàn),但是大模型可以在一定程度上做的一个已知到(dào)未知的发现,通过这样的方式(shì)极大(dà)提 升了我们整个狩猎能力包括过去很多APT的线索,通(tōng)过这样(yàng)的方式得(dé)到了有效的产出。
这些相关(guān)成果我(wǒ)就不(bù)展开(kāi)讲了,因为文字比较多,全部阐述(shù)清(qīng)楚需要比较长的时间。
前面讲的东西都偏(piān)向(xiàng)安全运营,后面讲数据安(ān)全相关的东(dōng)西。业界做数据安全国内 已经推了很多年(nián),但(dàn)整体落地(dì)存在挑战,这里本身有数据安全(quán)跟业(yè)务更加连接,跟业务更加相关,不同客户整个数据安(ān)全需求也不一样(yàng)。另外一个层(céng)面,过去很多传统技术(shù)无法很好的支持数据安全的落地(dì),比如分类和分级,过去客户侧结构化(huà)数(shù)据有不同的业务类型和不同程序员(yuán)开发,数据库(kù)涉及方式不一样,表字段命(mìng)名不一样,很难通过原来通过规则(zé)或者关键字的方式形成一套识别的(de)工具,我们过去看过很多数据分类分级(jí)的产品,识(shí)别率是比较低的只有对于他认(rèn)识的,之 前做(zuò)过关键词这(zhè)类的识别的比较(jiào)高,相对业务更(gèng)新一点或者整个数据库设计、命名有一些特殊性或者有其他差异(yì)就识别不(bù)出来。
围绕这个,就是我画的(de)图,前面产品(pǐn),后面堆人,通过这样的(de)方(fāng)式堆了很(hěn)多人,数据分类分级,我们知道很多客户非结构化数据,然后一个数据库可能就几千张(zhāng)几万张表甚至十(shí)几万表(biǎo),或者一个(gè)客户(hù)现场,一天一个人,分析的大概也是差不多一千个。
我们有一个运营(yíng)商的客户(hù)跟我(wǒ)们 说了一个事情,说我这边有1500万个(gè)字段,能 不(bù)能(néng)做相关的数据分(fēn)类分(fēn)级。用传(chuán)统的(de)方式,不知道大(dà)家有没有概念,但做了计算(suàn),如果按(àn)照传统的(de)方式,大(dà)概需要把两到三个(gè)人从(cóng)实(shí)习阶段直接干到退休。我(wǒ)们去推(tuī)动这(zhè)个点,我觉(jué)得是打开数据安(ān)全的基础,我们也做了很多实践 ,其实本身(shēn)是对于(yú)自然语(yǔ)言的理(lǐ)解,结构化数据里面本(běn)身(shēn)字段表之间有关系,所以我们通过AI的方(fāng)式让它自动化的去推测每一(yī)个 字(zì)段(duàn)里的含义,并且归到相应的内容。这(zhè)里面我们识别到的准确率,其实(shí)比人工专家还要高,因为专家有时(shí)候是带情绪(xù)的,有(yǒu)时候不是理性(xìng)的,认(rèn)为这一秒应该分到这里,下一秒做类似工作认(rèn)为应该在另(lìng)外一边,整个思维更加跳跃。
在具体案例里面我(wǒ)们做了很多的客户实践发现,整体(tǐ)效率提升30倍(bèi)左右,虽(suī)然这(zhè)里面百(bǎi)万个字段除1000个字段,10万字段除以1000个字段,效率提升不仅30倍,但因为整(zhěng)个项(xiàng)目交付有其他环节,所以我们整(zhěng)体算(suàn)下来(lái)大概有30倍(bèi)效率的提升。这后面是(shì)具体的项目,我不展开讲了。
刚刚(gāng)讲的(de)是结(jié)构化数据,数据安全里面非结构化数(shù)据,过去这一块也是老(lǎo)大难的问题,因为我们(men)肯定知道有很多终端的(de)DLP包(bāo)括网络的DLP去针对于文本的内容进行识别,过去DLP的初代、二代更多是通(tōng)过一些文件的格式、编码、关键词(cí),后面又增加(jiā)了一些(xiē)NLP的技术,其实整(zhěng)体的识别率是很低的,误报(bào)率很高的。
今天是安全场(chǎng),在座很多人可能是知(zhī)道这一(yī)块的现状,所以(yǐ)我就不展开讲了(le)。大模型本身有(yǒu)很强的文本理解能力(lì)、有很强的总(zǒng)结归纳的能(néng)力(lì)。所以我们对于不同的(de)业务数据进去之后,这边分析完一个文档之后,认为是一个员(yuán)工工资(zī)表,所(suǒ)以认(rèn)为是(shì)一个4级(jí)文档。后面分析完认为是一个技术设计文档,所以属于4级高敏感等(děng)等。通过这种方式,原来是(shì)把人的思维抽象成了一个规则,而(ér)现在是(shì)用(yòng)借助人的思考方式、阅读方式、总结归纳的能力让(ràng)它去识(shí)别相关的信(xìn)息。所以我(wǒ)认为在过去(qù)原来传统技术叠加是(shì)一代二代三代,大模型在这(zhè)个点上的价值是(shì)跨代的。如果有兴趣后面再详细交流。
关于API安全也是一样,在整个API安 全这(zhè)一(yī)块也是围绕数(shù)据安全这几年比较火的一个(gè)点,过去(qù)API安全(quán)里(lǐ)面存(cún)在一些问题,比如API接口识别的准确率,包括API脆弱性的一些(xiē)识别以及研判能力,包括API接口调用的敏感数(shù)据以(yǐ)及(jí)敏感数据所对应(yīng)的行为(wèi)事件所分析出来的 一些异常行为之类等等安全相关的维度(dù),但过去在这里面处理的(de)都不是特别好,然后我们(men)通过让(ràng)大模型去(qù)做API的提纯,包括做异(yì)常行为的分析。这是一个真实的例子(PPT图(tú)),央企的例子,通(tōng)过这样的(de)方式识别到真正某(mǒu)一个(gè)IP在夜间(jiān)拖取相关数据大概达到多少条(tiáo),API的安全其实有很多的产品功能,但是(shì)我认为(wèi)对于(yú)客户来说,这(zhè)是 最最关心的,就因为(wèi)API安全建好之后,到底有(yǒu)谁通过我这个API接口偷数据和爬(pá)数据(jù)。
最后一页我快速讲一下,整个数据大模型这一块针对于(yú)安(ān)全,包括大模型本身技术当前现状,我(wǒ)们认为还是在爬坡阶(jiē)段。过去我们(men)提(tí)到的是偏向于一(yī)个智能问答到现在的一(yī)个辅助驾驶,可(kě)以做大(dà)部分工作,最后人工做一(yī)些check。我相(xiāng)信在不远的(de)将来(lái),在一些关(guān)键的任(rèn)务上可以(yǐ)实现无 人驾驶王欣:通用大模型最后只会变成少量的一两家(shǐ)的效果,因为目前我们在一些新的领域上已经 看到了,已经实践出来(lái)了,后面找 机会再跟各位再(zài)做进一步的汇(huì)报,我的汇报就是这些,谢谢大家。
新(xīn)浪声明:所(suǒ)有会议实录均为现场速记整理,未经演讲(jiǎng)者审阅(yuè),新浪网登载此文出于传递更多信息之目的,并(bìng)不意味着赞同其观点或证实其描述。
责任编辑:梁斌 SF055
未经允许不得转载:橘子百科-橘子都知道 王欣:通用大模型最后只会变成少量的一两家
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了