王欣:通用大模型最后只会变成少量的一两 家
专题:2024中国AIGC创新发(fā)展论坛
2024年服贸会专题论坛之一——“2024中国AIGC创新(xīn)发展论坛”于(yú)9月13日-14日在北京举行。安恒(héng)信息中央研究院(yuàn)院长王欣出席并演(yǎn)讲(jiǎng)。
王欣认(rèn)为,国内(nèi)有很多(duō)厂商(shāng)在做通(tōng)用大模(mó)型(xíng),但通用大模型最后只会剩下成少量的一两家,“我们看到各个垂直(zhí)领域反(fǎn)而在做各类的垂直模(mó)型,我认为这路是对的”,他认(rèn)为(wèi),最终是围绕通用(yòng)大模(mó)型或者相对小(xiǎo)参数的模型围绕业务下沉的模型。
以下为演讲实录:
王欣:大(dà)家下午好,刚才两位(wèi)专家都介绍了围绕AI大模型运(yùn)营这块的很(hěn)多时间,我今天(tiān)围绕这个话题继续延伸。
过去两年多时间AI很火,AI破圈,我不是做人工智能,我是做(zuò)攻防出身的(de),但(dàn)现在我也加入(rù)到人工智能序列里,因为各行各业在看到AI这块(kuài)技术的革新(xīn)之后,我们看到(dào)了原(yuán)来做不好的技术围绕(rào)着现在整个大模型(xíng)出现(xiàn)可(kě)以达到非常好的效果。
我在比较早期的时(shí)候针对于(yú)AI已经做了(le)很多战略层(céng)面(miàn)的铺垫。但客观地讲,从大模(mó)型这(zhè)件事情上,我们距离国外(wài)还是有比(bǐ)较远的距离。从ChatGPT出现之(zhī)后,我国各大互联网公司、各大行业在训练自己的(de)大模型,去年的时候可(kě)以(yǐ)理解为是国内外大模(mó)型的技(jì)术元年,去年一年时间内(nèi),我看到最多的是几乎每天都有新(xīn)的大模型出现,在每 天(tiān)技术不(bù)断更新过程中,我们思考我们为什么要去做这(zhè)件事情。所以这个 PPT里面第一页看到所(suǒ)有浪潮退去之后要回归到(dào)价值本质。
对于AI来说,本质是一个工具,工具的核心是解(jiě)决业务问题,无论(lùn)是(shì)在安全(quán)行业还是(shì)在其他行业,包括前一(yī)段时间我参加了Gartner一个会,在很多企业里面,大家对于AI有什么期待?核心总结起来是 三个方面:第一(yī)是降低生产成本(běn),第二是提高(gāo)产品质量,第(dì)三是推动产业转型。
我们看到各个(gè)垂(chuí)直领域反而在(zài)做各类的垂直模型,我认为这路是对的,我们可以看到国内有很(hěn)多厂商过去在做通用大模型,我认为通用大模型最(zuì)后(hòu)只会变成少量的一两家,最终围绕通用大模型或者 相对小参数的模型围绕业务往下走的模型。
安全行(xíng)业也一样,安全行业发展了二十多(duō)年,我大学毕业前就开始接触安全,也(yě)将近二十年左右的时间,在整个感触里面,其实安全是存在一个天(tiān)平的问题,很多时候我们(men)希(xī)望告(gào)警比较少,但又不希望有漏洞,我们希(xī)望业务(wù)优先但又希望安全第一,我们希望(wàng)用更少的成本又希望安全整体防御做的更好(hǎo)。
在整个(gè)技术迭代过程中可(kě)以看(kàn)到,原来出现了很 多安全产品,但这些安(ān)全(quán)产品有时(shí)候不能完全(quán)去解决客户问题,在这个情况下怎么办?堆人。但人是不是一个最优解?很多,包括后面会讲到一些case,我们(men)铺了很多产品不够人去凑,但人的成本持续上升,很(hěn)难(nán)通过人去 填补最后一公里。所以我们(men)就在看,围绕着安全现在这样(yàng)一个(gè)痛点现状,我(wǒ)们(men)大模型能否带来(lái)这里面的变化,我(wǒ)们把AI作为一个工具(jù),我(wǒ)们(men)核心分析了痛点,看(kàn)大模型能不能解(jiě)决(jué)。
大模型我总结了几(jǐ)个点,第一个,就之前人工(gōng)智能技术有更强的理解指令的能力,这里我认(rèn)为是两层(céng):一是本(běn)身为软(ruǎn)件工程,对机器理解的指令更(gèng)强;二是人工智能为拟人化的学科,本身更接近于跟人的对话。第二(èr)个,理解意志。就是它有更强的泛化(huà)能力,所以我们在安全很多的业(yè)务很难(nán)做到非常标(biāo)准的SOP。所以我们是希望(wàng)掌握一些知识之(zhī)后还有更强的泛化能力。第三个,具有更(gèng)强(qiáng)的COT能力(lì),因(yīn)为很(hěn)多安全任务不是(shì)一个简王欣:通用大模型最后只会变成少量的一两家单的问题,其实是一个复杂问题,所以在很多安全任务(wù)处 理(lǐ)过(guò)程中需要加一个复(fù)杂(zá)问题把它拆解成(chéng)更加简单的问(wèn)题、多个问题,大模型(xíng)思维链的(de)问(wèn)题本身比较适合做安全相关任务。第四个,有快速的学习成长跟复制的能力。很多安全行业里面,人的经验复(fù)制是很难的,如何从数据驱动到知识(shí)驱动,到变(biàn)成一(yī)个平台级的能力,这个(gè)层面我觉得是大模型对这个行业来说很大的价值。
所以围绕着上面所(suǒ)有,我认为(wèi)人(rén)工智能可(kě)以填补这里面(miàn)的鸿(hóng)沟,建立(lì)起一座桥梁之后,向左可(kě)以提(tí)高我们整个产(chǎn)品质量,向右可以提高整个服务(wù)的能效。所以我们不断地在思考、在探(tàn)索,在具体的每个业务(wù)链上到底有什么样的安全问(wèn)题。
在另外一个层面,刚才余总也介绍到,大模型本身偏向于是(shì)人的大脑,偏向于类似于咨询专家。但(dàn)我们更希望,具体的一些咨 询专家能(néng)不能动(dòng)手帮助完成所有任务,所以(yǐ)我们这上面的思考是通过智能体的放,通过连接下层(céng)原来的产品,围绕着上(shàng)述业务场景构建相关(guān)智能(néng)体,融入原来(lái)的安全体系。
所以这里(lǐ)我想抛一个观点,新的(de)技术出现不 是去解决新的问题,而(ér)是更多(duō)和(hé)原 来产品进行结合,解决原来传(chuán)统解决不好的(de)问题,这是王道、是正道(dào)。另外,很多时候对于大模(mó)型来说,是不(bù)是(shì)可以提高很高的效率?在这个点上,我原来跟很多业内专家去(qù)聊,其实它(tā)提升的是机器做不(bù)好的、需要人介入(rù)的(de)这一块的工作效率,对于现在大 模型本(běn)身推理和各方面性能原因,原来机器性能已经(jīng)这样,在机器性(xìng)能上再(zài)叠加,这在(zài)当前 技术阶段不是特别成熟。
第二个 层面(miàn),在整个AI这(zhè)一块,我在很多客户聊(liáo),大模型是不是很多(duō)原来(lái)解决不了的(de)问题现在都可以通过人工智能来(lái)解(jiě)决(jué)了?其实远远不够,我们(men)的梦想(xiǎng)非常高(gāo),但 大模型现在还在(zài)一个技(jì)术(shù)的爬坡阶段,有很多问题,无论是幻觉问题、性(xìng)能问题、指令遵循问题等等一系列,并不是在所有任务(wù)上都能处理得很好,但不能低估了这个技术未(wèi)来发展空间(jiān)。所以当前阶段要看有哪些痛点,大模型(xíng)当前(qián)阶段最合适做什么工作,主编边走(zǒu)边(biān)爬坡,边跟现在的业(yè)务(wù)结合,给现在业务痛(tòng)点(diǎn)带来(lái)相关价值。
过去(qù)我们内部做(zuò)了很多头脑风暴,思考现在有什么样的痛点,大(dà)模(mó)型能否解决什么问题,如果可(kě)以(yǐ),我们就开(kāi)始(shǐ)组织预演,组织预演可以(yǐ),然后工程化,工程化再可以给客户一个持续的优化过程。所以我们(men)其(qí)实做了好多好(hǎo)多的尝试,这里面有很多也是失败 了,包括最早的(de)时候我们想说原始(shǐ)流量是否可(kě)以直接丢给大模型,大模型是(shì)否能够独立针对于大型的软(ruǎn)件工程,然后进行源(yuán)代码的挖掘,包括能不能做全自动化(huà)复杂场景的渗透。刚(gāng)才我说的这个场景分(fēn)别代表了大模(mó)型现在的三个(gè)缺陷(xiàn)。这里不展开详细去聊这个话题了。
实践过程中有几个点(diǎn)做(zuò)的还(hái)可以,第一(yī)个是安全运营相关的(de)场景,安全运营,刚才两位专(zhuān)家也提到,我们越来越关注安全,整(zhěng)个法律(lǜ)体系的构建越来越完善,采(cǎi)集到的日志越来越多,形成的(de)告警越来(lái)越多。第二个是我们对手整个攻击(jī)越来越智能化、自动化,包括互联网上攻击攻防之间(jiān)的博弈越来越强烈,所以我们其实在现在发现告(gào)警越来(lái)越多,我走(zǒu)访了很多客户,一天告警可(kě)能在几十万到(dào)几(jǐ)百万,但是一个工程(chéng)师一天大概只(zhǐ)能处理个一千个左右的告警,所以我(wǒ)看了很多客户招了几十个人专门做安全运营,但是几十个人,假设我们(men)要把所有的日(rì)志告警分析(xī)的话,远远不够。我们在思考(kǎo)大模型在这个点上可以(yǐ)解(jiě)决很好的问题,因为它本(běn)身的分析逻辑、它的技能是可以相对的(de)通(tōng)过一些知识经验传(chuán)递的方式给到大模(mó)型。但这一块,就不展开讲了,因为前面两位专家主要是围(wéi)绕这个话题来讲。
大家对(duì)于安全运营期待的第二点是未知威胁的发(fā)现(xiàn)。今年8月份我们团(tuán)队去BlackHat(全球一个顶尖(jiān)的黑帽子大会(huì)),当时做了一(yī)个分享,就是利用大模型进行威胁狩猎(liè)。这个相关技(jì)术成果在2024年国家网(wǎng)络安全宣传(chuán)周上进(jìn)行了公布,这个赛 道(dào)我们也是 拿到了第一名。因为大模型有比较强的泛化的能力(lì),对于原来很多规(guī)则都是从已知到已知问题的发现,但是大模型可(k王欣:通用大模型最后只会变成少量的一两家ě)以在一定(dìng)程度上做的一个已知到未知的发现,通过这样的方式极大提升了我(wǒ)们整个狩猎能力包括过去很(hěn)多APT的线索,通过这样的方式得到了有效的产出。
这些相关成果我就不(bù)展(zhǎn)开讲了,因为文字比较多,全部阐(chǎn)述清楚需要比较长的时间。
前面讲的东西都偏向安全运营,后面讲数据(jù)安全相关的东(dōng)西。业界做数据(jù)安全国内已经推了很多年,但整(zhěng)体(tǐ)落(luò)地存在挑战,这里本身有数据安(ān)全跟业务更加连接(jiē),跟业务(wù)更加相关,不同客户整个数据安全需求也不(bù)一样(yàng)。另(lìng)外一(yī)个层面,过去很多传统技术无(wú)法很(hěn)好的支持数据安全的落地,比如分类和分级,过去客户侧结构化数据有不同的(de)业务(wù)类型和不同程序员开发,数(shù)据库(kù)涉(shè)及方式不一样,表字段(duàn)命名不一样(yàng),很难通过原来通过规则或(huò)者关键字的方式形成一套识别的工具,我们过去看过很多数据分类分级的产品,识别 率是比较低的(de)只有对于他认识的,之前做过关键(jiàn)词(cí)这类的识别(bié)的比较高,相对业(yè)务(wù)更新一点(diǎn)或者整个数据库设计、命名有一些(xiē)特(tè)殊性或者有其他差异就识别不出来。
围绕这个,就是我画的图,前(qián)面产品,后面堆人,通过这样的方式堆了很(hěn)多人,数据分(fēn)类分级,我们知道很多客户非结构化数据,然后一个数据库可能就几千张几万张表甚(shèn)至十几万表,或者一个客户现场(chǎng),一天一个人,分析(xī)的大概也是(shì)差不多一(yī)千个。
我们有一个运营商的客户跟我们(men)说了一(yī)个事情,说我这边有(yǒu)1500万个字段,能不能做相关的(de)数据(jù)分(fēn)类分级。用传统的方(fāng)式,不知道大家有没有概(gài)念(niàn),但做了计算,如果按照传统的方式(shì),大(dà)概需要把两到三个人从实习阶段直(zhí)接干到退休。我们(men)去推动这个点,我觉得是打开数据(jù)安(ān)全的基础,我们也(yě)做(zuò)了很多实践,其实本身是对于自然语言的理解,结(jié)构化数据里(lǐ)面本身字段表之(zhī)间有关系,所以我们通过AI的(de)方式让它自动化的去推测每一个字段里的含义,并且归到相应的内(nèi)容。这里面我们识别到的准确率,其实比人工(gōng)专家(jiā)还要高,因为专家有时候是带情绪的,有时候不(bù)是理性的(de),认为这一秒(miǎo)应(yīng)该分到(dào)这里,下一秒做类似工作(zuò)认为应该在另外一边,整个思维更加跳跃。
在具体案例里面我们做了很多的客户实践发现,整体(tǐ)效率(lǜ)提(tí)升30倍左右,虽然这(zhè)里面百万个字段除1000个字段,10万 字段除以1000个字段(duàn),效率提升不仅30倍,但因为整个项目交付有(yǒu)其他环(huán)节,所以(yǐ)我们整体算(suàn)下来大概(gài)有30倍效率的提升。这后面是具体的项(xiàng)目,我不展(zhǎn)开讲了。
刚刚(gāng)讲的(de)是结构化数据,数据安(ān)全里面非结构化(huà)数据,过去这一块也是老大(dà)难的问题,因为(wèi)我们(men)肯定(dìng)知道有很(hěn)多终端的DLP包括网络的DLP去针对(duì)于文本的(de)内容进行(xíng)识别,过去DLP的初代、二代更多是通过一(yī)些文件(jiàn)的格式(shì)、编码(mǎ)、关(guān)键词,后面又增加了一些NLP的技术,其实整(zhěng)体的识(shí)别率是很(hěn)低的,误报率(lǜ)很高的。
今天是安全场,在座很多人(rén)可能是(shì)知(zhī)道这一块的(de)现状,所以我就不展开讲了(le)。大模型本身有很强的文(wén)本理解能力、有很强的总结归纳的能力。所以我们对于不同的业务数据进去之后,这边分析完一个文档之后,认为是一个员工工资表,所以认为是一个4级文(wén)档。后面分(fēn)析完认 为(wèi)是一个技术设计文档,所以(yǐ)属于4级高敏感等等(děng)。通过这种方式,原来是(shì)把人的思维抽象成了一(yī)个规则,而 现在是用借助人的思考方式、阅读方式、总结归纳的能力让它去识别相(xiāng)关(guān)的信息。所以我认为在过去原(yuán)来传(chuán)统技术叠加是一代二代三代,大模型在(zài)这个点(diǎn)上的价值(zhí)是跨代的。如果有兴趣后(hòu)面再详(xiáng)细交流。
关于API安全也是一(yī)样,在整(zhěng)个API安全这一块也是围绕数据安全这几年比较火的一个点,过去API安(ān)全(quán)里面存在一些问题(tí),比如API接(jiē)口识别的准确率,包括API脆弱性的一些识别以及(jí)研 判能 力(lì),包括API接口(kǒu)调用(yòng)的敏感数据以及敏感数据(jù)所对应的行为事件所分析(xī)出 来的一些(xiē)异常行为之类等等安(ān)全相关的维(wéi)度,但过去(qù)在这里面处理的(de)都(dōu)不是(shì)特别好,然后我们通(tōng)过让大模型去做API的提纯,包括做异常行为的分析。这是一个真实的例子(PPT图),央企(qǐ)的例子,通过这样的方式识别到真正某(mǒu)一(yī)个IP在(zài)夜间拖取相关数据大概(gài)达到多少条,API的安全其实有很多(duō)的产品(pǐn)功能,但(dàn)是我认为对于客户来说,这(zhè)是最最关心的,就(jiù)因为API安全建好之后,到底有谁通过(guò)我这个API接口偷数据和爬数(shù)据。
最(zuì)后一页我快速讲一下,整个数据(jù)大模型这一块针对于安全,包括大模型本身(shēn)技术(shù)当前现状,我(wǒ)们认(rèn)为还是在爬坡阶段(duàn)。过去(qù)我们提(tí)到的(de)是偏向于一个智能问答(dá)到现在的一(yī)个辅助(zhù)驾驶,可以做大部分工作,最(zuì)后(hòu)人工做一些check。我相信在不远(yuǎn)的(de)将(jiāng)来,在一些关键(jiàn)的任(rèn)务上可以实现无人驾驶的(de)效果,因为目前我们在一些(xiē)新的领域上已经看到(dào)了,已经实践出来了(le),后面找机会再(zài)跟(gēn)各位再做(zuò)进(jìn)一步的汇报(bào),我的汇报就是这些,谢谢大(dà)家。
新浪声(shēng)明:所有(yǒu)会议实录(lù)均为现场速记整理,未(wèi)经演讲者审阅,新浪网登载此文出于传递更多(duō)信息之目的,并不意味(wèi)着赞同其观点或证实其描述。
责(zé)任编辑:梁斌 SF055
未经允许不得转载:橘子百科-橘子都知道 王欣:通用大模型最后只会变成少量的一两家
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了