橘子百科-橘子都知道橘子百科-橘子都知道

王欣:通用大模型最后只会变成少量的一两家

王欣:通用大模型最后只会变成少量的一两家

专题:2024中国AIGC创新发展论坛

  2024年服贸会专题论(lùn)坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。安(ān)恒信(xìn)息中央(yāng)研究院(yuàn)院长王欣(xīn)出席并演讲。

  王欣认为,国内有很多(duō)厂商在做通用大模型,但通用大模型最后(hòu)只会剩下成少量的一(yī)两家,“我们 看到各(gè)个 垂直领域(yù)反而在做(zuò)各类的垂直模型,我认为这路是对(duì)的”,他认为,最 终是围绕通用大模型或者(zhě)相(xiāng)对小参数的模型围绕业 务下沉的模型。

  以下为演讲实录:

  王欣:大家下午好,刚才两位专家都介绍了围绕AI大模(mó)型运营这(zhè)块的很多时间,我今天围(wéi)绕这(zhè)个话题继续延伸。

  过去两年多时(shí)间AI很火,AI破(pò)圈,我不是做 人(rén)工智能,我是(shì)做攻防(fáng)出 身的,但现在我也加入到人工智能序列里,因为(wèi)各行各业在(zài)看到AI这块技术的革新之后,我们看到(dào)了原来做不好的技术围绕着现在整个(gè)大模型出现可以达到非常(cháng)好的效果。

  我在比较早期的时候针对于AI已经做 了很(hěn)多战略层面的铺垫。但客(kè)观地讲,从大模型这件事情上,我们距离国(guó)外还是有比较远的距离。从ChatGPT出现之后(hòu),我国各大互联网公司、各大行业在训练自己的大模型,去年的时候可以理解为是国(guó)内外大(dà)模型的技术元年,去年一年(nián)时间内,我看到最多的是几乎每天(tiān)都有新的大模(mó)型出现,在每天技术不断(duàn)更新过程中,我们思考我们为什么要去做这件事情。所以这个PPT里面第(dì)一页(yè)看到所有浪潮退去之后(hòu)要回归到价值本质。

  对于AI来(lái)说,本质是一个工具,工具的核心是解决业务问题,无论是在安全行业还是在(zài)其他行业,包括前一段时间我参加了(le)Gartner一个会,在很多企业里面,大家对于AI有什么期待?核心总结起来是三个方面:第一是降(jiàng)低生产成本,第二是提高产品质量,第(dì)三是推动产业转型。

  我们(men)看到各个垂直领域反而在做(zuò)各类的垂(chuí)直模型(xíng),我认(rèn)为这路是对的,我们可以看到国内有很(hěn)多(duō)厂商过去在做通用大模型,我认为通用大模型最后(hòu)只会变成少量的一(yī)两家,最终围绕通用大(dà)模型或者相对小参数的模型围绕业务往下走的模型(xíng)。

  安全行业也一样,安全行业发展了二十多年,我大学(xué)毕业前就开始接触安全,也将近二十年左右的时间(jiān),在(zài)整个感触里面,其实安全 是存(cún)在一个天平的问(wèn)题,很多时(shí)候(hòu)我们希望(wàng)告警比较少,但又不希(xī)望有漏洞(dòng),我们希望(wàng)业务优先但又希望安全第一(yī),我们希望用更少的成本(běn)又希望安全整体(tǐ)防(fáng)御做的更好。

  在整个技术迭代(dài)过(guò)程中可以(yǐ)看到,原来出现了很多安全产品,但这些安全产品有时候不能完全(quán)去解决(jué)客(kè)户问(wèn)题,在这个情况下怎么办?堆人。但(dàn)人是不(bù)是一(yī)个最优解(jiě)?很多,包括后面会讲(jiǎng)到一些(xiē)case,我(wǒ)们(men)铺了很多(duō)产品(pǐn)不够人去凑,但人的(de)成本持(chí)续上(shàng)升,很难通过人去(qù)填补最后一公里。所(suǒ)以我们就在看,围(wéi)绕着(zhe)安全现在这样一个痛点现状,我们(men)大模(mó)型能 否带来这里面的(de)变(biàn)化,我们把AI作为一个工具,我们核心(xīn)分(fēn)析了痛点,看大模型能不能(néng)解决(jué)。

  大模型我总结了几个点,第一个,就之前人工智能技术有更强的理(lǐ)解指令的能力(lì),这(zhè)里(lǐ)我认为是两层:一 是本身为(wèi)软件工程(chéng),对 机器理(lǐ)解的指令(lìng)更强;二是(shì)人工智能为拟人(rén)化的学科,本身更接近于跟人的对话(huà)。第(dì)二(èr)个,理解意志。就是它有更强的泛(fàn)化能力,所(suǒ)以我们在安全很多的业(yè)务很难(nán)做到非常(cháng)标准(zhǔn)的SOP。所以我们是希望掌握一些知识(shí)之后还有更强的泛化能力。第三个,具有更强的COT能力,因为很多安全任务不是一个简(jiǎn)单的(de)问(wèn)题,其实是一个复杂问(wèn)题,所以在很多安全任务处理过程中需要加一个复杂问(wèn)题把它拆解成更加简单(dān)的问(wèn)题、多个问题,大模型思维链的问题本(běn)身比较适合做安全相关任(rèn)务。第(dì)四个,有(yǒu)快速的学习成长跟复制(zhì)的(de)能力。很多安(ān)全行业里面,人的经验复制是很难的(de),如何从数据驱动到(dào)知识驱(qū)动(dòng),到(dào)变成一个平台级的能(néng)力,这个层面我(wǒ)觉得是大模型对这个行业来说很大的价值。

  所以(yǐ)围绕着(zhe)上面所有,我认为人工(gōng)智能可以(yǐ)填补这里面的鸿沟,建立起一座桥梁之后,向左可以提高我们整个产品质量,向右可以提高整个服务的能效(xiào)。所以我(wǒ)们不断地在思考(kǎo)、在探索,在具体的每个业务链 上到底(dǐ)有什么样的安全问题。

  在(zài)另外一个层面,刚才余总也介绍到(dào),大(dà)模型本身偏向(xiàng)于(yú)是人的大脑,偏 向于类似于咨询专家。但我们更希望(wàng),具体的一些咨询专(zhuān)家能不能(néng)动手帮助完成所有任务(wù),所以 我们这上面的思(sī)考是通过智能 体的(de)放,通过连接(jiē)下层 原来的产品(pǐn),围绕着上述业务场景构建相关智能体,融入原来的安全体系。

  所以(yǐ)这里我想抛一个观点(diǎn),新的(de)技术出现(xiàn)不是去解决新的问题,而是更多和原来 产品进行结合,解决原来传统解决(jué)不好的问题,这是王道、是正道。另外(wài),很多时候对于大模(mó)型来(lái)说,是不是可以提高很高的效率?在这个点上,我原来跟很多业内(nèi)专家去聊,其实它提升(shēng)的是机器做(zuò)不好的、需要人介入的这一块的工作效 率,对于现在大模型本身推理和各方面性能(néng)原因,原来机器性能已经这样,在(zài)机器性能上再叠 加,这在当前技术(shù)阶段不是(shì)特别成熟。

  第二个层面,在整个AI这一块,我在很多客户聊(liáo),大模型是不是(shì)很多原来解决不了的(de)问题现在都可以通过(guò)人工智能来解决了?其实远远不够,我(wǒ)们的梦想非常高(gāo),但大(dà)模型现(xiàn)在还在一个技术(shù)的爬坡阶段,有很(hěn)多问题(tí),无论是幻觉问(wèn)题、性能问题、指令遵循问题等等一系列,并不是(shì)在所有任务(wù)上都能处理得很好,但(dàn)不(bù)能低估了这个技术未来发展空间。所以当前阶段要看(kàn)有哪些(xiē)痛(tòng)点,大模型(xíng)当(dāng)前阶段最合(hé)适做什么工作,主编边走边爬坡,边跟现(xiàn)在的业务结合,给现在业务痛点带来相关价值。

  过去我们内部做了很多头脑风暴,思(sī)考现在有什么样的痛点,大(dà)模型能否(fǒu)解(jiě)决什么问题,如果可王欣:通用大模型最后只会变成少量的一两家(kě)以,我(wǒ)们就(jiù)开始组织预演,组织预演可以,然后(hòu)工程化,工程化再可以给(gěi)客户一个持(chí)续的优化过程。所(suǒ)以(yǐ)我(wǒ)们(men)其实(shí)做了好多好多的尝试,这 里面(miàn)有很多也是失败了(le),包括最早(zǎo)的时候我们想说原(yuán)始流量(liàng)是否可以直接丢(diū)给大模型,大模型是否能够独立针对于大型的软件工程,然(rán)后(hòu)进行源代码的挖掘,包括能不能做全自动化复杂(zá)场景的渗透。刚才我说的这个场(chǎng)景分别代表了大(dà)模型 现在的三个缺陷。这里不展开详细去聊这个话题了 。

  实践过(guò)程中有几个点做的还可以 ,第一个是安全运营相(xiāng)关(guān)的(de)场景,安全运(yùn)营,刚才两位专家也提到(dào),我们越来越(yuè)关注安全(quán),整个法律体(tǐ)系的构建越来越完(wán)善,采集到的日志越来越多,形成(chéng)的(de)告警(jǐng)越(yuè)来越多。第二个是 我们对(duì)手(shǒu)整个攻(gōng)击越来越智(zhì)能化、自(zì)动化,包括互(hù)联网上(shàng)攻击攻防(fáng)之间的(de)博弈(yì)越来越强烈(liè),所以我们其实在现在发现告警越来越多(duō),我走访了很多客户,一天告警(jǐng)可能在(zài)几十 万到几(jǐ)百万,但是一个工程师一天大概只能处理个一千个左右的告警,所以我看了很多客户招了几十个(gè)人专(zhuān)门做安全运营,但是几十个人,假设(shè)我们要把所有的王欣:通用大模型最后只会变成少量的一两家日志告警分析的话(huà),远远不够(gòu)。我们在思考大(dà)模型在(zài)这个点上可以解(jiě)决很(hěn)好的问题,因为它本身的分析逻 辑、它的技能是可以相对的通过一些知识经验传递的方式(shì)给到大模型。但这一(yī)块,就不展开讲(jiǎng)了,因为前面两位专(zhuān)家主要是围绕这个话 题来(lái)讲。

  大家对于安全运营期待的第二点是(shì)未知威胁的发现。今年8月份我们团队去BlackHat(全(quán)球一个顶尖的黑帽子大会),当时做了一个分享,就是利用大模型进行威胁狩猎。这个相关技术成果(guǒ)在2024年国家网络安(ān)全宣传周上进行了公布,这个赛道我(wǒ)们也是拿到了(le)第一名。因为大模型有比较强的泛化的(de)能力,对(duì)于原来很多规(guī)则(zé)都(dōu)是从已(yǐ)知到已知问题的发现,但是大模型可以在一定程度上做的一个已知到(dào)未(wèi)知的发 现(xiàn),通(tōng)过这样的方式极大提升了(le)我们整个狩猎(liè)能力(lì)包括过去很多APT的线索,通过这样的(de)方式得到了有效的产出。

  这些(xiē)相关成果我就不展开讲了,因(yīn)为文(wén)字比较多,全部(bù)阐述清楚(chǔ)需要比较长的时(shí)间。

  前面(miàn)讲的东西都偏向安全(quán)运营,后(hòu)面 讲数据安全相关的东西。业界做数据安全国内已经推了很多年,但整(zhěng)体落地存在挑(tiāo)战,这里本身(shēn)有数 据安全跟业务更加连接,跟业务更加相关,不同客(kè)户整个数据安(ān)全需求也不一样。另外一个层面,过去很多传统技术无法很好的支持数据安全的(de)落(luò)地,比(bǐ)如分类(lèi)和分级,过去客户侧结(jié)构化数据有不同(tóng)的业务类(lèi)型和不同程(chéng)序(xù)员开(kāi)发(fā),数据库涉及方式不一样,表字段命名不一样,很难通过(guò)原来通过规则或者(zhě)关键字的方(fāng)式形成一套识别的工具,我们过去看过(guò)很多数据(jù)分类分级(jí)的产品,识(shí)别率是(shì)比较低的只有对于他认(rèn)识的,之前做过(guò)关(guān)键词这类的识别(bié)的比较高,相对业务更新一 点或者(zhě)整个数据库设计、命名有一 些特殊性(xìng)或者有其他差(chà)异(yì)就识别不(bù)出来。

  围绕这(zhè)个,就(jiù)是我画 的图,前面产品,后面堆人,通过这(zhè)样(yàng)的方式(shì)堆(duī)了(le)很多(duō)人,数据(jù)分(fēn)类分级,我们知(zhī)道很多(duō)客户非结构化数据,然后一个数据库可能就(jiù)几千张几万张表甚至十几(jǐ)万表,或者一(yī)个客户现场,一天一个人,分析的大概也(yě)是差不(bù)多一千个。

  我们(men)有一个运营(yíng)商的客户跟我们说了一个事情,说我这边有1500万个字段,能不(bù)能(néng)做 相(xiāng)关 的数据分类分级。用传统的方式,不知道大(dà)家有没有概念 ,但做了计算,如果按照传统的方式,大概需要把两到三个人(rén)从实习阶(jiē)段直接干到退休。我(wǒ)们(men)去推动这个点(diǎn),我觉(jué)得是打开数据安全的基础,我们 也做了很(hěn)多实践,其实本身(shēn)是对(duì)于自然语言的理解,结构(gòu)化数据里面本身字段表之间有关系,所以我(wǒ)们通过AI的方式让它自动化的去(qù)推测每一个(gè)字段里的含义,并且归到相应的内容。这里(lǐ)面我们识别到的(de)准(zhǔn)确率,其实比人工专家还要高,因为专家有时(shí)候是(shì)带情绪的,有时候不是理性的,认为这一秒应该分(fēn)到这里,下一(yī)秒(miǎo)做类似工作认为(wèi)应该(gāi)在(zài)另外 一 边,整(zhěng)个思维更加跳跃(yuè)。

  在具体案例里面(miàn)我(wǒ)们做了很多的客户实践(jiàn)发现,整体效率(lǜ)提升30倍左右,虽然这里面百万个字段除1000个字段,10万字段除 以1000个字段,效率(lǜ)提 升不仅30倍,但因为整个项目交付有其他环(huán)节,所以我们整体算下来大概有(yǒu)30倍效率的提升。这后面是具体的项目,我不展开讲了(le)。

  刚刚讲的是结构化数(shù)据,数据安全里面非结构化数据,过去这一块也是王欣:通用大模型最后只会变成少量的一两家老大难的问题,因为我们肯(kěn)定知(zhī)道有很多终(zhōng)端的DLP包括网络的DLP去针对于文本的(de)内容进行识(shí)别,过去DLP的初代、二代更多是(shì)通过一些文件的格式、编码、关键词,后(hòu)面又增加了一些NLP的技术(shù),其(qí)实整体的识别率是很低的,误报率很高的。

  今(jīn)天是安全场,在座很(hěn)多(duō)人可能是(shì)知道(dào)这一块的现状,所以我就不展开讲(jiǎng)了。大模型本身(shēn)有很强的文本理(lǐ)解能力、有很强的 总结归纳的能(néng)力。所以我们对于不同的业务数据进去之后,这边分析完 一个(gè)文(wén)档之后,认为是一个员工工资表,所以认为是(shì)一个4级(jí)文档 。后(hòu)面分析完认为是(shì)一(yī)个技术设计文档,所(suǒ)以属于(yú)4级高敏感等(děng)等。通过这(zhè)种(zhǒng)方式,原来是把人的思维抽象成了一个规则,而现在是用(yòng)借助人的(de)思考方式、阅读方式、总结归纳的能力让它(tā)去识别相关的信(xìn)息。所(suǒ)以我认为在过去(qù)原来传统技术叠加是一代二代三(sān)代,大模型在(zài)这个点上的价值是(shì)跨代的(de)。如果有兴趣后面再详细(xì)交(jiāo)流。

  关于(yú)API安全(quán)也是一(yī)样,在整个API安全(quán)这(zhè)一(yī)块也是围绕数(shù)据安(ān)全这几年比较火的一个(gè)点,过去 API安全里面存(cún)在(zài)一些问题,比如API接口识别的准确率,包括API脆弱性(xìng)的一(yī)些识别以及研判能力,包(bāo)括API接口调 用(yòng)的敏感数据(jù)以(yǐ)及敏(mǐn)感数据所对应的(de)行为事件所分析出来的(de)一些异常行为之类等等安全相关的(de)维度,但过去在这(zhè)里面处理的都不是特(tè)别好,然后我们通过让大模型去做API的提纯,包括做异常行为的 分析。这是一(yī)个真实的例子(PPT图),央企的例子,通过这样的方式识(shí)别到(dào)真正某一(yī)个IP在夜(yè)间拖取相关数据大概(gài)达到多少条,API的安全其实有很多的(de)产品功能,但是我认为对于(yú)客户来(lái)说,这(zhè)是最最关(guān)心的,就因为API安全建(jiàn)好之后,到底有谁通(tōng)过我这(zhè)个API接口(kǒu)偷数(shù)据(jù)和爬数据。

  最后一页我快速讲一下,整个数据大(dà)模型这一块(kuài)针对于安(ān)全(quán),包括大模型本身技术当前现状,我们认为还是在爬坡阶段。过去我们提到的是偏向于一个智能问答到现(xiàn)在的一个辅助驾驶,可以做大部分工作(zuò),最后人工做一些check。我相信在不远的将来,在(zài)一些关键的任务上可以实现无人驾驶的效果,因为目(mù)前我(wǒ)们在一些新的领域上已经看到了,已经(jīng)实践出来了,后面找机(jī)会再(zài)跟各(gè)位再做进一步的汇报,我的汇报就是这些,谢谢大家(jiā)。

  新(xīn)浪声(shēng)明:所有会议(yì)实录均为(wèi)现场速记整理,未经演讲者审阅,新浪网登载此文出(chū)于传递更多信息之目的,并不意味着赞(zàn)同其观点或(huò)证实其(qí)描述。

责任编辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 王欣:通用大模型最后只会变成少量的一两家

评论

5+2=