橘子百科-橘子都知道橘子百科-橘子都知道

龙志中:2024年是人工智能爆发期

龙志中:2024年是人工智能爆发期

专题:2024中(zhōng)国AIGC创新发(fā)展论(lùn)坛

  2024年服贸会专题论坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。曙光(guāng)云计算集团股(gǔ)份有限(xiàn)公司总 裁助理龙志中出席(xí)并演 讲(jiǎng)。

  龙志中表示,2024年是进(jìn)入到了人工智能的爆发期。今年(nián)前(qián)8个月,在(zài)手机(jī)移动端上,人工智能应用收入与去年相比同比增长了51%,预计(jì)今年整个(gè)收入会(huì)达到33亿美元的规模。

  龙志中(zhōng)介绍,曙光一直是一家专注做计算的企业,创立之初(chū)到现(xiàn)在(zài),一直(zhí)围绕着计算的核心部件,主要产(chǎn)品,以及(jí)计算的基础设施建设和运营服(fú)务,来打造核(hé)心竞争力。

  龙志中表示,曙 光致力于提供解决方案,以降低使用人工(gōng)智能大模型在算力方面(miàn)的门槛。具体来看,曙光能够 提 供(gōng)的(de)助力有三个(gè)方面:第一是人工智能相关的核(hé)心部件,主要产品,还有关(guān)键的基础设(shè)施,包括PUE在(zài)1.04以(yǐ)下的全液冷数据中心。第二是算力中心的建设和运营。目前曙(shǔ)光(guāng)在全国有二十多个大型的算力中(zhōng)心、智算中(zhōng)心、先进(jìn)计算中(zhōng)心,以及五十(shí)多(duō)个城市云中心,能够为企业、区域/城市(shì)能 够提供澎湃、多样的算力(lì)资源(yuán)。第三(sān)是(shì)人工智(zhì)能的生态(tài),在目前主流的大模型跟曙(shǔ)光的核心部件,主要产品还有算力(lì)平台基本上都做了适配,并且在算力互联网上能(néng)够提供生态合作伙伴的大(dà)模型服务。通过接入算力互联网(wǎng),企业不需要自己去构建算力基础设施的平台,甚至不需要去部署自己的大模型,可以直接采用多样的(de)算力服务和大 模型服务。

  以下为(wèi)演讲实录:

  龙志中:各位专家,各位嘉宾,大 家上午(wǔ)好,我(wǒ)是曙光云的龙(lóng)志中 ,今天非常荣幸能(néng)够(gòu)跟各位专家学习(xí)AIGC大模型、人(rén)工智能(néng)领域最新的前沿理论和(hé)成果,也有机会跟大家一起探讨(tǎo)人(rén)工智能AIGC对于我(wǒ)们今天以及未来的生活方式、工作模式(shì)、创新(xīn)范式所带来的(de)深远影响。也想借这个机会跟大家汇报一 下(xià)曙光云在企业开发大(dà)模型、应用大模型的过(guò)程当中,能够为大家提供哪些助力。

  曙(shǔ)光跟今(jīn)天前面分(fēn)享的嘉宾所在的企业有所(suǒ)不同,前面这些企业更多是在开(kāi)发大模型(xíng)或在做大模型应用场景侧的开发,给大家提供的(de)是大模型本身(shēn)、大(dà)模型应用(yòng),为我们的生活和工作所(suǒ)带来的便利。曙光相对(duì)来讲更偏底层(céng),我们做的是计算基础设施和算力服务,也就是说我们为大模(mó)型的开发和(hé)大模型(xíng)应用提(tí)供基础设施和算力服务,按照(zhào)大模型三层架构分类的话,我们是(shì)在上(shàng)游;从技术架构层次来分的(de)话,我们是在底层。

  刚才几位嘉宾都提到,AIGC生成式大模型在这两年,特(tè)别是2022年之后成为一个热词,我们看到(dào)的多个榜单里面,特别是(shì)在2023年(nián)度热词榜单里面AIGC都是排在前几位甚 至排在首位的。1957年人 类就已经用计(jì)算机生成(chéng)了(le)历史上第一首机器创作的音乐作品(pǐn)。直到2022年(nián)11月份,有一(yī)个标志性的事件 就是OpenAI的GPT,从那个时刻开始人类对于人工智能的应用才从传统(tǒng)的“知识的分类器”进化到“内容的生成器”。

  从2023年(nián)开始,我们非常明显地可以 看到“百模大战”,2023年(nián)中(zhōng)国发布的人工智能大模型是300多个,我们也认为从2023年(nián)开始AIGC或者人工智能大模型开始渗透 到 我们的工作、生活的各个方面。我昨天看到一个新闻,谷歌的联合创(chuàng)始人谢(xiè)尔盖退休两年了,现在被AI广阔的前景所吸引,重新回到(dào)一线敲代码,他抱怨自(zì)己的员工、程序(xù)员用人工(gōng)智能写代码(mǎ)的比例太低了。人工智能除了可以生成(chéng)图(tú)片 、生成(chéng)文 字,现在能够生成音频、视频、影视(shì)作品,能够写代码。

  同时,很多人(rén)之前查(chá)资(zī)料,查素材(cái)、查数据的时候用搜索引擎。但现在,我相信很多(duō)人已(yǐ)经在用Kimi、豆包 ,取代了以(yǐ)前要(yào)借助百度、谷歌(gē)所要完全的相关搜索,甚至知识的提炼和知识的整理工作。

  2024年是真正(zhèng)进入(rù)到人工智(zhì)能的爆发期或者叫井喷(pēn)期。今年前8个月(yuè),在手机移动端上人工智能的应用(yòng)收入(rù)跟去(qù)年相比同比增长了51%,预计(jì)今年整个收入会(huì)达到33亿美元的规模(mó)。今天(tiān)我们也听到了很多人工智能头部厂商的专家(jiā)给(gěi)我们带来了最新(xīn)成果(guǒ),从侧面证明2024年人(rén)工智(zhì)能真正的井喷期已经(jīng)到来(lái)了。

  从(cóng)未来发展来(lái)看,Gartner预测,2027年生成式人工(gōng)智能市场规模会超1800亿美元,占全球(qiú)整个AI支出(chū)的42%。

  我们一直说算力、算法和算料(liào)(或者数据)是(shì)人工智能发展的三(sān)大要素,从AIGC角度来(lái)讲,算力、算法和算料也是AIGC发展的三(sān)大(dà)要素(sù)。现在大家有一(yī)个(gè)普遍共(gòng)识,大模(mó)型(xíng)意味着(zhe)大成本,也就(jiù)是说大模型是一个非常烧钱的生意,或者说是一个非(fēi)常(cháng)烧钱的游戏。大模型厂商的整(zhěng)体运营成本,一般来(lái)看分为三(sān)部分,第一部分(fēn)是用于推理(lǐ)的成本,第二部(bù)分用于训练的成本,第三部分(fēn)是人工成(chéng)本(就是程序员(yuán)、管(guǎn)理(lǐ)人员、测试人员)。中国工程院院(yuàn)士郑纬民教(jiào)授的测算结果(guǒ)表明(míng),大模型训练中70%的成本是(shì)用在 算力上,推理 过(guò)程当中这 个比例就(jiù)更高,超(chāo)过了95%。根据OpenAI2024年的财务预测,预计2024年(nián)总的运营成本会达(dá)到(dào)85亿美元,里面15亿(yì)美金是人工成本,就(jiù)是工程师 成本,另外70亿(yì)中的30亿是训练成本(běn),40亿是推理的成本,绝(jué)大部分都是用于采(cǎi)购(gòu)算力。这个说明,确实做人工智能大模型(xíng)、做AIGC,算力是我们所(suǒ)有运营成本里面(miàn)占比最(zuì)大的一(yī)块,也(yě)是(shì)最重要的一块。所以OpenAI的CEO把OpenAI这家公司定(dìng)义成了一(yī)家(jiā)硅谷历史上最资金密集型的(de)一(yī)个初创公司。

  我们知道现在进入到数字经济的时代。国家(jiā)数(shù)据局的(de)刘烈宏局长认为算力就(jiù)是数字经济时代的(de)新质生产力(lì)。有(yǒu)一个指数就叫“计算(suàn)力指数”,计算力指数平均每增长(zhǎng)一个百分点,所带来的数字经济和GDP的(de)增长会分别(bié)增长(zhǎng)3.3%和1.8%。目前的算力市场(chǎng)有几个(gè)类型:第(dì)一类是通用算(suàn)力(lì)或者基础算力,第二类是智能算力,第三类是高级算力 ,另外一种算力 叫(jiào)量子算力。

  从我们看到(dào)的调研机构数据来看(kàn),2021年的时候,智能算力在整个中(zhōng)国整体算力(lì)规模里的(de)占比已经超过了50%,达到了 51%,并且(qiě)到2030年的时候这(zhè)个比(bǐ)例(lì)还会持续增加,预计会(huì)占到整个算力规模的 72%。同时,信通(tōng)院(yuàn)的(de)预测是到2030年的时候 ,人工智能算力需求(qiú)跟18年相比会增加(jiā)390倍。所以我们讲数据、算法和算(suàn)力(lì)是数字经(jīng)济的关键(jiàn)资源,数据或者算料成为新的(de)生产(chǎn)资料,算力成为了新(xīn)的生产力,或者按照现在的说法成为新质生产力,算(suàn)法成为现在新的生产关(guān)系。

  刚(gāng)才我们(men)讲到算力,在整个(gè)人工智能的发展过 程(chéng)当中 ,算(suàn)力的需求或者算力所占用的成本应该 是(shì)非常高的,超过的50%以(yǐ)上。同时(shí)我们可以(yǐ)看(kàn)到,随着大模型成为AI领域(yù)新的开发范(fàn)式,AIGC对于(yú)训练数据的需求也是呈指数级(jí)增加(jiā)的(de)。从ChatGPT到谷歌的switch transformer,模型规模和(hé)数据规模是持续巨量增加的,可以认(rèn)为是(shì)指数(shù)级的增加,数据(jù)和参数规模在一年之内增长了一百倍之多。同(tón龙志中:2024年是人工智能爆发期g)时(shí)随着大模型的参数和所需(xū)数据量激(jī)增,所需(xū)要的智能化底座规模也是会越来越大,特别是对于算力(lì)的需求更是(shì)如此。在小 模型时代,更多是(shì)用(yòng)于图像、语 音和文本分析的(de)时代,可能很多时候我们单(dān)机(jī)规(guī)模(mó)就能满足(zú)我们一般的需求。到了以ChatGPT为代表的文(wén)本大模(mó)型时代,参数规模基本上超过了千(qiān)亿(yì)。所需要的计算集群或者算力底座的规模也进入(rù)千机(jī)万(wàn)卡时代。目前做大模型竞争,千机万卡基(jī)本成为(wèi)了门槛或者(zhě)是标配。到了(le)多模态大模型的时代(dài),比如谷歌的switch Transformer,参数(shù)规模达到了1.6万亿,这种规模大模型(xíng)需要万机十万卡规模(mó)的集群来承载(zài)。

  现在千机万卡已经成为(wèi)大模型厂商的一个(gè)门槛,一个入门的入(rù)场券,但其实并不是所有的企(qǐ)业要用到大模型都需要自己去构建这么大规模的算力底座。AIGC或者人工智能这个领域的三层模型是大家公认的一个分层模 式。根据企业在这个领域(yù)里(lǐ)的产业分工,分为上游、中游和下游。上游就是基础设施,包括关核心部件(jiàn)、主要产品和(hé)基础 设施的服务,以及预训练(liàn)模型和数据的供给(gěi)。中游就(jiù)是今天在座很(hěn)多的AIGC头部企业,在做model as a service,做垂直化、场景化、个性化的大模型落地。下游就是应(yīng)用层,面向企业、面向(xiàng)个人来(lái)做内(nèi)容生产、设计、分发等大模型(xíng)场景应用。在AIGC的三个层 面,所需要的算力资源规模、类型、获取途(tú)径是不一样的(de)。

  曙光(guāng)一 直(zhí)是一(yī)家专注 做计(jì)算的企业,创立之初(chū)到(dào)现在,一直(zhí)围绕着计算(suàn)的核心部件,主要产品,以及计算的基础设施建设和(hé)运营服务,来打造自己(jǐ)的核 心竞争力。我(wǒ)们可以看(kàn)到,目(mù)前在人工智(zhì)能这个领域(yù)所面临的挑战或者困境有几(jǐ)个(gè):一(yī)个(gè)是算力资源(yuán)获取的便利性、普惠性、技术架(jià)构的开放性、算力的融合性以及能耗方面的高开销。

  曙光也希望(wàng)在这些(xiē)领域(yù)能够(gòu)给大家提供(gōng)解决方案,来(lái)降低使用人工智能大模(mó)型在(zài)算力方面的一些门槛。曙光(guāng)能够(gòu)提供的助(zhù)力有三个 方面:第(dì)一是人工智能相(xiāng)关的核心(xīn)部件,主要产品,还有关键的基础设施,包括PUE在(zài)1.04以(yǐ)下的全液冷数据中心。第二(èr)是算(suàn)力中心的建设和运营。目前我们(men)在全国有二十多个大型(xíng)的算力中心、智算中心、先进计算中心,以及五十多个城市云中心,能(néng)够为(wèi)我们的企业、为我(wǒ)们的(de)区域/城市能够提供澎湃、多样的算(suàn)力资源。第三是人工(gōng)智(zhì)能的生态,在目前主流的大模(mó)型跟曙光的核心部件,主要产品(pǐn)还(hái)有算力平台(tái)基本上都做了适配(pèi),并且在算力互联网上能够提(tí)供生态合(hé)作伙伴的大模型服务。通过接入算力互联网,企业(yè)不需要自己去构建(jiàn)算力基(jī)础设施(shī)的平台,甚至不(bù)需要去部署自己的大模型,可 以直接采用多(duō)样的算力(lì)服务和大模型(xíng)服(fú)务。

  一些(xiē)城市要打造数字基础设施,来服务于数字化经济发展(zhǎn),为企业数字化转型 提供动力。曙光在全国各地建(jiàn)设运营的(de)数据中心有四大类:先进计算中心,云计算中心、智能计算(suàn)中心、一体化大数据中心节点。这些算力基础设施(shī),符合信创要求(qiú)和(hé)标准来构建,采用了浸(jìn)没式的液冷技术将能耗降(jiàng)到最 低。再(zài)结合曙光本地化专业团队和运营服务(wù),可以为 我们区域数字经济发展和企业数字化(huà)转型提供(gōng)动力。

  有些企业希望在通用大龙志中:2024年是人工智能爆发期模型或行业大模型基础之上构建自己企(qǐ)业的大模型应用。曙光也可以提(tí)供云数智底座,帮助企业打造私有的大模型基础设施。在云数智(zhì)底座里面不(bù)仅提供AI算力 、AI储力的基础设施,还能提供数据(jù)平 台,数据平台帮助企业进行数据 的(de)全生命周期管理,同时为大模型应用提供优质的和充沛的算(suàn)料。

  人工(gōng)智能、大模型产业的发展需要上中下游的协(xié)同努力,曙光也希望能够通过(guò)“中国科 学院人(rén)工智能产学研创新联盟”和(hé)“光合组织”,作为技术创新和成果转(zhuǎn)化的平(píng)台,作(zuò)为人工智能产业链上下游产业协作和共同发展的平台。我们也希望通过(guò)我们提供的可信、开放、绿色和普惠的计算(suàn)基础设施算力服务,跟在座(zuò)的企业和(hé)业界的同仁一起努力,帮助企业在人工智能大模型领域的技术创新(xīn)、商业模式创新和应(yīng)用创新方面提供助力。也(yě)希望跟大家共同努(nǔ)力,共创AI产业(yè)崭新的(de)未来,谢(xiè)谢大家(jiā)。

  新浪声明:所有会议实录均为现场速记 整(zhěng)理,未经演讲(jiǎng)者审阅,新浪网登(dēng)载此文(wén)出于传递更多(duō)信息之目的,并不意味着赞同其观点或证实其描(miáo)述。

责任编(biān)辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 龙志中:2024年是人工智能爆发期

评论

5+2=