橘子百科-橘子都知道橘子百科-橘子都知道

龙志中:2024年是人工智能爆发期

龙志中:2024年是人工智能爆发期

专题:2024中国AIGC创新(xīn)发展论坛

  2024年(nián)服贸会(huì)专题论(lùn)坛之一——“2024中国(guó)AIGC创新发展论坛”于(yú)9月(yuè)13日(rì)-14日在北京举行(xíng)。曙光云计算集团股(gǔ)份有限公司总裁助理龙(lóng)志中出席并演讲。

  龙(lóng)志(zhì)中表示(shì),2024年是进(jìn)入到(dào)了人工(gōng)智能的爆发期。今年前8个(gè)月,在手机移动端上,人工智能应用收入与去年相比同比增长了(le)51%,预(yù)计(jì)今(jīn)年整个收入会(huì)达到33亿美元的规(guī)模。

  龙志中介(jiè)绍,曙光一直(zhí)是一家专注做计算的(de)企业,创立之初到 现在(zài),一直围绕着计算的核心部件,主要产品,以及(jí)计(jì)算的基础设施建设和运营服务(wù),来打造核(hé)心竞争力。

  龙(lóng)志中表示,曙光致力于提供解决方案(àn),以降低使用人 工智能(néng)大模型在算力方面的门(mén)槛。具体来看,曙光能够提(tí)供的助力(lì)有三个方面:第 一是(shì)人工智能(néng)相(xiāng)关的核心部件,主要(yào)产品,还有关键(jiàn)的基础(chǔ)设施,包括PUE在(zài)1.04以下的全液冷数据中心。第(dì)二是算力中心的建设和运营。目 前曙(shǔ)光在全国有二十多个大型的算力中(zhōng)心、智(zhì)算中心、先进计算中(zhōng)心,以及五十(shí)多个城(chéng)市云中心,能够为企业、区域/城市能够提供澎湃、多样的算力资源。第三是人工智能的生态(tài),在目前(qián)主流的大模型跟(gēn)曙光的核心 部件,主要产品还有算力平(píng)台基本上都做(zuò)了适配(pèi),并且在算力互(hù)联(lián)网上能够提供生(shēng)态合作(zuò)伙伴的大模型服务。通(tōng)过接入算力互联(lián)网,企业不需要自己去构建算力基础设施的平台,甚至(zhì)不需要去(qù)部署自(zì)己的大模型,可以直(zhí)接采用多样(yàng)的算力服务和大(dà)模(mó)型服务。

  以下为演讲实录:

  龙志中:各位专家,各位嘉宾,大家上午(wǔ)好,我是曙光云的龙志(zhì)中,今天非常荣幸(xìng)能够跟各位专家学 习AIGC大模型、人工智能领域最新的前沿理论和成(chéng)果,也有机会(huì)跟大家一起探(tàn)讨人工智能AIGC对于(yú)我们今天以(yǐ)及未来的生(shēng)活方(fāng)式、工作模式(shì)、创新范式(shì)所带来的深远影响。也想借这个机会跟大家汇报一下曙光云在企业开发大(dà)模型、应用大模型的过程当中,能够为大家提供哪些助力。

  曙光跟今天前面分(fēn)享(xiǎng)的嘉宾所在的企业有所不同,前面这些企业更多是在开发大模型(xíng)或(huò)在做大模型应用(yòng)场景(jǐng)侧的开发,给大家提供的是大模型本身、大模型 应用,为(wèi)我们的生活和工作所(suǒ)带来的(de)便利。曙光相对(duì)来讲更偏底层,我们(men)做的是计算基础设施和算力服务,也就是说我(wǒ)们为大模型的开发和大模型(xíng)应用提供(gōng)基础设施和算力服务,按(àn)照大模型三层架构分(fēn)类(lèi)的(de)话,我们是在上(shàng)游;从技术架构 层次来分的话,我们(men)是在底(dǐ)层。

  刚(gāng)才几位嘉宾(bīn)都提到,AIGC生成式大模型在这两年(nián),特别是2022年之后成为一个热 词,我们看到的多个榜单里面,特别是在2023年度热词榜(bǎng)单里面AIGC都是排 在前(qián)几位甚至排在首位的。1957年人类就已经用计算机生成了历史上第一首机器创作的音乐作品。直到2022年11月份,有一个标志性的事件就是OpenAI的GPT,从(cóng)那个时刻开(kāi)始人类对于人工智能的应用才(cái)从传统的“知识的分类器”进化到“内容(róng)的(de)生成器”。

  从2023年开始,我们非常(cháng)明显地可以看到“百模大战”,2023年中国发布(bù)的人工智能大模(mó)型是300多个,我们也认(rèn)为从(cóng)2023年开始AIGC或者人(rén)工智(zhì)能大模型开始渗(shèn)透到我(wǒ)们(men)的(de)工作、生活的各个方面。我昨天看到一个新闻,谷歌的联合创(chuàng)始人谢尔盖退休两年了,现在被AI广阔的前景所吸引,重新回到一线敲代(dài)码,他抱怨自己(jǐ)的员工、程(chéng)序员用人工智能写代码的比例太(tài)低了(le)。人工智能(néng)除(chú)了可以生成图片、生成文字,现在(zài)能够生成音(yīn)频、视频、影视作品,能(néng)够 写代码(mǎ)。

  同时,很(hěn)多人之前查资料,查素材、查数据的时候用搜索引擎。但现在,我相(xiāng)信(xìn)很多人已经在用Kimi、豆包,取代了以前要借助百度、谷歌(gē)所(suǒ)要完全的相关(guān)搜索,甚至知识的提(tí)炼和(hé)知(zhī)识的整理(lǐ)工作。

  2024年是真正进入到人工智能的爆(bào)发(fā)期或者叫井喷期。今年 前8个月,在手机移动端上人工智能的应用收入跟去年相(xiāng)比同比增长(zhǎng)了51%,预计今年整个(gè)收入(rù)会(huì)达到33亿美元的规模。今天我们(men)也听到了很多人工(gōng)智能头部厂商的专家给我们带来了最(zuì)新(xīn)成果,从(cóng)侧面证明2024年人工智能(néng)真正的井喷期已经到来了。

  从未来发展来看,Gartner预测,2027年(nián)生成式人工(gōng)智能市场规 模会超1800亿美(měi)元,占全球整个AI支出的(de)42%。

  我们一直说算力、算法和算料(或者(zhě)数据)是人工(gōng)智能发展的三大要素(sù),从AIGC角度来讲,算力、算 法(fǎ)和算料也是AIGC发展的三(sān)大要素。现在大家有一个普(pǔ)遍共识,大模型意味着大成本,也(yě)就是说大(dà)模型是一个非常(cháng)烧(shāo)钱(qián)的生意,或者说是(shì)一个非常烧钱的游(yóu)戏。大(dà)模型厂商的整体运(yùn)营成本,一般来看分为三部分,第一(yī)部(bù)分(fēn)是用于推理(lǐ)的成本,第二(èr)部分用于训练的成本(běn),第三部分是(shì)人工(gōng)成本(就是程序员、管理人员、测试(shì)人员)。中国工程(chéng)院院士郑纬民教授的测算结果表明,大模型训练中70%的成本(běn)是(shì)用(yòng)在算力上,推理过程当中这个比例就更高(gāo),超过了95%。根据OpenAI2024年的财务预测,预计2024年总的运营成(chéng)本(běn)会达到(dào)85亿美元,里(lǐ)面15亿美金是人工成本,就是工程师成(chéng)本,另外(wài)70亿 中的30亿是训练(liàn)成本,40亿是(shì)推理的成本,绝大部分都是用于采(cǎi)购算力。这个说明,确(què)实做人工智能大模型、做AIGC,算力是(shì)我们所有运营成(chéng)本里面占比最大的一块,也是最(zuì)重要的一块。所以OpenAI的CEO把OpenAI这家公司定义成了一(yī)家硅谷历史上最资金密集型的(de)一个初创公司。

  我们知道(dào)现在进入(rù)到数字经济(jì)的时代。国家数(shù)据局的刘烈宏局(jú)长认为算力就是数字经济时代(dài)的新质生产力。有一个指数就叫“计算力指数”,计算力指数平均每增长(zhǎng)一个百分点,所带(dài)来的数字经济和(hé)GDP的增(zēng)长(zhǎng)会分别增长3.3%和1.8%。目前的算力市场(chǎng)有几(jǐ)个类型:第一类是通(tōng)用算力(lì)或者基础(chǔ)算力,第二类是智能算力,第三类是高级算力,另(lìng)外一种算力叫量子算力。

  从我们看(kàn)到的调研机构数据来看(kàn),2021年的时候,智能算力在整个中国整体算力规模里的占比 已经超过(guò)了50%,达到了51%,并且到2030年的时候这个(gè)比例还会持续增加,预计会占到整个算力规模 的72%。同时,信(xìn)通院的预测是到2030年的时候,人工智能(néng)算力需求跟18年相比会增加390倍。所以我们讲数据、算法和算力是数字经济的关键资(zī)源(yuán),数(shù)据(jù)或(huò)者算(suàn)料成为新的生产资料,算力成为了新的生产力,或者按照现在的(de)说(shuō)法(fǎ)成为新质生产(chǎn)力,算法成为现在新(xīn)的生(shēng)产关系(xì)。

  刚(gāng)才我们讲到算力,在整个人工智能的发(fā)展过程当中,算力的(de)需求或(huò)者算力所占(zhàn)用的成本应(yīng)该是(shì)非常高的(de),超过的50%以上。同时我们可以看龙志中:2024年是人工智能爆发期到,随着大模型成为AI领域新的(de)开发范式,AIGC对于(yú)训练(liàn)数据的需求也(yě)是(shì)呈(chéng)指数级(jí)增加(jiā)的。从ChatGPT到谷(gǔ)歌的switch transformer,模型规模和(hé)数据规模是持续巨量增加(jiā)的,可以认为(wèi)是指数级的增加,数据和参数规模(mó)在一年之内增长了一百(bǎi)倍之(zhī)多。同时随着大模型的参数和所需数据量激增,所需要的智能(néng)化底座(zuò)规模也是会越来越大,特 别是对于算力的需(xū)求更(gèng)是如此。在小 模型时(shí)代,更多是用(yòng)于图像、语音和文本分(fēn)析的时代,可能(néng)很多(duō)时候我们单机规模就能满足我(wǒ)们一般的需求。到了以ChatGPT为代表的文本(běn)大模型时代,参数(shù)规模基本上超过了千亿。所(suǒ)需要的计算集群或者算(suàn)力底座的规模也进入(rù)千机万(wàn)卡时(shí)代。目前做大模(mó)型(xíng)竞争(zhēng),千机(jī)万卡基本成为了门槛(kǎn)或者是标配(pèi)。到了多模态大(dà)模型的时代(dài),比如谷歌(gē)的switch Transformer,参数规模达到了1.6万亿(yì),这种规模大模型需要万机十万卡规模的集群来承载。

  现在千(qiān)机万卡(kǎ)已经成为大模型厂商的一个门槛(kǎn),一个入门的入场券,但其实并不是所有(yǒu)的(de)企业要用到大模型都需(xū)要自己去构建这么大规模的算力底(dǐ)座(zuò)。AIGC或者人(rén)工智(zhì)能这个领域的三层模型(xíng)是大家公认的一个分层模式。根据企(qǐ)业在这(zhè)个(gè)领域里的产业分工,分为上游、中游和下游。上游就是基础设 施,包括关核 心部件、主要产品和基础(chǔ)设施(shī)的服务,以及预训练模型和数据(jù)的供给。中游就是今天在座很多的AIGC头部企业,在做model as a service,做垂直化、场景(jǐng)化、个性化的大模型落地。下游就是应(yīng)用层,面向企业、面向(xiàng)个人(rén)来做内容(róng)生产、设计、分发等大模型场景应用。在AIGC的三个层面,所需要的算(suàn)力资源规模(mó)、类型、获取途径是不一样的(de)。

  曙光一直是一家专注做(zuò)计算(suàn)的企业(yè),创(chuàng)立之初(chū)到现在,一 直围绕(rào)着计算的核心部件,主要产品,以及计算的基础设施建设和运(yùn)营服务,来打(dǎ)造(zào)自(zì)己的核心竞(jìng)争力。我们可以看到,目前在(zài)人 工智能这个领域所(suǒ)面(miàn)临的挑战或(huò)者(zhě)困境有几个:一个是算力资源获取的便利性、普惠性、技术架构的开(kāi)放性、算力的融合性以及 能耗方面的高开销(xiāo)。

  曙光也希望在这些领域能够给大家提供解决(jué)方案,来降低使用人工智能大(dà)模型在算力方面的一些门槛。曙光能够提供的助(zhù)力有三个方面:第一是人工智能相(xiāng)关的核(hé)心部件,主要产品,还有关键的基础设施,包括PUE在1.04以下的(de)全液冷数据(jù)中(zhōng)心。第二是算(suàn)力中心的建设和运营。目前我(wǒ)们在全国有(yǒu)二十多个(gè)大(dà)型的算力中心、智算(suàn)中心、先(xiān)进计算中心(xīn),以及五十多个城市云中心,能够为我们的企业、为我们的区域/城市能够提供澎湃(pài)、多样的算力资(zī)源。第三是人工智能的生态,在目前(qián)主流的大模型跟曙光的核心部件,主要产品还有算力平台基本上都(dōu)做了适(shì)配,并且在算 力互联网上能够提供生态合作伙伴的大模型服务。通(tōng)过接入算力互联网,企业不需要自己去构建算力基础设施的(de)平台,甚至不需要去部(bù)署自己的大模型,可(kě)以直接采用多 样的(de)算力服(fú)务和大模型服务。

  一些城市要打造数(shù)字(zì)基础设施,来服务于数字化经济发展,为企业数字化转型提供动力。曙光在全国各地建(jiàn)设运(yùn)营(yíng)的数据中心有四大类:先进(jìn)计算中心(xīn),云计算中心、智能计算中(zhōng)心、一体化(huà)大(dà)数(shù)据中心节点。这些算力基(jī)础设(shè)施,符合信创要求和标准来构(gòu)建,采用了浸没式的液冷技术将能耗降(jiàng)到最低。再结合(hé)曙光(guāng)本地(dì)化专业团队和运营服务,可以(yǐ)为我们区域数字(zì)经(jīng)济发展和企业(yè)数字化转型提供 动(dòng)力(lì)。

  有些企(qǐ)业希望在通用大模型或行(xíng)业大模型基础之上构建自己企业的(de)大模 型应用。曙光也可(kě)以提供云数智底座,帮助企业打造私(sī)有的大模型基(jī)础设(shè)施。在云数智底座里面不仅(jǐn)提供(gōng)AI算力、AI储(chǔ)力的基础设施,还(hái)能提供(gōng)数据平台,数(shù)据平台帮助企(qǐ)业进行数据的全 生命周期管理,同时(shí)为大模型应用(yòng)提供优质的和充沛的(de)算料 。

  人(rén)工智能、大模型产(chǎn)业的发(fā)展需要上中下游的协同努力,曙光也希望能够通(tōng)过“中国科学院人(rén)工智能(néng)产(chǎn)学研创新联盟”和“光合 组织”,作为(wèi)技(jì)术创新和(hé)成(chéng)果转化的平台,作为人工智 能产业链(liàn)上下游产业协作(zuò)和共同发展的平台。我(wǒ)们(men)也 希望(wàng)通过我 们提供的可信、开(kāi)放、绿色和普(pǔ)惠的计算基础设施算 力服务,跟(gēn)在座的(de)企业和(hé)业界的同仁(rén)一起努力,帮助企(qǐ)业在人工智能大模(mó)型领(lǐng)域的技术创新 、商 业模式(shì)创新和应用创新方面提供助力。也希望(wàng)跟(gēn)大家(jiā)共(gòng)同努力,共创AI产业崭新的(de)未来,谢谢大家。

  新浪声明(míng):所有会(huì)议实录 均为现场速记整理,未(wèi)经演讲者(zhě)审阅,新(xīn)浪网登载此(cǐ)文出(chū)于传递更多信息(xī)之目的,并不意味着赞同其观点或证实(shí)其描述 。

责(zé)任编辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 龙志中:2024年是人工智能爆发期

评论

5+2=