橘子百科-橘子都知道橘子百科-橘子都知道

AI“源神”启动!影响多大?

AI“源神”启动!影响多大?

开(kāi)源还是闭源?这(zhè)是属于(yú)大模型的时代之问。

今年年初,埃隆(lóng)·马斯克在(zài)对OpenAI及其CEO萨姆·奥特 曼提起诉讼时,就对OpenAI逐渐不公开其模型研究相关细节的行为(wèi)大加谴责。“时至今日(rì),OpenAI公司网AI“源神”启动!影响多大?站还(hái)宣称,它的宗旨(zhǐ)是确保通(tōng)用人工智能(néng)造福全人类。然而,在现实中,OpenAI已经转变为(wèi)科技巨头微软事(shì)实上(shàng)的闭源(yuán)子(zi)公司。”这位曾经的OpenAI联合创始人如此表示。

OpenAI不(bù)够(gòu)“Open”,Meta却“Open”了自己最新的开 源人工(gōng)智能(néng)模型。

4月18日(rì),Meta 发布 了其最新版本的(de)开源大模型 Llama 3,引(yǐn)起(qǐ)开源AI社区的一阵欢呼(hū)。巧合的是,Llama 3发布当天正好是(shì)AI领(lǐng)域顶尖学者、AI开(kāi)源倡(chàng)导者吴恩(ēn)达的生日。“(Llama 3是)至今(jīn)为止最好的礼物,谢感谢Meta!”他说。

行至2024,开闭源(yuán)之争日(rì)渐白热化。闭源阵营以目前最强的OpenAI为代表,开源阵营Meta的(de)LLaMa、Mistral和Google等也(yě)在不断迭代。闭源(yuán)阵营坚持对Scaling Law的信(xìn)仰,押注(zhù)在更强通用模型(xíng)的打(dǎ)造上;开源阵(zhèn)营模型能力不断提升(shēng),并且强调以更垂直的(de)性(xìng)能、更灵活(huó)的配(pèi)置来推动大模型商业化落地(dì)。

关于应该选择模型开源还是闭源讨论经久(jiǔ)不息。

对于局内人,这一选(xuǎn)择这不(bù)仅决定了 他们将如何点亮AI“科技树”,更将影响他们的商业路线选择。换言之,这很有可能是这个残酷竞争市场下的生存问题。

两个版本,多重(zhòng)惊喜(xǐ)

Meta此次(cì)发(fā)布的(de)Llame 3包(bāo)括8B和70B的预训练和指令微调版本。

据Meta官网信息,Llama 3 模型将数据(jù)和规模提升(shēng)到新的高度。它在两(liǎng)个定制24K GPU集(jí)群(qún)上(shàng)基于超过 15T 的数据进行了训练——训练(liàn)数据集是Llame 2使用量的7倍有余。它支持 8K 上下文长度,是 Llama 2 容量的两倍。

除了 Llama 3,Meta 还(hái)发布了新的 信任和安全(quAI“源神”启动!影响多大?án)工具,包括Llama Guard 2、Code Shield和(hé) CyberSec Eval 2。

据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模(mó)型 API 提供(gōng)商平台上线,Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供的(de)硬件(jiàn)平台的(de)支持。

在官网上,Meta还放出了Llama3两个(gè)版本与谷歌Gemma、谷(gǔ)歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数对比。据Meta官网,Llame3在MMLU(学科知识理解)、GPQA(一般问(wèn)题)、HumanEval(代码能力)、GSM—8K(数学能力 )、MATH(比(bǐ)较难的数学问题)5个(gè)评测(cè)集上均表现良好。

值得注意的是,Llama3的代码能力非常优秀。在AI领域公众(zhòng)号“数(shù)字生命卡兹克”主理(lǐ)人卡兹克(kè)分 享的用户实测中,Llama3—8B能够给出国际象(xiàng)棋(qí)中经典皇后问 题的解(jiě)题代 码。而其前代版本Llama2需要(yào)专门(mén)的代码模型才能实现。

市(shì)场的反应速度很快。18日当(dāng)天,Meta股价(jià)逆势(shì)收(shōu)涨1.54%。次日,百 度智能云千帆大模(mó)型平台开放邀约(yuē)测试,提供针对Llama 3的训练推理方案,帮助(zhù)开发者训练专属大模型(xíng)。

8B和70B 两个型号的模(mó)型,仅仅(jǐn)标志着 Llama 3 系列的开(kāi)端,Meta AI首(shǒu)席科学家杨立昆在其社交媒体透(tòu)露,在(zài)接下(xià)来的几个月,还会有更多版本陆(lù)续发布。

英伟达高级科学家Jim Fan认为之后可能会发布(bù)的Llama 3-400B以上的版本将成为某种“分水岭(lǐng)”,开源社区将能用(yòng)上GPT-4级别的模型。

不下牌桌,各显神通

上(shàng)一轮元宇宙竞争中被(bèi)认为可能(néng)跌进(jìn)坑里的(de)Meta,在人(rén)工(gōng)智能的牌(pái)桌上打出了Llama系列这把好牌。要讨论Llama3带来的(de)行业震(zhèn)荡 ,首先要明白,什么是大模型领(lǐng)域的开源?

大模型领域的(de)开源通常意味着模型的架构(gòu)、训练代码和预训练权重等都被公开,允许研究人员和开发者自由(yóu)地访问和使用。

不过,开源的程度因模(mó)型(xíng)而 异。“有些可能只提(tí)供(gōng)有限的访问权限或部分代码。”郭涛指出(chū),判断(duàn)大模型是否真正开源(yuán)的基(jī)准(zhǔn)可能包括:代码和(hé)数据的可访问(wèn)性 、使用许可的宽松(sōng)程度、社区 支持的(de)活跃度以及对改进和(hé)新应用(yòng)的开放性(xìng)。

放眼AI界,两条(tiáo)路径上都各(gè)有“头号玩家”分布。闭源(yuán)自不必说(shuō),海外有OpenAI旗下的(de)ChatGPT,国内(nèi)是百度的文(wén)心一言(yán)以及风(fēng)头正劲的月之暗面Kimi。

而开(kāi)源方面,除了Llama系列,目前应用较广的开源(yuán)大模型还包括非营利组织LAION推(tuī)出的OpenFlamingo、Databricks的Dolly,以及MosaicML的(de)MPT等。国内则包(bāo)括,阿里巴(bā)巴的通义千(qiān)问,智谱的ChatGLM-4、百川智能(néng)的baichuan-7B中英(yīng)文大模型、北京智源悟道3.0大模型系列和面(miàn)壁智能的CPM-Bee 10B中文基(jī)座大模型等。

形成这样的(de)分化,很多时候是受技术进步和商业 模(mó)式(shì)迭代等的多重影响。

天使投资人、资深人工智能专家郭涛认为,从技术角度(dù)来看,开源可以促进学术 界(jiè)的研究和创(chuàng)新,而闭源(yuán)则有助(zhù)于在一定(dìng)时间内保持(chí)技(jì)术领先优势。

从商业(yè)角度来看,开源可以吸引开发者社区的贡献,促(cù)进技术的快速迭代和应用的广泛传播,但(dàn)可能会影响到公司(sī)的盈利模式。闭源(yuán)则可以(yǐ)保护知(zhī)识产(chǎn)权,为公司创造直接的收入来源,但可能会限制技(jì)术的普及(jí)和(hé)生态的建(jiàn)设。

事实上,在Llama3发布之(zhī)前,中文互联网刚刚经历了一轮开闭(bì)源论 战。

据媒体报道,百度CEO李彦(yàn)宏近日表态,认为大(dà)模型开源意(yì)义不大(dà),闭源模(mó)型(xíng)性能会不断提(tí)升。“有了文(wén)心大模型4.0,我们可(kě)以根据(jù)需要(yào)兼顾效果、响应速度、推理成本等(děng)各种考(kǎo)虑,裁剪出适(shì)合各(gè)种(zhǒng)场景的更(gèng)小尺寸模(mó)型,且支持精调和post pretrain。通过降维裁剪出的模型,比直接拿开源调出来的模型,同等尺寸下效果更好,同等效果下成本(běn)明显更低。”

李彦宏一直是闭源 路线的忠实拥趸,理由包括(kuò)但不限于(yú)认可闭源商业模式可以更好地(dì)聚集人(rén)力和(hé)财力(lì)等。

而其反对者——360创(chuàng)始人周鸿祎言简意赅(gāi),“一句话,今天没有开源就没有 Linux,没有 Linux 就没有互联网。”

“源神”启动(dòng),影响(xiǎng)几何?

“Llama 3的发布会带来市场格局的改变。”郭(guō)涛在接受21记(jì)者采访时指(zhǐ)出,其优 异表现可能(néng)吸引更多的用户和投资者,从(cóng)而增加其市场份额。

官(guān)网显示,Llama 3将有条件地开(kāi)源给商业使(shǐ)用(月活用(yòng)户超过7亿需要单(dān)独申请(qǐng))。“不过这基(jī)本(běn)等(děng)于完(wán)全免(miǎn)费商用了。”卡兹克(kè)表示。

此前,投资人朱啸虎曾(céng)经就人工智(zhì)能市场相关话题接受腾讯新闻采访。当被问(wèn)及2023年(nián)大模型发展的关键节点(diǎn)时,他给出的回答正是Llama上线。这让中国在应用层面创新有了基 础,降低了商业(yè)化(huà)门槛。

当然,朱啸虎提(tí)到 的变现是指开源生(shēng)态内的用户。对于开源大(dà)模型发 布(bù)者的能否盈利,或者能等(děng)来盈利机(jī)会,很多时候并没有确定的答案。

闭源大模型通(tōng)常通过(guò)授权使用(yòng)、订阅服务或者(zhě)直接销售产品来盈利。其(qí)中(zhōng)的代表便是AI领域的领跑者OpenAI,虽然其一直有推进开源项目的动作,但其(qí)处在核心地位的ChatGPT却一直采取收取API许可费的方式向其他公司提供(gōng)服务。在API服务过程,其他公(gōng)司不(bù)会接触(chù)到ChatGPT模型的细节和源代码(mǎ),仅(jǐn)仅通过API接口(kǒu)进行调用。

创业者服务平台GoDaddy对全美1003家小(xiǎo)型企业的(de)调(diào)查数据显示,ChatGPT以(yǐ)70%的应用(yòng)率成为美国(guó)小型企业应用最多的(de)生成式AI产 品,这说(shuō)明(míng)OpenAI选择的闭源模式的商业化之路在一(yī)定程(chéng)度已经跑通(tōng)。

开源模型如何(hé)寻(xún)求生存和发展的机会?

首先是以开放的生态(tài)吸引用户。国(guó)盛证券(quàn)研报就指出,开源大模型借助更大标识符训练数据集(jí)、DeepSpeed、RLHF等方式,实现 低(dī)训练成本和高性能,超大模(mó)型以下大模型的壁垒(lěi)正在消失。

“在拥有用户后,开(kāi)源(yuán)大模型通常通过提供增值服(fú)务、定制开(kāi)发、技术支持等方式来实现(xiàn)盈利”。郭涛指出,公司可以在(zài)开源模型的基(jī)础上提供专业的训练服务或(huò)者定制化(huà)的应用解决方案。

对于Meta甚至众多开(kāi)源者而言,开源的野心不仅是短期的商业变 现,其更想引领规(guī)则设计以及搭建生态。有业(yè)内专家 分析,开源后壁垒并没有(yǒu)那么(me)容易破除(chú),高质量、标注过 的 训练数据集(jí)尤其是专业模型的(de)壁垒(lěi)。

星纪魅族集团数据合规执(zhí)行总(zǒng)监朱玲凤表示,目前有些开源AI由头部公司主导,“越多人使用,就越(yuè)能强化网格效(xiào)应,而且不是真正的开放,后续 需(xū)要使用它们的配套工具、配(pèi)套服务。头部(bù)公司还(hái)可能利用监管豁免的方式,获得寻租空间。”换言(yán)之,以开源为噱头的巨头游戏,可能会进一步强化大公司的垄断(duàn)地位,反而不利于(yú)产业竞争。

据报道,去(qù)年(nián)4月,在(zài)扎克伯格(gé)与分析师的一次电话会议中,他就(jiù)谈到,如果行业能够在Meta使用(yòng)的基(jī)础(chǔ)工具上达成(chéng)标准化,那么meta就能从其他人(rén)的改进中受益(yì)。同年(nián)5月 ,谷歌内部泄露的文件《我们没有护城河,OpenAI也没有》在SemiAnalysis网站上传播,其中的观点(diǎn)包括,比起(qǐ)开源社区(qū)需 要谷歌,谷歌(gē)更需要开源社(shè)区等等。文章作者指出,不同开源模型所(suǒ)组成的生态(tài)系统永远是(shì)OpenAI的潜在竞争(zhēng)对(duì)手,与开源AI竞争的结果必然是失败(bài)。

Meta落子,战局生变。大模型的路线之争会不会(huì)迎来(lái)真正的胜利者?

“开源与闭源大模(mó)型之间不太可能分出(chū)绝对 的输(shū)赢,因为它们 各自适合不同(tóng)的应用和场景。”郭(guō)涛认为,开源大模型更适合那些需要快速创新和大规 模(mó)协作的(de)项目,而闭源大模型可能更(gèng)适合那些对性能和安全性有极高要求的商业应(yīng)用。

未经允许不得转载:橘子百科-橘子都知道 AI“源神”启动!影响多大?

评论

5+2=