AI“源神”启动！影响多大？

开(kāi)源还是闭源？这(zhè)是属于(yú)大模型的时代之问。

今年年初，埃隆(lóng)·马斯克在(zài)对OpenAI及其CEO萨姆·奥特曼提起诉讼时，就对OpenAI逐渐不公开其模型研究相关细节的行为(wèi)大加谴责。“时至今日(rì)，OpenAI公司网AI“源神”启动！影响多大？站还(hái)宣称，它的宗旨(zhǐ)是确保通(tōng)用人工智能(néng)造福全人类。然而，在现实中，OpenAI已经转变为(wèi)科技巨头微软事(shì)实上(shàng)的闭源(yuán)子(zi)公司。”这位曾经的OpenAI联合创始人如此表示。

OpenAI不(bù)够(gòu)“Open”，Meta却“Open”了自己最新的开源人工(gōng)智能(néng)模型。

4月18日(rì)，Meta 发布了其最新版本的(de)开源大模型 Llama 3，引(yǐn)起(qǐ)开源AI社区的一阵欢呼(hū)。巧合的是，Llama 3发布当天正好是(shì)AI领(lǐng)域顶尖学者、AI开(kāi)源倡(chàng)导者吴恩(ēn)达的生日。“（Llama 3是）至今(jīn)为止最好的礼物，谢感谢Meta！”他说。

行至2024，开闭源(yuán)之争日(rì)渐白热化。闭源阵营以目前最强的OpenAI为代表，开源阵营Meta的(de)LLaMa、Mistral和Google等也(yě)在不断迭代。闭源(yuán)阵营坚持对Scaling Law的信(xìn)仰，押注(zhù)在更强通用模型(xíng)的打(dǎ)造上；开源阵(zhèn)营模型能力不断提升(shēng)，并且强调以更垂直的(de)性(xìng)能、更灵活(huó)的配(pèi)置来推动大模型商业化落地(dì)。

关于应该选择模型开源还是闭源讨论经久(jiǔ)不息。

对于局内人，这一选(xuǎn)择这不(bù)仅决定了他们将如何点亮AI“科技树”，更将影响他们的商业路线选择。换言之，这很有可能是这个残酷竞争市场下的生存问题。

两个版本，多重(zhòng)惊喜(xǐ)

Meta此次(cì)发(fā)布的(de)Llame 3包(bāo)括8B和70B的预训练和指令微调版本。

据Meta官网信息，Llama 3 模型将数据(jù)和规模提升(shēng)到新的高度。它在两(liǎng)个定制24K GPU集(jí)群(qún)上(shàng)基于超过 15T 的数据进行了训练——训练(liàn)数据集是Llame 2使用量的7倍有余。它支持 8K 上下文长度，是 Llama 2 容量的两倍。

除了 Llama 3，Meta 还(hái)发布了新的信任和安全(quAI“源神”启动！影响多大？án)工具，包括Llama Guard 2、Code Shield和(hé) CyberSec Eval 2。

据悉，Llama 3 即将在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模(mó)型 API 提供(gōng)商平台上线，Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供的(de)硬件(jiàn)平台的(de)支持。

在官网上，Meta还放出了Llama3两个(gè)版本与谷歌Gemma、谷(gǔ)歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数对比。据Meta官网，Llame3在MMLU（学科知识理解）、GPQA（一般问(wèn)题）、HumanEval（代码能力）、GSM—8K（数学能力）、MATH（比(bǐ)较难的数学问题）5个(gè)评测(cè)集上均表现良好。

值得注意的是，Llama3的代码能力非常优秀。在AI领域公众(zhòng)号“数(shù)字生命卡兹克”主理(lǐ)人卡兹克(kè)分享的用户实测中，Llama3—8B能够给出国际象(xiàng)棋(qí)中经典皇后问题的解(jiě)题代码。而其前代版本Llama2需要(yào)专门(mén)的代码模型才能实现。

市(shì)场的反应速度很快。18日当(dāng)天，Meta股价(jià)逆势(shì)收(shōu)涨1.54%。次日，百度智能云千帆大模(mó)型平台开放邀约(yuē)测试，提供针对Llama 3的训练推理方案，帮助(zhù)开发者训练专属大模型(xíng)。

8B和70B 两个型号的模(mó)型，仅仅(jǐn)标志着 Llama 3 系列的开(kāi)端，Meta AI首(shǒu)席科学家杨立昆在其社交媒体透(tòu)露，在(zài)接下(xià)来的几个月，还会有更多版本陆(lù)续发布。

英伟达高级科学家Jim Fan认为之后可能会发布(bù)的Llama 3-400B以上的版本将成为某种“分水岭(lǐng)”，开源社区将能用(yòng)上GPT-4级别的模型。

不下牌桌，各显神通

上(shàng)一轮元宇宙竞争中被(bèi)认为可能(néng)跌进(jìn)坑里的(de)Meta，在人(rén)工(gōng)智能的牌(pái)桌上打出了Llama系列这把好牌。要讨论Llama3带来的(de)行业震(zhèn)荡，首先要明白，什么是大模型领(lǐng)域的开源？

大模型领域的(de)开源通常意味着模型的架构(gòu)、训练代码和预训练权重等都被公开，允许研究人员和开发者自由(yóu)地访问和使用。

不过，开源的程度因模(mó)型(xíng)而异。“有些可能只提(tí)供(gōng)有限的访问权限或部分代码。”郭涛指出(chū)，判断(duàn)大模型是否真正开源(yuán)的基(jī)准(zhǔn)可能包括：代码和(hé)数据的可访问(wèn)性、使用许可的宽松(sōng)程度、社区支持的(de)活跃度以及对改进和(hé)新应用(yòng)的开放性(xìng)。

放眼AI界，两条(tiáo)路径上都各(gè)有“头号玩家”分布。闭源(yuán)自不必说(shuō)，海外有OpenAI旗下的(de)ChatGPT，国内(nèi)是百度的文(wén)心一言(yán)以及风(fēng)头正劲的月之暗面Kimi。

而开(kāi)源方面，除了Llama系列，目前应用较广的开源(yuán)大模型还包括非营利组织LAION推(tuī)出的OpenFlamingo、Databricks的Dolly，以及MosaicML的(de)MPT等。国内则包(bāo)括，阿里巴(bā)巴的通义千(qiān)问，智谱的ChatGLM-4、百川智能(néng)的baichuan-7B中英(yīng)文大模型、北京智源悟道3.0大模型系列和面(miàn)壁智能的CPM-Bee 10B中文基(jī)座大模型等。

形成这样的(de)分化，很多时候是受技术进步和商业模(mó)式(shì)迭代等的多重影响。

天使投资人、资深人工智能专家郭涛认为，从技术角度(dù)来看，开源可以促进学术界(jiè)的研究和创(chuàng)新，而闭源(yuán)则有助(zhù)于在一定(dìng)时间内保持(chí)技(jì)术领先优势。

从商业(yè)角度来看，开源可以吸引开发者社区的贡献，促(cù)进技术的快速迭代和应用的广泛传播，但(dàn)可能会影响到公司(sī)的盈利模式。闭源(yuán)则可以(yǐ)保护知(zhī)识产(chǎn)权，为公司创造直接的收入来源，但可能会限制技(jì)术的普及(jí)和(hé)生态的建(jiàn)设。

事实上，在Llama3发布之(zhī)前，中文互联网刚刚经历了一轮开闭(bì)源论战。

据媒体报道，百度CEO李彦(yàn)宏近日表态，认为大(dà)模型开源意(yì)义不大(dà)，闭源模(mó)型(xíng)性能会不断提(tí)升。“有了文(wén)心大模型4.0，我们可(kě)以根据(jù)需要(yào)兼顾效果、响应速度、推理成本等(děng)各种考(kǎo)虑，裁剪出适(shì)合各(gè)种(zhǒng)场景的更(gèng)小尺寸模(mó)型，且支持精调和post pretrain。通过降维裁剪出的模型，比直接拿开源调出来的模型，同等尺寸下效果更好，同等效果下成本(běn)明显更低。”

李彦宏一直是闭源路线的忠实拥趸，理由包括(kuò)但不限于(yú)认可闭源商业模式可以更好地(dì)聚集人(rén)力和(hé)财力(lì)等。

而其反对者——360创(chuàng)始人周鸿祎言简意赅(gāi)，“一句话，今天没有开源就没有 Linux，没有 Linux 就没有互联网。”

“源神”启动(dòng)，影响(xiǎng)几何？

“Llama 3的发布会带来市场格局的改变。”郭(guō)涛在接受21记(jì)者采访时指(zhǐ)出，其优异表现可能(néng)吸引更多的用户和投资者，从(cóng)而增加其市场份额。

官(guān)网显示，Llama 3将有条件地开(kāi)源给商业使(shǐ)用（月活用(yòng)户超过7亿需要单(dān)独申请(qǐng)）。“不过这基(jī)本(běn)等(děng)于完(wán)全免(miǎn)费商用了。”卡兹克(kè)表示。

此前，投资人朱啸虎曾(céng)经就人工智(zhì)能市场相关话题接受腾讯新闻采访。当被问(wèn)及2023年(nián)大模型发展的关键节点(diǎn)时，他给出的回答正是Llama上线。这让中国在应用层面创新有了基础，降低了商业(yè)化(huà)门槛。

当然，朱啸虎提(tí)到的变现是指开源生(shēng)态内的用户。对于开源大(dà)模型发布(bù)者的能否盈利，或者能等(děng)来盈利机(jī)会，很多时候并没有确定的答案。

闭源大模型通(tōng)常通过(guò)授权使用(yòng)、订阅服务或者(zhě)直接销售产品来盈利。其(qí)中(zhōng)的代表便是AI领域的领跑者OpenAI，虽然其一直有推进开源项目的动作，但其(qí)处在核心地位的ChatGPT却一直采取收取API许可费的方式向其他公司提供(gōng)服务。在API服务过程，其他公(gōng)司不(bù)会接触(chù)到ChatGPT模型的细节和源代码(mǎ)，仅(jǐn)仅通过API接口(kǒu)进行调用。

创业者服务平台GoDaddy对全美1003家小(xiǎo)型企业的(de)调(diào)查数据显示，ChatGPT以(yǐ)70%的应用(yòng)率成为美国(guó)小型企业应用最多的(de)生成式AI产品，这说(shuō)明(míng)OpenAI选择的闭源模式的商业化之路在一(yī)定程(chéng)度已经跑通(tōng)。

开源模型如何(hé)寻(xún)求生存和发展的机会？

首先是以开放的生态(tài)吸引用户。国(guó)盛证券(quàn)研报就指出，开源大模型借助更大标识符训练数据集(jí)、DeepSpeed、RLHF等方式，实现低(dī)训练成本和高性能，超大模(mó)型以下大模型的壁垒(lěi)正在消失。

“在拥有用户后，开(kāi)源(yuán)大模型通常通过提供增值服(fú)务、定制开(kāi)发、技术支持等方式来实现(xiàn)盈利”。郭涛指出，公司可以在(zài)开源模型的基(jī)础上提供专业的训练服务或(huò)者定制化(huà)的应用解决方案。

对于Meta甚至众多开(kāi)源者而言，开源的野心不仅是短期的商业变现，其更想引领规(guī)则设计以及搭建生态。有业(yè)内专家分析，开源后壁垒并没有(yǒu)那么(me)容易破除(chú)，高质量、标注过的训练数据集(jí)尤其是专业模型的(de)壁垒(lěi)。

星纪魅族集团数据合规执(zhí)行总(zǒng)监朱玲凤表示，目前有些开源AI由头部公司主导，“越多人使用，就越(yuè)能强化网格效(xiào)应，而且不是真正的开放，后续需(xū)要使用它们的配套工具、配(pèi)套服务。头部(bù)公司还(hái)可能利用监管豁免的方式，获得寻租空间。”换言(yán)之，以开源为噱头的巨头游戏，可能会进一步强化大公司的垄断(duàn)地位，反而不利于(yú)产业竞争。

据报道，去(qù)年(nián)4月，在(zài)扎克伯格(gé)与分析师的一次电话会议中，他就(jiù)谈到，如果行业能够在Meta使用(yòng)的基(jī)础(chǔ)工具上达成(chéng)标准化，那么meta就能从其他人(rén)的改进中受益(yì)。同年(nián)5月，谷歌内部泄露的文件《我们没有护城河，OpenAI也没有》在SemiAnalysis网站上传播，其中的观点(diǎn)包括，比起(qǐ)开源社区(qū)需要谷歌，谷歌(gē)更需要开源社(shè)区等等。文章作者指出，不同开源模型所(suǒ)组成的生态(tài)系统永远是(shì)OpenAI的潜在竞争(zhēng)对(duì)手，与开源AI竞争的结果必然是失败(bài)。

Meta落子，战局生变。大模型的路线之争会不会(huì)迎来(lái)真正的胜利者？

“开源与闭源大模(mó)型之间不太可能分出(chū)绝对的输(shū)赢，因为它们各自适合不同(tóng)的应用和场景。”郭(guō)涛认为，开源大模型更适合那些需要快速创新和大规模(mó)协作的(de)项目，而闭源大模型可能更(gèng)适合那些对性能和安全性有极高要求的商业应(yīng)用。

未经允许不得转载：橘子百科-橘子都知道 AI“源神”启动！影响多大？