Meta继续押宝开源大模型 Llama 3拿下“赛点”？

开源(yuán)与闭源(yuán)之争(zhēng)延续到大模型时(shí)代。在寻找“新大陆”的路上，开源与闭(bì)源的辩论，就像是一场关于AI未来的(de)“航海策略(lüè)”讨论。

开(kāi)源(yuán)一派认为，开源能够促进全球科研人员和开发者的协作，加速AI技(jì)术的迭代与创(chuàng)新。同时，开源让更多人参与到模型的改(gǎi)进和优化中，通过集体智慧解决复(fù)杂的技术(shù)难题(tí)。

闭源的倡(chàng)导者则看重其在商业化、技术(shù)保护和产品(pǐn)差异化方面的优势(shì)。闭源(yuán)模型使得企(qǐ)业能够控制产品的开发节奏和市场策略，保护其商业利益。此外，闭源也有助于企(qǐ)业(yè)维护其技术优势，避免竞(jìng)争对手模(mó)仿或超越。

Llama 3的发布让开源大模型(xíng)在与闭(bì)源(yuán)的竞争中(zhōng)再度“扳回一城”。从测(cè)试结果来看，Llama 3的成(chéng)绩大幅超越了Llama 2，也胜过了GPT-3.5。

在(zài)AI这场没有硝烟(yān)的“航海(hǎi)竞赛”中，大模型已然成为眼前(qián)的灯(dēng)塔。未知的是，这座灯塔(tǎ)究竟是向所有航海者开放其光芒，还是(shì)仅为特(tè)定的船只照亮前(qián)行的航道。

开源在开发者和研究人员中极受欢迎

Meta正(zhèng)沿着开源路径继续前(qián)进。

近日，Meta推出开(kāi)源大模型Llama 3系列，发布(bù)8B和70B两个(gè)版本(běn)。Meta创始人兼首席执(zhí)行官扎克伯格在同一天宣布，基于Llama 3，Meta的AI助手现在已(yǐ)经覆(fù)盖Instagram、WhatsApp、Facebook等全系应用，Meta继续押宝开源大模型 Llama 3拿下“赛点”？并单独开启了网站(zhàn)。

与Llama 2相比，Llama 3进行了几项关(guān)键的(de)改进：使用具128K token（输入数据的最小单元）词汇表的tokenizer（编(biān)译器），可以更有效(xiào)地编码语言(yán)，从而显著提升模型性能；在8B和70B模型中都采用分组查询注意力（GQA），以提(tí)高Llama 3模(mó)型的推(tuī)理效率；在8192个token的序列上训练模型，使(shǐ)用掩码来确保自注意(yì)力（Self-Attention）不会跨越(yuè)文档边界。

据Meta介绍，Llama 3已经(jīng)在(zài)多种行业基准测试上展现了最(zuì)先进的性能，提供了(le)包括改进(jìn)的推理能力(lì)在内的新功能，是目前市场上(shàng)最好的开源大模型。

此(cǐ)外，Llama 3发布后，微软Azure、谷歌云、百度(dù)智能云等陆续宣布其平台上线Llama 3。百度方面此前对(duì)《每日经济新闻》记者表示，百(bǎi)度智能云千帆大模型平台(tái)在国内首家推出针对Llama 3全系(xì)列版本的训练推理方案，便于开发者进行再训练，搭建(jiàn)专属大模型。

工业和信息化部工(gōng)业文化发展中(zhōng)心(xīn)AI应用工作组执行(xíng)组长、行行AI董事长李明顺在接受《每日经济新闻》记者采访时表示，Meta的Llama 3发布(bù)可能会带来更多(duō)AI应(yīng)用落地机会和场景，它通过提供更大词汇量的Token词(cí)典、更长的输入上下文长度以及(jí)优(yōu)化的模型结构，增强了模型的编码效(xiào)率和推理效率。“现在，比起Llama 2，Llama 3在(zài)代码(mǎ)能力和逻辑(jí)推理能力(lì)上有显著提(tí)升，这可能会促进相关AI应用的性能（提升），尤其是在需要复杂(zá)逻辑和代码理解的场景中去落地。”

OpenAI在GPT-2之后调转船头(tóu)走向闭源，Meta则成为开源界的引领者之一。

从2020年发(fā)布GPT-3，到引发轰动的GPT-3.5，以及2023年3月发(fā)布的GPT-4，都是闭源模型。此前，马斯克起诉OpenAI时曾直言：“如果OpenAI改名为ClosedAI，我就撤(chè)销诉讼。”

李明顺认(rèn)为，OpenAI的转(zhuǎn)变(biàn)可能与(yǔ)其商业战略和市场定位有关。“初期开源有助于快速吸引关注和社区参与，但随着公(gōng)司的发展，我估计阿(ā)尔特曼（Sam Altman）的野心(xīn)和商业梦想越来越膨(péng)胀(zhàng)了，闭源可以更好地让它融资，包括(kuò)和微软合作，保护领先的技术优势。”他表示，从OpenAI的转变中可以看出，开源与闭源的选择并非固(gù)定不变，而(ér)是需要根据公司战略目标、市场环境和产品发展阶段灵活调整。天下没(méi)什么(me)事情是绝对的(de)，很多开源公司也是拿着次优代码开源，独家秘(mì)方闭源。

在追逐AGI（通用(yòng)人工智能）这(zhè)颗明珠的道路上，迄今为(wèi)止，Meta依旧持续沿着开源的(de)路径前行。

2024年初，扎克伯格在Meta第四季度及2023全年财报电话会议上(shàng)表示：“长期以来，我们的策(cè)略是构建并开放源代码通用基础设施，同时保留我(wǒ)们的(de)具体(tǐ)产品实现为(wèi)专有技术。”

他认为，开源(yuán)带来了几个战略好处。首先(xiān)，开源软(ruǎn)件通(tōng)常更加安全可靠，并且(qiě)因为社区的持续反馈(kuì)、审查和开发，更加高效。其(qí)次，开源(yuán)软件经常成(chéng)为行业标准，“当企(qǐ)业开始基于(yú)我们的技术栈建立标准时，这使得将创新融入我们的产品变得(dé)更加(jiā)容易。这种微妙的优势，能够迅速学习和改进，是巨大(dà)的竞争优势(shì)，而成为(wèi)行业标准正(zhèng)是这一能力的关键(jiàn)”。第三，开源在开发者和研究人员(yuán)中极受欢迎。

开源与闭源并不矛盾

开源还(hái)是闭源，也许是全球人工智能信徒长(zhǎng)久的(de)辩题(tí)。在Llama 3诞生前几天，国(guó)内同样在进行一场“辩论”。

4月11日，百度董(dǒng)事长兼首席执行官李彦宏在其内部讲话中直言(yán)，大(dà)模型(xíng)开源的意义不大，闭源模型在能(néng)力上会持续领先，而不是一(yī)时领先，做模型的创业公司既做模型又做(zuò)应用的“双轮驱动(dòng)”不是一个好的模式。在一周后的Create 2024百度(dù)AI开发者大会(huì)上，李彦宏(hóng)再度提到，大家以前用开源(yuán)觉得(dé)开源(yuán)便宜，其实在大模型场景下，开源是最贵的，所以开源模型会越来(lái)越落后。

360公司(sī)创始人周鸿祎则(zé)持不同(tóng)的观点(diǎn)。他表示：“网上有些名人胡说八道，大家也别被他们忽悠，说开源不如闭源好。一(yī)句话，今天没有开源就没有Linux（操作系统(tǒng)内核），没有Linux就(jiù)没(méi)有互联网(wǎng)，就连说这话的公司(sī)自己都借(jiè)助了开源的力量才成长到今天(tiān)。”

这段发言被解(jiě)读为对李彦宏观点的回怼，周鸿祎随后澄清道：“我一直是(shì)开源的信徒，但是(shì)我说开源(yuán)好，是（4月）13日在哈佛(fú)讲的，李厂长（指李(lǐ)彦宏）说闭源好，是（4月）16日在北(běi)京讲的。”

生数科技联合(hé)创始人兼CEO唐家渝站在闭源的一边。在4月18日(rì)举行(xíng)的“2024中国生成(chéng)式AI大会”上，唐家渝表示：“在我们看来，开源、闭源都有各(gè)自可以做的商业生态，但是从模型能力的提升来说，或者持续走到(dào)前列来说，闭源(yuán)还是会走到开源的(de)前面。”

昆仑万维(wéi)董事长方汉的(de)观点是(shì)，开源模(mó)型与闭源模型之间(jiān)的(de)差距正在(zài)不断缩小。4月16日，方汉在接受《每日经(jīng)济新(xīn)闻》记者在内(nèi)的媒体采访时(shí)表示，闭源模型的确(què)是(shì)第一，但是(shì)开源大模(mó)型在2023年到今年这一年间，从落后两年以上，已经进(jìn)化到落后4~6个月(yuè)以上。

此外，方(fāng)汉(hàn)认为，在应用侧，闭源对于产品(pǐn)特性和长尾需求的满足都落(luò)后于开源大模(mó)型，开源大模型(xíng)是一种生(shēng)态构建器，更利于满足用户的长尾需求。开源大模型和闭源大模型是一(yī)个生态的组成部分，不是谁压(yā)倒谁，大家都(dōu)有自己的生(shēng)存空间，也(yě)都有更好的明天(tiān)。

不过，从商业化上来讲，闭源和开源也许并不矛盾。启(qǐ)明(míng)创(chuàng)投合伙人周志峰就认为，开源闭源在(zài)过去几个(gè)大(dà)浪潮当中没有很大的冲突，不太理解为什(shén)么很多人(rén)把闭(bì)源、开(kāi)源(yuán)在(zài)AI时代看成对立的。

李明顺的观(guān)点(diǎn)则是，在当前强应用导向的背景下，开源模式具有显著优势，能够吸引全球范围内最(zuì)广泛的人(rén)参(cān)与，从而(ér)使其创新性保持在较高(gāo)水平。

相较之(zhī)下，尽管一些闭源大模型在技术上(shàng)具有领先地位，但其成本太高。不过他也强调，开源与闭(bì)源在不同公司和应用场景中可以相互转换。一(yī)些(xiē)基(jī)于(yú)开源的产品(pǐn)在发掘到独特优势后，可能(néng)会通过闭源策略建立(lì)竞争壁垒。同(tóng)时，一些闭源公司也会不断(duàn)将其部分产品开源。这(zhè)两个应该(gāi)是(shì)共存的，未来开(kāi)源可能用户量(liàng)级上更(gèng)大，但是行业内，商业化做得比较好的公司，往往(wǎng)还是闭源的多一点。

在开源与闭(bì)源的辩论(lùn)中，也许(xǔ)答案并非非此即彼。AI的未来可能既(jì)不是完全开放(fàng)的“自由港(gǎng)”，也(yě)不是彻底封闭的“孤岛(dǎo)”，而是一(yī)个(gè)既包含开(kāi)放协(xié)作也包含封闭(bì)竞争的混合生态。在这个(gè)生态系统中，开放与封闭不是 Meta继续押宝开源大模型 Llama 3拿下“赛点”？对(duì)立的两极，而是一枚硬币的两面。

未经允许不得转载：橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”？