Meta继续押宝开源大模型 Llama 3拿下“赛点”？

开源与闭源之争延续到大模(mó)型时代。在寻找“新大陆”的(de)路上，开源与闭(bì)源(yuán)的(de)辩(biàn)论，就(jiù)像是一场关于AI未来的(de)“航海策略(lüè)”讨论。

开源一派认为(wèi)，开(kāi)源能够促进全球科研人(rén)员和(hé)开发者(zhě)的协作，加速AI技术(shù)的(de)迭代与(yǔ)创新。同(tóng)时，开源让更多人参与到模型的(de)改(gǎi)进和优化中，通过集体智慧解决复(fù)杂的技术难题(tí)。

闭源的倡导者则看(kàn)重其(qí)在商业(yè)化、技(jì)术保护和产品差异化方面的优势。闭(bì)源模型使得企业(yè)能够控制产品的开发(fā)节奏(zòu)和市场策略，保护(hù)其商业利益。此外，闭源也有助(zhù)于企业维护其技(jì)术优势，避免竞争对手模仿或超越。

Llama 3的发布让开源大模型在(zài)与闭源的竞争中再度“扳回一城”。从测试结果来看，Llama 3的成绩(jì)大幅超越了Llama 2，也胜过了GPT-3.5。

在(zài)AI这场没有硝烟的“航海竞赛”中，大模型已然成为眼前(qián)的灯塔。未知的是，这座灯塔究竟是向所有航海者开放其光芒，还是仅为特定的船只照亮前行(xíng)的(de)航道。

开源在开发者和研究(jiū)人员中极受欢迎

Meta正沿着开源(yuán)路径继续前(qián)进(jìn)。

近日，Meta推出开(kāi)源大模型Llama 3系列，发布8B和70B两个版(bǎn)本。Meta创始人兼首席执行官扎克伯格在同一天(tiān)宣布，基于(yú)Llama 3，Meta的AI助手现在已(yǐ)经覆盖Instagram、WhatsApp、Facebook等全系应(yīng)用，并单(dān)独(dú)开启了网站。

与Llama 2相(xiāng)比，Llama 3进行了(le)几项关键的改进：使用(yòng)具128K token（输入数据(jù)的(de)最(zuì)小单元）词汇表的tokenizer（编译器），可以更有效地(dì)编码语言，从(cóng)而显著提升模型性能；在8B和70B模型中都采用分组查询注意力（GQA），以提高Llama 3模(mó)型的推理效率；在8192个token的序列上(shàng)训练模型(xíng)，使用掩码来确(què)保自注意力（Self-Attention）不会跨越文档边界。

据Meta介绍，Llama 3已经在多种行业基准测(cè)试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能(néng)，是目前市场上(shàng)最好的开源(yuán)大(dà)模型。

此(cǐ)外(wài)，Llama 3发布后，微软Azure、谷歌云、百度智能云等陆(lù)续宣(xuān)布其平台(tái)上线Llama 3。百度方(fāng)面此前对《每(měi)日经济(jì)新闻》记(jì)者表示，百度智能云千帆大模(mó)型平(píng)台在国(guó)内首家推出(chū)针对(duì)Llama 3全系列版本的训练推理方案，便于开发者进行再训练，搭建专属大模型。

工业(yè)和信(xìn)息化部工业文化发(fā)展中心AI应用工作组执行组长、行行AI董事长李明顺在(zài)接(jiē)受《每日经(jīnMeta继续押宝开源大模型 Llama 3拿下“赛点”？g)济新闻》记者采访时(shí)表示，Meta的Llama 3发布可能会带(dài)来(lái)更多AI应用落地机会和场景，它通过(guò)提供更大词汇量的(de)Token词典、更长的(de)输入上下文长度以及优化的模型(xíng)结构，增强了模型的编码效率和推(tuī)理效率。“现在，比起Llama 2，Llama 3在代码能力(lì)和逻(luó)辑推理能力上有显著(zhù)提升，这可(kě)能会促进(jìn)相关AI应用的性能（提升(shēng)），尤其是在需要复杂逻辑和代码理解的场景中去落地。”

OpenAI在GPT-2之后(hòu)调转船(chuán)头走向闭源，Meta则成为开(kāi)源界的引领(lǐng)者之一。

从2020年发布GPT-3，到引发轰动的GPT-3.5，以及2023年3月发布的GPT-4，都(dōu)是闭源模型。此前(qián)，马斯克起诉OpenAI时曾直言：“如果OpenAI改名为ClosedAI，我就撤(chè)销诉讼。”

李明顺认为，OpenAI的转变(biàn)可能与(yǔ)其商业(yè)战略和市场定位有关。“初(chū)期开源有助于(yú)快速吸引关注和社区参与(yǔ)，但随着公司的发展，我(wǒ)估计阿尔特曼（Sam Altman）的野心(xīn)和商业梦想越(yuè)来越膨胀了，闭源可以更好地让(ràng)它融资，包括和微软(ruǎn)合作，保护领先(xiān)的技术优势(shì)。”他表示，从OpenAI的转变中可(kě)以看出，开(kāi)源(yuán)与闭源的选择并非固定不变，而是需要(yào)根据(jù)公司战略目(mù)标、市场环境和产品(pǐn)发展阶段灵活调整。天下没什么(me)事情是绝对的，很多开源公司(sī)也(yě)是拿着次优代(dài)码开源，独家秘方闭源(yuán)。

在追逐AGI（通用人(rén)工智能）这颗明珠的道路上，迄今为止(zhǐ)，Meta依旧持(chí)续(xù)沿着开源的路径前行。

2024年初(chū)，扎克伯格在Meta第四季度(dù)及(jí)2023全年财报电话会议上表示：“长期以来(lái)，我们的(de)策略(lüè)是构建并开放源代码通用基础设施(shī)，同时保留我们的(de)具体产(chǎn)品(pǐn)实现为专有技术。”

他认(rèn)为，开源带来了几个战(zhàn)略好处。首先，开源软件通常更加安全可(kě)靠，并(bìng)且因为社区的持续反馈、审查和开发，更加高效。其次(cì)，开源软件经常成为行业标准，“当企业开始基于我们的技术栈建(jiàn)立标准时，这(zhè)使得将创新融入我们的产(chǎn)品变得更加容易(yì)。这种微妙的优势，能够迅速学习和改进，是巨大的竞争优势，而成(chéng)为行业标准正是这一能力的关键”。第三，开源在(zài)开发Meta继续押宝开源大模型 Llama 3拿下“赛点”？者和研究人员(yuán)中极受欢迎。

开源与闭源并不(bù)矛盾

开源还是闭源，也许是全球人工智(zhì)能信徒长(zhǎng)久的辩题。在Llama 3诞(dàn)生前几天，国(guó)内同(tóng)样在进行一场“辩论”。

4月11日，百度董事长兼首(shǒu)席执行官李彦宏在其(qí)内部讲话中直言，大模型开源的意义不大，闭源模(mó)型在能力上(shàng)会持续领先，而(ér)不是一时领先，做模型的创业公司(sī)既做(zuò)模型又做应用的“双轮驱动”不是(shì)一个好的模式。在一周(zhōu)后的Create 2024百度AI开发者大会上，李彦宏(hóng)再度提到，大(dà)家以前用(yòng)开源觉得开源便宜，其实在大模型(xíng)场景下，开源是最贵的，所以(yǐ)开(kāi)源模型会越来(lái)越落(luò)后。

360公司创始人周鸿祎则持不同的观点。他表示：“网上有些名(míng)人胡(hú)说八道，大家也别被他们忽悠，说开(kāi)源(yuán)不如闭源好。一句(jù)话，今天没有开源就没(méi)有Linux（操作系统内核），没有Linux就没有互联网，就连说这话的公司(sī)自己都借助了(le)开源的力量才成长到今(jīn)天。”

这段发言被解读为(wèi)对李彦宏观点的回怼，周鸿祎随(suí)后澄清道：“我一直是开源的信徒，但是我说开源好，是（4月）13日在哈佛讲的，李厂长(zhǎng)（指李彦(yàn)宏）说闭源好，是（4月）16日在北京讲的。”

生数科技(jì)联合创始人兼(jiān)CEO唐家渝站在(zài)闭源的一边。在4月18日举行的“2024中国生成式AI大会”上(shàng)，唐家渝表示：“在我们看来，开源、闭源都有各自(zì)可以(yǐ)做的(de)商业生态，但是从模型能力(lì)的(de)提升(shēng)来说，或者持续走到前(qián)列来说，闭源还是会走到开(kāi)源的前(qián)面(miàn)。”

昆仑万维董事长方汉的观点(diǎn)是，开源模型(xíng)与闭(bì)源模型之间的差距正(zhèng)在不断缩小(xiǎo)。4月16日，方汉在接(jiē)受《每日经济(jì)新闻》记者在内的媒体采访时表示(shì)，闭源模型的确(què)是第一，但是(shì)开源大模型在2023年(nián)到今年这一年间，从落后两(liǎng)年以(yǐ)上，已经进化到落后(hòu)4~6个月以上。

此外，方汉认为，在应用侧(cè)，闭源(yuán)对于产品特性和(hé)长尾需求的满足(zú)都落后于开源大模型，开源大模型是(shì)一种(zhǒng)生态构建器，更(gèng)利于满足用户的长尾需求。开源大模型和闭源大模型是(shì)一个生态的(de)组成部分，不是谁压倒谁，大家都有自己的生存空间，也都有更好的明天。

不过，从商业化上来讲，Meta继续押宝开源大模型 Llama 3拿下“赛点”？闭源和(hé)开源也许并不矛盾。启明创投合伙人周志峰就认为，开源闭源在(zài)过去几个(gè)大浪(làng)潮(cháo)当中没有很大的(de)冲突，不太理解为什么很多人把闭源、开源在AI时代看成(chéng)对立的。

李明顺的(de)观点则是，在当前强应用导向的背景下，开源模式具有显著优势，能够吸引全球(qiú)范围内最广泛的(de)人参与，从而使其创(chuàng)新(xīn)性保持在较高水平。

相较(jiào)之下，尽管一些(xiē)闭源大模型(xíng)在技术上具有(yǒu)领先地位，但其(qí)成本太高。不过他也(yě)强调，开源与闭源(yuán)在不同公(gōng)司(sī)和应用场景中可以相互转换。一些基于开源的产品在(zài)发掘到独特(tè)优(yōu)势后，可能会通过闭源策略建立竞争壁垒。同时，一些(xiē)闭源公(gōng)司也会(huì)不断将其(qí)部分产品开源。这(zhè)两个应(yīng)该是共存的(de)，未来(lái)开源(yuán)可能用户量级上(shàng)更大(dà)，但是(shì)行业(yè)内，商业化做得比较好的公司，往往还是(shì)闭(bì)源的多(duō)一点。

在开源与闭源的辩论中(zhōng)，也(yě)许答案并非非此即彼。AI的未来可能既不是完全开(kāi)放的“自由(yóu)港(gǎng)”，也不是彻底封闭的“孤岛”，而是一个既包含开放(fàng)协作也包含封闭竞争的混合生态。在这(zhè)个生(shēng)态系统中(zhōng)，开放与封闭不是对立的两极(jí)，而是一枚硬币的两面。

未经允许不得转载：橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”？