Meta继续押宝开源大模型 Llama 3拿下“赛点”？

开源与闭源(yuán)之争延续到大Meta继续押宝开源大模型 Llama 3拿下“赛点”？模型时代。在寻找“新大陆”的路上，开源与闭源的辩论，就像(xiàng)是一场关于AI未(wèi)来的“航海策(cè)略”讨论。

开源一派认(rèn)为，开源能够促进全球科研人员和开发者的协作(zuò)，加(jiā)速AI技术的迭(dié)代与创新。同时，开源让更多人(rén)参与到模型的改进和优化中，通过集体智慧解决复杂的技术难题。

闭源的倡导者则看重(zhòng)其在商业(yè)化、技术保护和产品差异化方面的优势。闭源(yuán)模型使得企业能够控(kòng)制产品的开发节奏和市场策略，保护其商业利益。此外，闭源也有(yǒu)助于企业维护其技术优势，避免竞(jìng)争对手模仿或超越。

Llama 3的发布让开(kāi)源大模型在与闭源的竞争中再度“扳回一城”。从测试结(jié)果来看，Llama 3的成绩大幅超越了Llama 2，也胜过(guò)了(le)GPT-3.5。

在AI这(zhè)场没有硝烟的“航海(hǎi)竞赛”中，大模型已(yǐ)然成为眼前的灯塔(tǎ)。未(wèi)知的是，这座灯塔究竟是向所有航海者(zhě)开放其光(guāng)芒，还(hái)是仅为特定的(de)船只照亮前行的航(háng)道。

开源在开发者和研究人员中(zhōng)极受欢迎

Meta正沿着开(kāi)源路径(jìng)继续前进。

近日，Meta推出开(kāi)源大模型Llama 3系列，发(fā)布8B和70B两个版本。Meta创始人兼首席执行官扎克伯格(gé)在同一天宣布(bù)，基于Llama 3，Meta的AI助手(shǒu)现在已经覆盖Instagram、WhatsApp、Facebook等(děng)全系应用，并单独开启了网站。

与Llama 2相比，Llama 3进行了几项关键的改进(jìn)：使用具128K token（输入数据的最小单元）词汇表的tokenizer（编译器），可以更有效地编码语言(yán)，从而显著提升模(mó)型性能；在8B和70B模型中都采用分组查(chá)询注意力（GQA），以提高Llama 3模型的推(tuī)理效率(lǜ)；在8192个token的序列上训练模型，使用掩码来确保自注意力（Self-Attention）不会(huì)跨越文(wén)档(dàng)边(biān)界。

据Meta介绍，Llama 3已经(jīng)在多(duō)种行业基准测试上展现了最先进的(de)性(xìng)能，提供了包(bāo)括(kuò)改进的推理能力在(zài)内的新功(gōng)能，是目前市场(chǎng)上最好的开源大模型。

此外，Llama 3发布后，微软Azure、谷歌云、百度智(zhì)能云等陆续宣布其平台上线Llama 3。百度方面此前对《每(měi)日经济新闻》记者表示，百度智能云千帆大模型平台在国(guó)内首家推出针对Llama 3全系列版(bǎn)本的训练(liàn)推理方案，便于开发(fā)者进行再训练，搭建专属大模型。

工业和信息化部工(gōng)业文化发展中心(xīn)AI应用工作组执行组长、行行AI董事长李明顺在接受《每日经济新闻》记者采(cǎi)访(fǎng)时表示，Meta的Llama 3发布可能会带来更多AI应用落地机会和场景，它通过提供更大词汇量的Token词典、更(gèng)长的输入上下文长度以及优化的模型结构，增强了模型的编(biān)码效率和推理效率。“现在(zài)，比起Llama 2，Llama 3在代码能力和逻辑(jí)推理能力(lì)上有显著提升，这可能会促进(jìn)相关AI应用(yòng)的性能(néng)（提升），尤其是在需要复杂逻辑和代码理解的场景(jǐng)中去落地。”

OpenAI在GPT-2之后调(diào)转船头走(zǒu)向闭源，Meta则(zé)成为开源界的引领者之一。

从(cóng)2020年发布GPT-3，到引发轰动的GPT-3.5，以及2023年3月发布(bù)的GPT-4，都是闭源模型。此前，马(mǎ)斯克起诉OpenAI时曾直(zhí)言：“如果OpenAI改名为(wèi)ClosedAI，我就撤销诉讼。”

李明(míng)顺认为(wèi)，OpenAI的转(zhuǎn)变(biàn)可(kě)能与其商(shāng)业战略和市场定位有关。“初期(qī)开源有助于快速吸引关注和社区参与，但随着(zhe)公司的发展，我估计阿尔(ěr)特曼（Sam Altman）的野心和商业梦想越来越膨胀了，闭源可以更好地让(ràng)它融资，包括和微软合(hé)作，保护领先的技术优(yōu)势。”他表示，从OpenAI的转变中可以看出(chū)，开源与闭源的选(xuǎn)择并非固定不变(biàn)，而是需要(yào)根据公司战(zhàn)略(lüè)目标、市场环境和产品发展阶段灵活调整。天下没(méi)什么事情是绝对的(de)，很(hěn)多开(kāi)源公司也是拿着次优代(dài)码开源，独家秘方(fāng)闭源。

在追逐 AGI（通用人工智能）这颗明珠的道(dào)路上，迄今为(wèi)止，Meta依旧持续沿着开源的路径前行。

2024年初，扎克(kè)伯格在Meta第四季度及2023全年财(cái)报电话会议上表示：“长期以来，我们的策略是构建并开放源代码通用基础设施，同时(shí)保留我们的具体产(chǎn)品实现为专(zhuān)有(yǒu)技术。”

他认为，开源带来了几个战略好处。首先，开源软件通常更(gèng)加安全可靠(kào)，并且因为(wèi)社(shè)区的持续反馈、审查和(hé)开发，更加高效。其次，开源软件经常成为行业标准(zhǔn)，“当企业(yè)开始基于我(wǒ)们的技(jì)术栈建立标准时(shí)，这使得将创新融入我(wǒ)们的产品变得更加容(róng)易。这种微妙的优势，能够(gòu)迅速学习和改进，是巨大(dà)的竞争优势(shì)，而成为行业标(biāo)准正是(shì)这(zhè)一能力的关键”。第三，开(kāi)源在开发者和研(yán)究人员中极受欢(huān)迎。

开源与闭源并不矛盾(dùn)

开源还(hái)是闭源，也许是全球人工智(zhì)能信徒长久(jiǔ)的辩题。在Llama 3诞生前几(jǐ)天，国内同样在进行一场“辩论”。

4月11日，百度董事长兼(jiān)首席执行官李彦宏在其内部讲话中直言(yán)，大模型开源的意义(yì)不大(dà)，闭源模型在能力上会持续领先，而不(bù)是一时领先，做模型的创业(yè)公司既做(zuò)模型又做(zuò)应用的“双轮驱动”不是一个好的模式。在一(yī)周后的Create 2024百度AI开发者大会上，李彦宏再度(dù)提到，大家以前(qián)用开源觉得开源便(biàn)宜，其实在大模型(xíng)场景下，开源是最贵的，所以开源模型会越来越落后。

360公司(sī)创始人周鸿祎则持不同的观(guān)点。他表示：“网(wǎng)上有些名人胡说八道，大家也别被(bèi)他们忽悠，说开源不如闭源好。一句(jù)话(huà)，今天没有开源就(jiù)没有Linux（操作系统内核），没有(yǒu)Linux就没有互联网，就连说(shuō)这话的公司自己都借(jiè)助(zhù)了开源的力量才成(chéng)长到今天(tiān)。”

这段(duàn)发言(yán)被解(jiě)读(dú)为对(duì)李彦(yàn)宏观点的回怼(duì)，周(zhōu)鸿祎随后澄清道：“我一直是(shì)开源(yuán)的信(xìn)徒，但是我说开(kāi)源好，是（4月）13日在哈佛讲的，李厂长（指李彦(yàn)宏）说闭源好(hǎo)，是（4月）16日在北京讲的。”

生数科技联(lián)合创始人兼CEO唐家渝站在闭源的(de)一(yī)边。在4月18日举行的“2024中国生成式AI大会”上，唐(táng)家渝表示(shì)：“在我们看来，开源、闭(bì)源都(dōu)有(yǒu)各自可以做(zuò)的商业生态，但是从模型(xíng)能(néng)力(lì)的提(tí)升来说，或者持续走到前列来说，闭(bì)源还是会走到开源的前(qián)面。”

昆仑万(wàn)维董事长方汉的观点是，开源模型与闭源模型之(zhī)间的差距正在不断缩小。4月16日(rì)，方(fāng)汉(hàn)在接受(shòu)《每日经济新闻(wén)》记者在内的媒体采访(fǎng)时表示，闭源模型的确是第一，但是开源大模型在2023年到今年这一(yī)年间，从(cóng)落后两年以上，已经(jīng)进化到落Meta继续押宝开源大模型 Llama 3拿下“赛点”？后4~6个月(yuè)以上。

此(cǐ)外，方汉认(rèn)为，在应用侧，闭(bì)源(yuán)对于产品特性和长尾需求的满足都(dōu)落后于开(kāi)源大(dà)模型，开源大模型是一种(zhǒng)生态构建器(qì)，更利于(yú)满足用户的长尾需求。开源大模型和闭源大模(mó)型是(shì)一个生(shēng)态的组成部分，不是谁(shuí)压倒谁，大家都有自己的生存空间，也都(dōu)有更好(hǎo)的(de)明天。

不(bù)过，从商业化上来讲，闭源和开源也许并不矛盾。启明创投(tóu)合伙人(rén)周志峰就认为，开源(yuán)闭(bì)源在过(guò)去几个大浪(làng)潮当中没有很大的(de)冲突，不太理解为什么很(hěn)多人(rén)把闭源、开源在AI时(shí)代看成(chéng)对立的。

李明顺(shùn)的观点则是，在当前强应用导向的背景(jǐng)下，开源(yuán)模式具有显著优势，能够吸引全球范(fàn)围内最广(guǎng)泛的(de)人参与(yǔ)，从而使其创新性保持在较高水(shuǐ)平。

相(xiāng)较之(zhī)下，尽(jǐn)管一些闭源大模型在技术上具有领(lǐng)先地位(wèi)，但其成本太高(gāo)。不过他也强调，开源与闭源在不同公(gōng)司和应用场(chǎng)景中可以相互转换。一些基(jī)于(yú)开源的产(chǎn)品在发掘到独特优势后，可能会通过闭源策略建立竞争壁垒。同时，一些(xiē)闭源公司也(yě)会(huì)不断将其(qí)部分产(chǎn)品开(kāi)源。这两个应(yīng)该是共存的，未来开源可能用户量级上更大，但是行业内，商业化做得比较好的公司，往往还是闭源(yuán)的多一(yī)点。

在开源与闭(bì)源(yuán)的辩论中，也许答(dá)案并非非(fēi)此即彼。AI的(de)未来可能(néng)既不是完全开放的“自由港”，也不是彻底(dǐ)封闭(bì)的“孤岛”，而(ér)是一个既包含开(kāi)放(fàng)协作也包含封闭(bì)竞(jìng)争的混合生态(tài)。在(zài)这个生态系统(tǒng)中，开放与封闭不是对立的两极，而是一枚硬币的两(liǎng)面。

未经允许不得转载：橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”？