橘子百科-橘子都知道橘子百科-橘子都知道

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源与闭源之争延续到大模(mó)型时代。在寻找“新大陆”的(de)路上,开源与闭(bì)源(yuán)的(de)辩(biàn)论,就(jiù)像是一场关于AI未来的(de)“航海策略(lüè)”讨论。

开源一派认为(wèi),开(kāi)源能够促进全球科研人(rén)员和(hé)开发者(zhě)的 协作,加速AI技术(shù)的(de)迭代与(yǔ)创新 。同(tóng)时,开源让更多人参与到模型的(de)改(gǎi)进和优化中,通过集体智慧解决复(fù)杂的技 术难题(tí)。

闭源的倡导者则看(kàn)重其(qí)在商业(yè)化、技(jì)术保护和产品差异化方面的优势。闭(bì)源模型使得企业(yè)能够控制产品的开发(fā)节奏(zòu)和市场策略,保护(hù)其商业利 益。此外,闭源也 有助(zhù)于企业维护其技(jì)术优势,避免竞争对手模仿或超越。

Llama 3的发布让开源大模型在(zài)与闭源的竞争中再度“扳回一城”。从测试结果来看,Llama 3的成绩(jì)大幅超越了Llama 2,也胜过了GPT-3.5。

在(zài)AI这场没有硝烟的“航海竞赛”中,大模型已然成为眼前(qián)的灯塔。未知的是,这座灯塔究竟是向所有航海者开放其光芒,还是仅为特定的船只照亮前行(xíng)的(de)航道。

开源在开发者和研究(jiū)人员中极受欢迎

Meta正沿着开源(yuán)路径继续前(qián)进(jìn)。

近日,Meta推出开(kāi)源大模型Llama 3系列,发布8B和70B两个版(bǎn)本。Meta创始人兼首席执行官扎克伯格在同一天(tiān)宣布,基于(yú)Llama 3,Meta的AI助手现在已(yǐ)经覆盖Instagram、WhatsApp、Facebook等全系应(yīng)用,并单(dān)独(dú)开启了网站。

与Llama 2相(xiāng)比,Llama 3进行了(le)几项关键的改进:使用(yòng)具128K token(输入数据(jù)的(de)最(zuì)小单元)词汇表的tokenizer(编译器),可以更有 效地(dì)编码语言,从(cóng)而显著提升模型性能;在8B和70B模型中都采用分组查询注意力(GQA),以提高Llama 3模(mó)型的推理效率;在8192个token的序列上(shàng)训练模型(xíng),使用掩码来确(què)保自注意力(Self-Attention)不会跨越文档边界。

据Meta介绍,Llama 3已经在多种行业基准测(cè)试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能(néng),是目前市场上(shàng)最好的开源(yuán)大(dà)模型 。

此(cǐ)外(wài),Llama 3发布后,微软Azure、谷歌云、百度智能云等陆(lù)续宣(xuān)布其平台(tái)上线Llama 3。百度方(fāng)面此前对《每(měi)日经济(jì)新闻》记(jì)者表示,百度智能云千帆大模(mó)型平(píng)台在国(guó)内首家推出(chū)针对(duì)Llama 3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型。

工业(yè)和信(xìn)息化部工业文化发(fā)展中心AI应用工作组执行组长、行行AI董事长李明顺在(zài)接(jiē)受《每日经(jīnMeta继续押宝开源大模型 Llama 3拿下“赛点”?g)济新闻》记者采访时(shí)表示,Meta的Llama 3发布可能会带(dài)来(lái)更多AI应用落地机会和场景,它通过(guò)提供更大词汇量的(de)Token词典、更长的(de)输入上下文长度以及优化的模型(xíng)结构,增强了模型的编码效率和推(tuī)理效率。“现在,比起Llama 2,Llama 3在代码能力(lì)和逻(luó)辑推理能力上有显著(zhù)提 升,这可(kě)能会促进(jìn)相关AI应用的性能(提升(shēng)),尤其是在需要复 杂逻辑和代码理解的场景中去落地。”

OpenAI在GPT-2之后(hòu)调转船(chuán)头走向闭源,Meta则成为开(kāi)源界的引领(lǐng)者之一。

从2020年发布GPT-3,到引发轰动的GPT-3.5,以及2023年3月发布的GPT-4,都(dōu)是闭源模型。此前(qián),马斯克起诉OpenAI时曾直言:“如果OpenAI改名为ClosedAI,我就撤(chè)销诉讼。”

李明顺认为,OpenAI的转变(biàn)可能与(yǔ)其商业(yè)战略和市场定位有关。“初(chū)期开源有助于(yú)快速吸引关注和社区参与(yǔ),但 随着公司的发展,我(wǒ)估计阿尔特曼(Sam Altman)的野心(xīn)和商业梦想越(yuè)来越膨胀了,闭源可以更好地让(ràng)它融资,包括和微软(ruǎn)合作,保护领先(xiān)的技术优势(shì)。”他 表示,从OpenAI的转变中可(kě)以看出,开(kāi)源(yuán)与闭源的 选择并非固定不变,而是需要(yào)根据(jù)公司战略目(mù)标、市场环境和产品(pǐn)发展阶段灵活调整。天下没什么(me)事情是绝对的,很多开源公司(sī)也(yě)是拿着次优代(dài)码开源,独家秘方闭源(yuán)。

在追逐AGI(通用人(rén)工 智能)这颗明珠的道路上,迄今为止(zhǐ),Meta依旧持(chí)续(xù)沿着开源的路径前行。

2024年初(chū),扎克伯格在Meta第四季度(dù)及(jí)2023全年财报电话会议上表示:“长期以来(lái),我们的(de)策略(lüè)是构建并开放源代码通用基础设 施(shī),同时保留我们的(de)具体产(chǎn)品(pǐn)实现为专有技术。”

他 认(rèn)为,开源带来了几个战(zhàn)略好处。首先,开源软件通常更加安全可(kě)靠,并(bìng)且因为社区的持续反馈、审查和开发,更加高效。其次(cì),开源软件经常成为行业标准,“当企业开始基于我们的技术栈建(jiàn)立标准时,这(zhè)使得将创新融入我们的产(chǎn)品变得更加容易(yì)。这种微妙的优势,能够迅速学习和改进,是巨大的竞争优势,而成(chéng)为行业标准正是这一 能力的关键”。第三,开源在(zài)开发Meta继续押宝开源大模型 Llama 3拿下“赛点”?者和研究人员(yuán)中极受欢迎。

开源与闭源并不(bù)矛盾

开源还是闭源,也许是全球人工智(zhì)能信徒长(zhǎng)久的辩题。在Llama 3诞(dàn)生前几天,国(guó)内同(tóng)样在进行一场“辩论”。

4月11日,百度董事 长兼首(shǒu)席执行官李彦宏在其(qí)内部讲话中直言,大模型开源的意义不大,闭源模(mó)型在能力上(shàng)会持续领先,而(ér)不是一时领先,做模型的创业公司(sī)既做(zuò)模型又做应用的“双轮驱动”不是(shì)一个好的模式。在一周(zhōu)后的Create 2024百度AI开发者大会上,李彦宏(hóng)再度提到,大(dà)家以前用(yòng)开源觉得开源便宜,其实在大模型(xíng)场景下,开源是最贵的,所以(yǐ)开(kāi)源模型会越来(lái)越落(luò)后。

360公司创始人周鸿祎则持不同的观点。他表示:“网上有些名(míng)人胡(hú)说八 道,大家也别被他们忽悠,说开(kāi)源(yuán)不如闭源好。一句(jù)话,今天没有开源就没(méi)有Linux(操作系统内核),没有Linux就没有互联网,就连说这话的公司(sī)自己都借助了(le)开源的力量 才成长到今(jīn)天。”

这段发言被解读为(wèi)对李彦宏观点的回怼,周鸿祎随(suí)后澄清道:“我一直 是开源的信徒,但是我说开源好,是(4月)13日在哈佛讲的,李厂长(zhǎng)(指李彦(yàn)宏)说闭源好,是(4月)16日在北京讲的。”

生数科技(jì)联合创始人兼(jiān)CEO唐家渝站在(zài)闭源的一边。在4月18日举行的“2024中国生成式AI大会”上(shàng),唐家渝表示:“在我们看来,开源 、闭源都有各自(zì)可以(yǐ)做的(de)商业生态,但是从模型能力(lì)的(de)提升(shēng)来说,或者持续走到前(qián)列来说,闭源还是会走到开(kāi)源的前(qián)面(miàn)。”

昆仑万维董事长方汉的观点(diǎn)是,开源模型(xíng)与闭(bì)源模型之间的差距正(zhèng)在不断缩小(xiǎo)。4月16日,方汉在接(jiē)受《每日经济(jì)新闻》记者在内的 媒体采访时表示(shì),闭源模型的确(què)是第一,但是(shì)开源大模型在2023年(nián)到今年这一年间,从落后两(liǎng)年以(yǐ)上,已经进化到落后(hòu)4~6个月以上。

此外,方汉认为,在应用侧(cè),闭源(yuán)对于 产品特性和(hé)长尾需求的满足(zú)都落后于开源大模 型,开源大模型是(shì)一种(zhǒng)生态构建器,更(gèng)利于满足用户的长尾需求。开源大模型和闭源大模型是(shì)一个生态的(de)组成部分,不是谁压倒谁,大家都有自己的生存空间,也都有更好的明天。

不过,从商业化上来讲,Meta继续押宝开源大模型 Llama 3拿下“赛点”?闭源和(hé)开源也许并不矛盾。启明创投合伙人周志峰就认为,开源闭源在(zài)过去几个(gè)大浪(làng)潮(cháo)当中没有很大的(de)冲突,不太理 解为什么很 多人把闭源、开源在AI时代看成(chéng)对立的 。

李明顺的(de)观点则是,在当前强应用导向的背景下,开源模式具有显著优势,能够吸引全球(qiú)范围内最广泛的(de)人参与,从而使其创(chuàng)新(xīn)性保持在较高水平。

相较(jiào)之下,尽管一些(xiē)闭源大模型(xíng)在技术上具有(yǒu)领先地位,但其(qí)成本太高。不过他也(yě)强调,开源与闭源(yuán)在不同 公(gōng)司(sī)和应用场景中可以相互转换。一些基于开源的产品在(zài)发掘到独特(tè)优(yōu)势后,可能会通过闭源策略建立竞争壁垒。同时,一些(xiē)闭源公(gōng)司也会(huì)不断将其(qí)部分产品开源。这(zhè)两个应(yīng)该是共存的(de),未来(lái)开源(yuán)可能用户量级上(shàng)更大(dà),但是(shì)行业(yè)内,商业化做得比较好的公司,往往还是(shì)闭(bì)源的多(duō)一点。

在开源与闭源的辩论中(zhōng),也(yě)许答案并非非此即彼。AI的未来可能既不是完全开(kāi)放的“自由(yóu)港(gǎng)”,也不是彻底封闭的“孤岛”,而是一个既包含开放(fàng)协作也包含封闭竞争的混合生态 。在这(zhè)个生(shēng)态系统中(zhōng),开放与封闭不是对立的两极(jí),而是 一枚硬币的两面。

未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?

评论

5+2=