橘子百科-橘子都知道橘子百科-橘子都知道

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源与闭源(yuán)之争延续到大Meta继续押宝开源大模型 Llama 3拿下“赛点”?模型时代。在寻找“新大陆”的路上,开源与闭源的辩论,就像(xiàng)是一场关于AI未(wèi)来的“航海策(cè)略”讨论。

开源一派认(rèn)为,开源能够促进全球科研人员和开发者的协作(zuò),加(jiā)速AI技术的迭(dié)代与创新。同时,开源让更多人(rén)参与到模型的改进和优化中,通过集体智慧解决复杂的技术难题。

闭源的倡导者 则看重(zhòng)其在商业(yè)化、技术保护和产品差异 化方面的优势。闭源(yuán)模型使得企业能够控(kòng)制产品的开发节 奏和市场策略,保护其商业利益 。此外,闭源也有(yǒu)助于企业维护其技术优势,避 免竞(jìng)争对手模仿或超越。

Llama 3的发布让开(kāi)源大模型在与闭源的竞争中再度“扳回一城”。从测试结(jié)果来看,Llama 3的成绩大幅超越了Llama 2,也胜过(guò)了(le)GPT-3.5。

在AI这(zhè)场没有硝烟的“航海(hǎi)竞赛”中,大模型已(yǐ)然成为眼前的灯塔(tǎ)。未(wèi)知的是,这座灯塔究竟是向所有航海者(zhě)开放其光(guāng)芒,还(hái)是仅为特定的(de)船只照亮前行的航(háng)道。

开源在 开发者和研究人员中(zhōng)极受欢迎

Meta正沿着开(kāi)源路径(jìng)继续前进。

近日,Meta推出开(kāi)源大模型Llama 3系列,发(fā)布8B和70B两个版本。Meta创始人兼首席执行官扎克伯格(gé)在同一天宣布(bù),基于Llama 3,Meta的AI助手(shǒu)现在已经覆盖Instagram、WhatsApp、Facebook等(děng)全系应用,并单独开启了网站。

与Llama 2相比,Llama 3进行了几项关键的改进(jìn):使用具128K token(输入数据的最小单元)词汇表的tokenizer(编译器),可以更有效地编码语言(yán),从而显著提升模(mó)型性能;在8B和70B模型中都采用分组查(chá)询注意力(GQA),以提高Llama 3模型的推(tuī)理效率(lǜ);在8192个token的序列上训练模型,使用掩码来确保自注意力(Self-Attention)不会(huì)跨越文(wén)档(dàng)边(biān)界。

据Meta介绍,Llama 3已经(jīng)在多(duō)种行业基准测试上展现了最先进的(de)性(xìng)能,提供了包(bāo)括(kuò)改进的推理能力在(zài)内的新功(gōng)能,是目前市场(chǎng)上最好的开源大模型。

此外,Llama 3发布后,微软Azure、谷歌云、百度智(zhì)能云等陆续宣布其平台上线Llama 3。百度方面此前对《每(měi)日经济新闻》记者表示,百度智能云千帆大 模型平台在国(guó)内首家推出针对Llama 3全系列版(bǎn)本的训练(liàn)推理方案,便于开发(fā)者进行再训练,搭建专属大模型。

工业和信息化部工(gōng)业文化发展中心(xīn)AI应用工作组执行组长、行行AI董事长李明顺在接受《每日经济新闻》记者采(cǎi)访(fǎng)时表示,Meta的Llama 3发布可能会带来更多AI应用落地机会和场景,它通过提供更大词汇量的Token词典、更(gèng)长的输入上下文长度以及优化的模型结构,增强了模型的编(biān)码效率和推理效率。“现在(zài),比起Llama 2,Llama 3在代码能力和逻辑(jí)推理能力(lì)上有显著提升,这可能会促进(jìn)相关AI应用(yòng)的性能(néng)(提升),尤其是在需要复杂逻辑和代码理解的场景(jǐng)中去落地。”

OpenAI在GPT-2之后调(diào)转船头走(zǒu)向闭源,Meta则(zé)成为开源界的引领者之一。

从(cóng)2020年发布GPT-3,到引发轰动的GPT-3.5,以及2023年3月发布(bù)的GPT-4,都是闭源模型。此前,马(mǎ)斯克起诉OpenAI时曾直(zhí)言:“如果OpenAI改名为(wèi)ClosedAI,我就撤销诉讼。”

李明(míng)顺认为(wèi),OpenAI的转(zhuǎn)变(biàn)可(kě)能与其 商(shāng)业战 略和市场定位有关。“初期(qī)开源有助 于快速吸引关注和社区参与,但随着(zhe)公司的发展,我估计阿尔(ěr)特曼(Sam Altman)的野心和商业梦想越来越膨胀了,闭源可以更好地让(ràng)它融资,包括和微软合(hé)作,保护领先 的技术优(yōu)势。”他表示,从OpenAI的转变中可 以看出(chū),开源与闭源的选(xuǎn)择并非固定不变(biàn),而是需要(yào)根据公司战(zhàn)略(lüè)目标、市场环境和产品发展阶段灵活调整。天下没(méi)什么事情是绝对的(de),很(hěn)多开(kāi)源公司也是拿着次优代(dài)码开 源,独家秘方(fāng)闭源。

在追逐 AGI(通用人工智能)这颗明珠的道(dào)路上,迄今为(wèi)止,Meta依旧持续沿着开源的路径前行。

2024年初,扎克(kè)伯格在Meta第四季度及2023全年财(cái)报电话会议上表示:“长期以来,我 们的策略是构建并开放源代码通用基础设施,同时(shí)保留我们的具体产(chǎn)品实现为专(zhuān)有(yǒu)技术。”

他认为,开源带来了几个战略好处。首先,开源软件通常更(gèng)加安全可靠(kào),并且因为(wèi)社(shè)区的持续反馈、审查和(hé)开发,更加高效。其次,开源软件经常成为行业标准(zhǔn),“当企业(yè)开始基于我(wǒ)们的技(jì)术栈建立标准时(shí),这使得将创新融入我(wǒ)们的产品变得更加容(róng)易。这种微妙的优势,能够(gòu)迅速学习和改进,是巨大(dà)的竞争优势(shì),而成为行业标(biāo)准正是(shì)这(zhè)一能力的关键”。第三,开(kāi)源在开发者和研(yán)究人员中极受欢(huān)迎。

开源与闭源并 不矛盾(dùn)

开源还(hái)是闭源,也许是全球人工智(zhì)能信徒长久(jiǔ)的辩题。在Llama 3诞生前几(jǐ)天,国内同样在进行一场“辩论”。

4月11日,百度董事长兼(jiān)首席执行官李彦宏在其内部讲话中直言(yán),大模型开源的意义(yì)不大(dà),闭源模型在能力上会持续领先,而不(bù)是一时领先,做模型的创业(yè)公司既做(zuò)模型又做(zuò)应用的“双轮驱动”不是一个好的模式。在一(yī)周后的Create 2024百度AI开发者大会上,李彦宏再度(dù)提到,大家以前(qián)用开源觉得开源便(biàn)宜,其实在大模型(xíng)场 景下,开源是最贵的,所以开源模型会越来越落后。

360公司(sī)创始人周鸿祎则持不同的观(guān)点。他表示:“网(wǎng)上有些名人胡说八道,大家也别被(bèi)他们忽悠,说开源不如闭源好。一句(jù)话(huà),今天没有开源就(jiù)没有Linux(操作系统内核),没有(yǒu)Linux就没有互联网,就连说(shuō)这话的公司自己都借(jiè)助(zhù)了开 源的力量才成(chéng)长到今天(tiān)。”

这段(duàn)发言(yán)被解(jiě)读(dú)为对(duì)李彦(yàn)宏观点的回怼(duì),周(zhōu)鸿祎随后澄清道:“我一直是(shì)开源(yuán)的信(xìn)徒,但是我说开(kāi)源好,是(4月)13日在哈佛讲的,李厂长(指李彦(yàn)宏)说闭源好(hǎo),是(4月)16日在北京讲的。”

生数科技联(lián)合创始人兼CEO唐家渝站在闭源的(de)一(yī)边。在4月18日举行的“2024中国生成式AI大会”上,唐(táng)家渝表示(shì):“在我们 看来,开 源、闭(bì)源都(dōu)有(yǒu)各自可以做(zuò)的商业生态,但是从模型(xíng)能(néng)力(lì)的提(tí)升来说,或者持续走到前列来说,闭(bì)源还是会走到开源的前(qián)面。”

昆仑万(wàn)维董事长方汉的观点是,开源模型与闭源模型之(zhī)间的差距正在不断缩小。4月16日(rì),方(fāng)汉(hàn)在接受(shòu)《每日经济新闻(wén)》记者在内 的媒体采访(fǎng)时表示,闭源模型的确是第一,但是开源大模型在2023年到今年这一(yī)年间,从(cóng)落后两年以上,已经(jīng)进化到落Meta继续押宝开源大模型 Llama 3拿下“赛点”?后4~6个月(yuè)以上。

此(cǐ)外,方汉认(rèn)为,在应用侧,闭(bì)源(yuán)对于产品特性和长尾需求的满足都(dōu)落后于开(kāi)源大(dà)模型,开源大模型是一种(zhǒng)生态构建器(qì),更利于(yú)满足用户的长尾需求。开源大模型和闭源大模(mó)型是(shì)一个生(shēng)态的组成部分,不是谁(shuí)压倒谁,大家都有自己的生存 空间,也都(dōu)有更好(hǎo)的(de)明天。

不(bù)过,从商业化上来讲,闭源和开源也许并不矛盾。启明创投(tóu)合伙人(rén)周志峰就认为,开源(yuán)闭(bì)源在过(guò)去几个大浪(làng)潮当中没有很大的(de)冲突,不太理解为什么很(hěn)多人(rén)把闭源、开源在AI时(shí)代看成(chéng)对立的。

李明顺(shùn)的观点则是,在当前强应用导向的背景(jǐng)下,开源(yuán)模式具有显著优势,能够吸引全球范(fàn)围内最广(guǎng)泛的(de)人参与(yǔ),从而使其创新性保持在较高水(shuǐ)平。

相(xiāng)较之(zhī)下,尽(jǐn)管一些闭源大模型在技术上具有领(lǐng)先地位(wèi),但其成本太高(gāo)。不过他也强调,开源与闭源在不同公(gōng)司和应用场(chǎng)景中可以相互转换 。一些基(jī)于(yú)开源的产(chǎn)品在发掘到独特优势后,可能会通过闭源策略建立竞争壁垒。同时,一些(xiē)闭源公司也(yě)会(huì)不断将其(qí)部分产(chǎn)品开(kāi)源。这两个应(yīng)该是共存的,未来开源可能用户量级上更大,但是行业内,商 业化做得比较好的公司,往往还是闭源(yuán)的多一(yī)点。

在开源与闭(bì)源(yuán)的辩论中 ,也许答(dá)案并非非(fēi)此即彼。AI的(de)未来可能(néng)既不是完全开放的“自由港”,也不是彻底(dǐ)封闭(bì)的“孤岛”,而(ér)是一个既包含开(kāi)放(fàng)协作也包含封闭(bì)竞(jìng)争的混合生态(tài)。在(zài)这个生态系统(tǒng)中,开放与封闭不是对立的两极,而是一枚硬币的两(liǎng)面。

未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?

评论

5+2=