橘子百科-橘子都知道橘子百科-橘子都知道

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源(yuán)与闭源(yuán)之争(zhēng)延续到大模型时(shí)代。在寻找“新大陆”的路上,开源与闭(bì)源的辩论,就像是一场关于AI未来的(de)“航海策略(lüè)”讨论。

开(kāi)源(yuán)一派认为,开源能够促进全球科研人员和开发者的协作,加速AI技(jì)术的迭代与创(chuàng)新。同时,开源让更多人参与到模型的改(gǎi)进和优化中,通过集体智慧解决复(fù)杂的技术(shù)难题(tí)。

闭源的倡(chàng)导者则看重其在商业化、技术(shù)保护和产品(pǐn)差异化方面的优势(shì)。闭源(yuán)模型使得企(qǐ)业能够控制产品的开发节奏和市场策略,保护其商业利益。此外,闭源也有助于企(qǐ)业(yè)维 护其技术优势,避免竞(jìng)争对手模(mó)仿或超越。

Llama 3的发布让开源大模型(xíng)在与闭(bì)源(yuán)的竞争 中(zhōng)再度“扳回一城”。从测(cè)试结果来看,Llama 3的成(chéng)绩大幅超越了Llama 2,也胜过了GPT-3.5。

在(zài)AI这场没有硝烟(yān)的“航海(hǎi)竞赛”中,大模型已然成为眼前(qián)的灯(dēng)塔。未知的是,这座灯塔(tǎ)究竟是向所有航海者开放其光芒,还是(shì)仅为特(tè)定的船只照亮前(qián)行的航道。

开源在开发者和研究人员中极受欢迎

Meta正(zhèng)沿着开源路径继续前(qián)进。

近日,Meta推出开(kāi)源大模型Llama 3系列,发布(bù)8B和70B两个(gè)版本(běn)。Meta创始人兼首席执(zhí)行官扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手现在已(yǐ)经覆(fù)盖Instagram、WhatsApp、Facebook等全系应用,Meta继续押宝开源大模型 Llama 3拿下“赛点”?并单独开启了网站(zhàn)。

与Llama 2相比,Llama 3进行了几项关(guān)键的(de)改进:使用 具128K token(输入数据的最小单元)词汇表的tokenizer(编(biān)译器),可以更有效(xiào)地编码语言(yán),从而显著提升模型性能;在8B和70B模型中都采用分组查询注意力(GQA),以提(tí)高Llama 3模(mó)型的推(tuī)理效率;在8192个token的序列上训练模型,使(shǐ)用掩码来确保自注意(yì)力(Self-Attention)不会跨越(yuè)文档边界。

据Meta介绍,Llama 3已经(jīng)在(zài)多种行业基准测试上展现了最(zuì)先进的性能,提供了(le)包括改进(jìn)的推理能力(lì)在内的新功能,是目前市场上(shàng)最好的开源大模型。

此(cǐ)外,Llama 3发布后,微软Azure、谷歌云、百度(dù)智能云等陆续宣布其平台上线Llama 3。百度方面此前对(duì)《每日经济新闻》记者表示,百(bǎi)度智能云千帆大模型平台(tái)在国内首家推出针对Llama 3全系(xì)列版本的训练推理方案,便于开发者进行再训练,搭建(jiàn)专属大模型。

工业和信息化部工(gōng)业文化发展中(zhōng)心(xīn)AI应用工作组执行(xíng)组长、行行AI董事长李明顺在接受《每日经济新闻》记者采访时表示,Meta的Llama 3发布(bù)可能会带来更多(duō)AI应(yīng)用落地机会和场景,它通过 提供更大词汇量的Token词(cí)典、更长的输入上下文长度以及(jí)优(yōu)化的模型结构,增强了模型的编码效(xiào)率和推理效率。“现在,比起Llama 2,Llama 3在(zài)代码(mǎ)能力和逻辑(jí)推理能力(lì)上有显著提(tí)升,这可能会促进相关AI应用的性能(提升),尤其是在需要复杂(zá)逻辑和代码理解的场景中去落地。”

OpenAI在GPT-2之后调转船头(tóu)走向闭源,Meta则成为开源界的引领者之一。

从2020年发(fā)布GPT-3,到引发轰动的GPT-3.5,以及2023年3月发(fā)布的GPT-4,都是闭源模型。此前,马斯克起诉OpenAI时曾直言:“如果OpenAI改名为ClosedAI,我 就撤(chè)销诉讼。”

李明顺认(rèn)为,OpenAI的转(zhuǎn)变(biàn)可能与(yǔ)其商业战略和市场定位有关。“初期开源有助于快速吸引关注和社区参与,但随着公(gōng)司的发展,我估计阿(ā)尔特曼(Sam Altman)的野心(xīn)和商业梦想越来越膨(péng)胀(zhàng)了,闭源 可以更好地让它融资,包括(kuò)和微软合作,保护领先的技术优势。”他表示,从OpenAI的转变中可以看出,开源与闭源的选择并非固(gù)定不变,而(ér)是需要根 据公司战略目标、市场环境和产品发展阶段灵活调整。天下没(méi)什么(me)事情是绝对的(de),很多开源公司也是拿着次优代码开源,独家秘(mì)方闭源。

在追逐AGI(通用(yòng)人工智能)这(zhè)颗明珠的道路上,迄今为(wèi)止,Meta依旧持续沿着开源的(de)路径前行。

2024年初,扎克伯格在Meta第四季度及2023全年财报电话会议上(shàng)表示:“长期以来,我们的策(cè)略是构建并开放源代码通用基础设施,同时保 留我(wǒ)们的(de)具体(tǐ)产品实现为(wèi)专有技术。”

他认为,开源(yuán)带来了几个战略好处。首先(xiān),开源软(ruǎn)件通(tōng)常更加安全可靠,并且(qiě)因为社区的持续反馈(kuì)、审查和开发,更加高效。其(qí)次,开源(yuán)软件经常成(chéng)为行业标准,“当企(qǐ)业开始基于(yú)我们的技术栈建立标准时,这使得将创新融入我们的产品变得(dé)更加(jiā)容易。这种微妙的优势,能够迅速学习和改进,是巨大(dà)的竞争优势(shì),而成为(wèi)行业标准正(zhèng)是这一能力的关键(jiàn)”。第三,开源在开发者和研究人员(yuán)中极受欢迎。

开源与闭源并不矛盾

开源还(hái)是闭源,也许是全球人工智能信徒长(zhǎng)久的(de)辩题(tí)。在Llama 3诞生前几天,国(guó)内同样在进行一场“辩论”。

4月11日,百度董(dǒng)事长兼首席执行官李彦宏在其内部讲话中直言(yán),大(dà)模型(xíng)开源的意义不大,闭源模型在能(néng)力上会持续领先,而不是一(yī)时领先,做模型的创业公司既做模型又做(zuò)应用的“双轮 驱动(dòng)”不是一个好的模式。在一周后的Create 2024百度(dù)AI开发者大会(huì)上,李彦宏(hóng)再度提到,大家以前 用开源(yuán)觉得(dé)开源(yuán)便宜,其实 在大模型场景下,开源是最贵的,所以开源模型会越来(lái)越落后。

360公司(sī)创始人周鸿祎则(zé)持不同(tóng)的观点(diǎn)。他表示:“网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好。一(yī)句话,今天没有开源就没有Linux(操作系统(tǒng)内核),没有Linux就(jiù)没(méi)有互联网(wǎng),就连说这话的公司(sī)自己都借(jiè)助了开源的力量才成长到今天(tiān)。”

这段发言被解(jiě)读为对李彦宏观点的回怼,周鸿祎随后澄清道:“我一直是(shì)开源的信徒,但是(shì)我说开源(yuán)好,是(4月)13日在哈佛(fú)讲的,李厂长(指李(lǐ)彦宏)说闭源好,是(4月)16日在北(běi)京讲的。”

生数科技联合(hé)创始人兼CEO唐家渝站在闭源的一边。在4月18日(rì)举行(xíng)的“2024中国生 成(chéng)式AI大会”上,唐家渝表示:“在我们看来,开源、闭源都有各(gè)自可以做的商业生态,但是从模型能力的提升来说,或者持续走到(dào)前列来说,闭源(yuán)还是会走到开源的(de)前面。”

昆仑万维(wéi)董事长方汉的(de)观点是(shì),开源模(mó)型与闭源模型之间(jiān)的(de)差距正在(zài)不断缩小。4月16日,方汉在接受《每日经(jīng)济新(xīn)闻》记者在内(nèi)的媒体采访时(shí)表示,闭源模型的确(què)是(shì)第一,但是(shì)开源大模(mó)型在2023年到今年这一年间,从落后两年以上,已经进(jìn)化到落后4~6个月(yuè)以上。

此外,方(fāng)汉(hàn)认为,在应用侧,闭源对于产品(pǐn)特性和长尾需求的满足都落(luò)后于开源大模(mó)型,开源大模型(xíng)是一种生(shēng)态构建器,更利于满足用户的长尾需求。开源大模型和闭源大模型是一(yī)个生态的组成部分,不是谁压(yā)倒谁,大家都(dōu)有自己的生(shēng)存空间,也(yě)都有更好的明天(tiān)。

不过 ,从商业化上来讲,闭源和开源也许并不矛盾。启(qǐ)明(míng)创(chuàng)投合伙人周志峰就认为,开源闭源在(zài)过去几个(gè)大(dà)浪潮当中没有很大的冲突,不太理解为什(shén)么很多人(rén)把闭(bì)源、开(kāi)源(yuán)在(zài)AI时代看成对立的。

李明顺的观(guān)点(diǎn)则是,在当前强应用导向的背景下,开源模式具有显著优势,能够吸引全球范围内最(zuì)广泛的人(rén)参(cān)与,从而(ér)使其创新性保持在较高(gāo)水平。

相较之(zhī)下,尽管一些闭源大模型在技术上(shàng)具有领先地位 ,但其成本太高。不过他也强调,开源与闭(bì)源在不同公司和应用场景中可以相互转 换。一(yī)些(xiē)基(jī)于(yú)开源的产品(pǐn)在发掘到独特优势后,可能(néng)会通过闭源策略建立(lì)竞争壁垒。同(tóng)时,一些闭源公司 也会不断(duàn)将其部分产品开源。这(zhè)两个应该(gāi)是(shì)共存的,未来开(kāi)源可能用户量(liàng)级上更(gèng)大,但是行业内,商业化做得比较好的公司,往往(wǎng)还是闭源的多一点。

在开源与闭(bì)源的辩论(lùn)中,也许(xǔ)答案并非非此即彼。AI的 未来可能既(jì)不是完全开放(fàng)的“自由港(gǎng)”,也(yě)不是彻底封闭的“孤岛(dǎo)”,而是一(yī)个(gè)既包含开(kāi)放协(xié)作也包含封闭(bì)竞争的混合生态。在这个(gè)生态系统中,开放与封闭不是 Meta继续押宝开源大模型 Llama 3拿下“赛点”?对(duì)立的两极,而是一枚硬币的两面。

未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?

评论

5+2=