Meta继续押宝开源大模型 Llama 3拿下“赛点”?
开(kāi)源与闭源之争延续到(dào)大模型时代。在寻找“新大(dà)陆”的路上,开源与闭源的辩论,就像是一场关于AI未(wèi)来的“航(háng)海策略”讨论(lùn)。
开源一派认为,开源能够(gòu)促进全(quán)球(qiú)科研人员和开发者的协作,加(jiā)速AI技术的迭代与创新。同时(shí),开源让更多人参与(yǔ)到模(mó)型的改进(jìn)和优 化中,通过集体智慧解决复杂的技术难题(tí)。
闭(bì)源的倡导(dǎo)者则看重其在(zài)商业化、技术保护和产品差异化方面的(de)优势(shì)。闭源模型使得企业能够控(kòng)制产(chǎn)品的开发节奏和市场策略,保护其商业利益。此外,闭源也(yě)有助于(yú)企(qǐ)业维护其技术优势,避(bì)免竞争对(duì)手模仿或超越。
Llama 3的发(fā)布让开源大模型在与(yǔ)闭源的竞争中再度“扳回一城”。从测试结(jié)果来看,Llama 3的成绩(jì)大幅超越了Llama 2,也胜(shèng)过(guò)了GPT-3.5。
在AI这场没有硝烟的“航(háng)海竞赛”中(zhōng),大模型已然成为眼前的灯塔。未知的是,这座灯塔究竟是向所有航海者开放其光芒,还是仅为特定的船只照亮前行的航道。
开源在开发者和研究人员(yuán)中极受欢迎
Meta正沿着开源路(lù)径继续前进。
近日,Meta推(tuī)出开源大模型Llama 3系列,发布(bù)8B和70B两个版本。Meta创始人兼首席执(zhí)行(xíng)官扎克伯格在同一天宣布(bù),基于(yú)Llama 3,Meta的AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系(xì)应(yīng)用,并单独开启(qǐ)了(le)网站。
与Llama 2相比(bǐ),Llama 3进行了几项关键(jiàn)的(de)改进:使用具128K token(输入数据的最小单元)词汇(huì)表的tokenizer(编译器),可以更 有效地编码语言,从而显著提(tí)升模型性能;在8B和70B模型中都采用分组查询注(zhù)意力(GQA),以提高Llama 3模型的推理效率;在8192个token的序列上训练模型,使用掩码来确保自注意力(Self-Attention)不会跨(kuà)越文档边界。
据Meta介(jiè)绍,Llama 3已经在多种行业基准测试上展现(xiàn)了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前(qián)市场上最好的开源(yuán)大模型。
此外,Llama 3发(fā)布后,微软Azure、谷歌云、百(bǎi)度智能云等陆续宣布其平台上线(xiàn)Llama 3。百度方面此前对(duì)《每日经济新闻(wén)》记(jì)者表示,百度智能云千帆大模型(xíng)平(píng)台在国内(nèi)首家推出针对Llama 3全系列版本的训练推理方(fāng)案,便于开发(fā)者进(jìn)行再训练(liàn),搭建专属大模型。
工业和信息化部工业文化发展中心AI应用(yòng)工作组执行组长、行行AI董事长(zhǎng)李明顺在接受《每(měi)日(rì)经济新闻》记者采访时表示,Meta的Llama 3发布可能会带来更多AI应用(yòng)落地机会(huì)和场景,它通过提供更(gèng)大词(cí)汇量的Token词典(diǎn)、更长的(de)输入上下文长度以及优(yōu)化的模型结构,增强了(le)模型的编码效率和推理效率(lǜ)。“现在,比起(qǐ)Llama 2,Llama 3在代码能(néng)力和(hé)逻辑推理能(néng)力上有(yǒu)显(xiǎn)著提升,这(zhè)可能会促进相关(guān)AI应(yīng)用的性能(提升),尤其(qí)是在需要复杂逻辑和代码理解的场景中去落地。”
OpenAI在GPT-2之后调转船头走向闭源,Meta则成为开源界(jiè)的引领者之一。
从(cóng)2020年发布GPT-3,到引发轰动的GPT-3.5,以及2023年3月发布的GPT-4,都是闭源模型。此前,马斯克起诉OpenAI时曾直(zhí)言(yán):“如果OpenAI改名(míng)为ClosedAI,我就撤销诉讼。”
李明顺认为,OpenAI的转变(biàn)可能与其商业战略和市场定位有关。“初期开源(yuáMeta继续押宝开源大模型 Llama 3拿下“赛点”?n)有助于快速吸引关注和社区参(cān)与,但随着公司的发展,我估计阿 尔特曼(Sam Altman)的野心和商业梦想越来(lái)越(yuè)膨(péng)胀了,闭源可以更好地让(ràng)它融资(zī),包括和(hé)微(wēi)软合作,保护领先的技术优势。”他表示,从OpenAI的转变中可以看出,开源与闭源的选择Meta继续押宝开源大模型 Llama 3拿下“赛点”?(zé)并非固定不变,而是需要(yào)根据公司战略目标、市场环境和产品发展阶(jiē)段灵活调整。天下没什么事情是绝对的,很多开源公司也(yě)是拿着(zhe)次优代码(mǎ)开源,独家秘(mì)方闭源。
在追逐AGI(通用人工智能)这颗(kē)明珠的道路上,迄今为止,Meta依旧持续沿着开源的路径前行。
2024年初,扎克伯格在Meta第四季度及2023全年财(cái)报电话(huà)会议上表示:“长期以(yǐ)来,我们(men)的策略是构建并开放源代码通(tōng)用基础设施,同时保留我们(men)的具体产品实现为专有技(jì)术。”
他认为,开源带来了几个战略好处。首先,开(kāi)源软件通常更加安全(quán)可靠,并且因为社区的持续反(fǎn)馈(kuì)、审查和开(kāi)发,更加(jiā)高效。其次,开源软件经常成(chéng)为行(xíng)业标准,“当企业开始基于我们的技术栈建立标(biāo)准时,这使得将创(chuàng)新融入(rù)我们的产品变得更加容易。这(zhè)种微妙的优势,能(néng)够迅速学习(xí)和改(gǎi)进,是巨大的竞争优(yōu)势,而成为(wèi)行业标准正(zhèng)是这一能力的关键”。第三(sān),开源在开发(fā)者和研究人员(yuán)中极受欢迎。
开源与闭源并不(bù)矛盾
开源还是闭源(yuán),也许是全球人工智能信徒长久的(de)辩(biàn)题。在Llama 3诞生前几天,国(guó)内同样在进行一场“辩论”。
4月11日,百度董事长兼首(shǒu)席执行官李彦宏在其内部讲话中直(zhí)言(yán),大模(mó)型开源的意义不大,闭源模型在能力上会持续领(lǐng)先(xiān),而不是一时领先(xiān),做(zuò)模型的(de)创业公司(sī)既做模型又做应(yīng)用的“双轮驱动”不是一个好的模(mó)式。在一(yī)周(zhōu)后(hòu)的Create 2024百度AI开(kāi)发者大会上(shàng),李彦宏(hóng)再度(dù)提(tí)到,大家(jiā)以前用开源觉得开源便宜,其实(shí)在大模型(xíng)场景下 ,开源是最贵的,所以开源模型会越来越落后。
360公(gōng)司创始人周鸿祎则(zé)持(chí)不同的观点。他(tā)表示:“网上有些名人胡说八道(dào),大家也别被他们忽悠,说(shuō)开源不如(rú)闭源好。一句话(huà),今天没(méi)有开源就没有Linux(操作系统内核),没有Linux就(jiù)没有互联网,就连说这话的公司自己都借助了开(kāi)源的力量才成长到今天。”
这段发言被解读为对李彦宏(hóng)观点的回怼,周鸿(hóng)祎随后澄清道(dào):“我一直是开源的信徒,但是(shì)我说开源好,是(4月)13日在哈佛讲的,李厂长(指李彦宏)说闭源好,是(4月)16日在北京讲的(de)。”
生数科技联合创始(shǐ)人兼CEO唐(táng)家渝站在闭(bì)源的一边。在4月(yuè)18日举行(xíng)的“2024中国生成式AI大会”上,唐家(jiā)渝表示:“在我们看来,开源、闭源都有各自可以做的(de)商业生态,但是从模型能力的提升来说,或者 持续走到前列来说,闭源还是会走到开源的前面。”
昆仑(lún)万(wàn)维董事(shì)长(zhǎng)方汉的(de)观点是(shì),开源模型与闭源模(mó)型之间的差(chà)距正在(zài)不断缩小。4月16日,方汉在接受《每日经济新闻》记者在(zài)内的媒体采访时表示,闭源模型的确是第一,但是开源大模型(xíng)在2023年到(dào)今年(nián)这一年间,从落后两年以上,已经进化到落后4~6个月以上。
此外,方(fāng)汉认为,在应用侧,闭源对于产品特性和长尾需求的满足都落后于开源大模(mó)型,开源(yuán)大(dà)模型是一(yī)种生态构(gòu)建器,更(gèng)利于满足用户的长尾需求。开源大模型和闭源大模(mó)型是一个生(shēng)态的组成(chéng)部(bù)分,不是谁压倒(dào)谁,大家都有自己的生存空间,也(yě)都有更好的明天。
不过,从商业化上(shàng)来讲,闭源和开源也许并不矛(máo)盾。启明创投合伙人周志峰就认为,开源闭源在过去几个大浪潮当中没有很大(dà)的冲突,不太 理解(jiě)为什么很多人把(bǎ)闭源、开源在AI时代看成对立的(de)。
李明顺的(de)观点则是,在(zài)当前(qián)强应用导向的背景下,开源模(mó)式具有显著优势,能够吸引全球范围内最广泛的人参与,从而使其创新性(xìng)保持在(zài)较高水(shuǐ)平。
相较(jiào)之(zhī)下(xià),尽(jǐn)管一些闭源(yuán)大模型(xíng)在技术(shù)上具(jù)有领先地位,但其成(chéng)本太高。不过他也强(qiáng)调,开源与闭源在不同公司(sī)和应用场景中可以相互转换。一些基于开源的产(chǎn)品在发掘到独特(tè)优势后,可(kě)能会通过闭源策略建立竞(jìng)争(zhēng)壁垒。同时,一些闭源公司也会不断将其部分产品开源。这两个应该是共存的,未来开源可能用(yòng)户量级上更(gèng)大,但是行业内,商业化做得比较好的(de)公司,往往还(hái)是闭源的多一点。
在开源与闭源的辩(biàn)论中,也许(xǔ)答案并(bìng)非非此(cǐ)即彼(bǐ)。AI的未来可(kě)能既不(bù)是完全开放的“自由港”,也不是彻底封闭(bì)的“孤岛”,而是一个既(jì)包含开放(fàng)协作也包含封闭竞争的混合生态。在这个(gè)生态系(xì)统中,开放与封 闭(bì)不是对(duì)立的两(liǎng)极,而是(shì)一(yī)枚(méi)硬币的两面。
未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了