橘子百科-橘子都知道橘子百科-橘子都知道

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开(kāi)源与闭源之(zhī)争延(yán)续到大模型时代。在寻找“新(xīn)大陆”的路上(shàng),开源与闭源的辩论,就(jiù)像(xiàng)是一场关于AI未来的“航海策略”讨(tǎo)论。

开源一派(pài)认(rèn)为,开源(yuán)能够(gòu)促进全球科研人员和(hé)开发者的协作,加(jiā)速AI技术的迭代与创(chuàng)新。同时,开(kāi)源让(ràng)更多人参与到模型的改进和优化中,通过集体智慧解决复(fù)杂(zá)的技术难题。

闭源的倡导者则看重其在商业化、技术(shù)保护和产品差异化方面的优势。闭源模型(xíng)使得企业能够控制产(chǎn)品(pǐn)的开发节奏(zòu)和市场策略,保护其商业利益。此外,闭源也有(yǒu)助于企(qǐ)业维护其技术优势,避免竞 争对(duì)手模仿或超越。

Llama 3的发布让开源大模型在与闭源的竞争中再度“扳回 一(yī)城”。从(cóng)测试结果来看,Llama 3的成绩大幅(fú)超越了Llama 2,也胜过了GPT-3.5。

在AI这场没有硝(xiāo)烟的“航海竞赛(sài)”中,大(dà)模型已(yǐ)然成为眼前的灯塔。未知的(de)是,这座灯塔究竟是向所有航(háng)海者开放其光芒,还是(shì)仅(jǐn)为特定的船只照亮前行的航道。

开源(yuán)在开发者(zhě)和(hé)研究人员中(zhōng)极受欢迎

Meta正沿着开源路径继续前进(jìn)。

近日,Meta推出开源大模型Llama 3系列,发布8B和70B两个版 本。Meta创(chuàng)始人兼首席(xí)执行官扎克伯格(gé)在同一天宣布(bù),基于Llama 3,Meta的AI助手现在已(yǐ)经覆(fù)盖 Instagram、WhatsApp、Facebook等(děng)全系应用,并单独开启了网站。

与(yǔ)Llama 2相比(bǐ),Llama 3进行(xíng)了(le)几项关键的改(gǎi)进(jìn):使用具128K token(输入(rù)数据(jù)的最小单(dān)元)词汇表的(de)tokenizer(编译器),可以更有效地(dì)编码语言,从而显著提升模型性能(néng);在8B和70B模型中都采用分组查询 注意力(GQA),以提高Llama 3模型的(de)推(tuī)理效率;在 8192个(gè)token的序列上训练模型,使用掩码来(lái)确保自注意力 (Self-Attention)不会跨(kuà)越文(wén)档边界。

据Meta介绍,Llama 3已经(jīng)在多种行业基准测(cè)试上展现了最先(xiān)进的性能(néng),提供了包括改进的推理能力在内的新功能,是目前市场上最好的(de)开(kāi)源(yuán)大(dà)模型。

此外,Llama 3发布后(hòu),微软Azure、谷歌云(yún)、百度智能(néng)云等陆续(xù)宣布其平台上线Llama 3。百度(dù)方面此前对《每日(rì)经(jīng)济新闻》记者(zhě)表(biǎo)示,百度智能云(yún)千帆大模型平台(tái)在(zài)国内首家(jiā)推出针(zhēn)对Llama 3全系列版本的(de)训练推理方案,便于开发者进行再训练,搭建专属大(dà)模型。

工业和信息化部工业文化发展中心(xīn)AI应用工作组执行组长(zhǎng)、行行AI董事长李明顺在接受《每日经济新闻(wén)》记者采(cǎi)访时表示,Meta的Llama 3发布可能会带来更多(duō)AI应用落地机会和场景,它通过(guò)提供更(gèng)大词汇量的Token词典、更长的(de)输入上(shàng)下文长度以及优化的模型结构,增强了模 型的编码效率和(hé)推(tuī)理(lǐ)效率。“现在,比起Llama 2,Llama 3在代码能力(lì)和逻(luó)辑推理能(néng)力上有显著提(tí)升,这可能会促进(jìn)相(xiāng)关AI应用的性能(néng)(提升),尤其是在需要复(fù)杂(zá)逻辑和代码理解的场景中去落地。”

OpenAI在GPT-2之后调转船(chuán)头走(zǒu)向闭源,Meta则成为 开源界的引领者之一。

从 2020年(nián)发布GPT-3,到引发轰动(dòng)的GPT-3.5,以及2023年3月发布的GPT-4,都(dōu)是闭源模(mó)型。此前,马斯克起诉OpenAI时曾直言:“如果OpenAI改名为ClosedAI,我就撤销诉(sù)讼。”

李明顺认为,OpenAI的转变(biàn)可能与其商业战略(lüè)和市场定位有(yǒu)关。“初期开源有助于快速吸引关注和社区参与,但随着公司的发(fā)展,我估计阿尔特曼(Sam Altman)的野心和(hé)商业梦想越来越膨胀了,闭源可以更好地让它(tā)融资,包括和微软合作,保护领先的(de)技术优势。”他表示,从OpenAI的转变中可以看出,开源与闭源的选择并非固定不变,而是需要根据公司战略目(mù)标、市(shì)场(chǎng)环境和产品发展阶段灵活调整。天下 没什(shén)么事情是(shì)绝对的(de),很多开源(yuán)公司也是拿着次优代码开源,独(dú)家秘方闭源。

在追逐AGI(通用人工智(zhì)能)这颗明珠的道路上,迄今为止,Meta依旧持续沿着开源的路径前行。

2024年初,扎(zhā)克(kè)伯格在(zài)Meta第四季度及2023全年财报电话会议(yì)上(shàng)表示(shì):“长期(qī)以来,我们的策略是构建并开放源(yuán)代码通用基础设施(shī),同时保留我(wǒ)们的(de)具体产品实(shíMeta继续押宝开源大模型 Llama 3拿下“赛点”?)现(xiàn)为专有(yǒu)技术。”

他认为,开源带来了几个(gè)战略好处。首先(xiān),开源软件(jiàn)通常更加安全可靠,并且因为社区的持(chí)续反(fǎn)馈、审查和开发,更加高效。其次(cì),开源软件经常成为行业标准,“当企(qǐ)业(yè)开始基于我们的技术(shù)栈建立标准时,这使得将创新融(róng)入我们的产品变得(dé)更加容易。这种微妙的优势,能够迅速学 习和(hé)改进,是(shì)巨大的竞争优势,而成为行业标准正(zhèng)是这一能力的关(guān)键(jiàn)”。第三,开(kāi)源在开发(fā)者和研究(jiū)人(rén)员中极受欢(huān)迎。

开源与闭源(yuán)并不矛盾(dùn)

开源(yuán)还是闭源(yuán),也许是全球(qiú)人(rén)工智(zhì)能信徒长久的(de)辩题。在Llama 3诞生前(qián)几天,国(guó)内(nèi)同样在 进行一场“辩论”。

4月11日,百度(dù)董事长兼首席执行官李彦 宏在其内部讲话中直言,大模型开(kāi)源的意义不大,闭源模型在能(néng)力上会持续领先,而(ér)不是一时领先,做模型的创 业公司(sī)既做模型又做应用的“双轮(lún)驱动”不(bù)是一个好的模式。在一周后的Create 2024百度AI开发者大会上,李彦宏再度提到,大家以前用开 源觉得开源 便宜,其实在大模型场景下,开源是最贵(guì)的,所以(yǐ)开源模型会(huì)越来越落后。

360公司(sī)创始人周鸿祎 则持不同的观点。他(tā)表(biǎo)示:“网上有些名人胡(hú)说八道,大家也别被他们忽悠,说开源不如闭源(yuán)好。一句(jù)话,今天没有开源就没有Linux(操作系(xì)统内核),没(méi)有Linux就没有互联网 ,就连说这话的公司自己都借助(zhù)了开源的力量才成长(zhǎng)到今天。”

这(zhè)段发言被解读 为(wèi)对李彦宏观点的回怼,周鸿祎随后澄清道:“我一直是开(kāi)源的信徒,但是我说开源好(hǎo),是(4月)13日在哈佛讲的,李(lǐ)厂长(zhǎng)(指李彦宏(hóng))说闭源好(hǎo),是Meta继续押宝开源大模型 Llama 3拿下“赛点”?(4月)16日在北京讲的(de)。”

生数科(kē)技联合创始人兼CEO唐家渝(yú)站在闭(bì)源的一边。在4月18日举 行(xíng)的“2024中国生成式AI大会”上,唐(táng)家渝表示:“在我们看来,开源、闭(bì)源都有各自(zì)可以做的商业生态,但是从模 型能力的提(tí)升来说,或者持续走到 前列来说,闭源还是会走到开源的前面。”

昆仑万维董事长方汉的观点是,开源模型与闭源模(mó)型之间(jiān)的差距 正在不断缩小。4月16日,方汉在接受(shòu)《每日经济新闻》记者在内的媒(méi)体采访时表示,闭源模(mó)型的确是第一,但是开源大模(mó)型在2023年(nián)到今年这(zhè)一(yī)年间,从落后两年以上,已 经(jīng)进化到落后4~6个月以上。

此外(wài),方汉认为,在应用侧,闭源对于产品特 性(xìng)和(hé)长尾需求的满(mǎn)足(zú)都(dōu)落后于开源大(dà)模型,开源(yuán)大模(mó)型是一种生态构建器,更利(lì)于满足用户的长尾需求。开源(yuán)大模型和(hé)闭源大模型是一个生态的组成部分,不是(shì)谁(shuí)压倒谁,大家都有自己的生存空间,也都 有更好的明天。

不(bù)过,从商业化上(shàng)来讲,闭源和(hé)开源也许并不矛盾。启明创(chuàng)投合(hé)伙人周志峰就认为,开源闭源在过去(qù)几个大浪潮当(dāng)中没有很(hěn)大的冲突,不太理解(jiě)为什么很多人把闭源、开(kāi)源(yuán)在AI时代(dài)看成对立的。

李明顺(shùn)的观点则是,在当前强应用导向的背景下,开源模式具有显著优势,能够吸引全球范 围内最(zuì)广泛的人参与,从而使其创新性保持在较高水平(píng)。

相较之下,尽管一些闭源大模型在技术上具有领先地位(wèi),但其成本太高(gāo)。不过他也强调,开(kāi)源与闭源在不同公司和应用场景中可以相(xiāng)互转(zhuǎn)换。一(yī)些基于开源的产品在发掘到独特优势后,可能会通(tōng)过闭源策略建立竞争壁垒。同时,一些(xiē)闭源公司也会不(bù)断(duàn)将其部分产(chǎn)品开源。这两个(gè)应该 是共存的,未来开源可能(néng)用户量级上更大,但是行业内,商业化做(zuò)得比较好的公司,往往还是闭源的多一点。

在开(kāi)源与闭源的辩论(lùn)中,也许答案并非非此即彼。AI的未来可能既不是完全开(kāi)放的“自由港”,也不是彻 底(dǐ)封闭的“孤岛”,而是一个既包含开放协(xié)作也包含封闭竞争的混 合生(shēng)态。在(zài)这个生态系统中,开放与封闭(bì)不是对立的两极(jí),而是一枚硬币的两面。

未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?

评论

5+2=