Meta继续押宝开源大模型 Llama 3拿下“赛点”?
开源与闭(bì)源之争(zhēng)延续(xù)到(dào)大模型时代。在寻找“新大陆”的路上,开源与闭源的辩论,就像是一场关于AI未来的“航海策略”讨(tǎo)论。
开源一派认为,开源能(néng)够促进全球科(kē)研人(rén)员和开发者的协(xié)作,加速AI技术的迭代(dài)与(yǔ)创新。同时,开(kāi)源让(ràng)更多(duō)人参与到(dào)模型的改进和(hé)优化(huà)中,通过集体智慧解决复杂的技术(shù)难题。
闭源的(de)倡导者则看重其在商业化、技术(shù)保护和产(chǎn)品差(chà)异化方(fāng)面的优势。闭源模型使得企业(yè)能够控制产品的开发(fā)节奏和(hé)市场策略,保(bǎo)护(hù)其商业利益(yì)。此外,闭源也有助(zhù)于企业维护其技术优势,避免竞争对手模仿或超越。
Llama 3的发布让开(kāi)源大(dà)模型在与闭源的竞争中再度“扳回一城”。从测试(shì)结(jié)果来看,Llama 3的成绩大幅超越 了Llama 2,也(yě)胜过了(le)GPT-3.5。
在AI这场没(méi)有硝烟的(de)“航(háng)海竞赛”中,大(dà)模型已然成为眼前的灯塔。未知(zhī)的是,这座灯(dēng)塔究竟是(shì)向所有航海者开放其光芒,还是仅(jǐn)为特定(dìng)的船只照亮前行的航道。
开源在开发者和研究人员中极受欢迎
Meta正沿着(zhe)开源路 径继续(xù)前进。
近(jìn)日,Meta推出(chū)开源大模型Llama 3系列,发布8B和70B两个版本。Meta创始人兼首(shǒu)席执行官扎克 伯格在同一天宣布,基于Llama 3,Meta的AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单独开启了网站。
与Llama 2相(xiāng)比,Llama 3进行了几项关键(jiàn)的改进:使用具128K token(输入数据(jù)的最小单元)词汇表(biǎo)的tokenizer(编译器),可(kě)以更有(yǒu)效地编码语言,从而显著提升模型性(xìng)能;在8B和70B模(mó)型中都采用分组(zǔ)查询注意力(GQA),以提高Llama 3模型的推理效率;在8192个token的序列上训练模型,使用掩码来确保自注意力(Self-Attention)不会跨越文档边界。
据(jù)Meta介绍(shào),Llama 3已经在多种行业基准测试上展现了最先进的性能(néng),提供了包括 改进的推理能力在内的(de)新功能,是目前市场(chǎng)上最好的开源(yuán)大模型。
此外,Llama 3发布后,微软Azure、谷歌云、百度智能云等陆续(xù)宣布其平台(tái)上(shàng)线Llama 3。百度方面(miàn)此前对《每日经济新闻》记者表示,百度智能云千帆大 模型平台在国内首(shǒu)家推(tuī)出针对Llama 3全系列版(bǎn)本的训练推理方案,便于开发者进行再训练,搭建专属大(dà)模型。
工业和(hé)信息化部工业文化(huà)发(fā)展中心AI应用工作组执行组长、行行AI董事长(zhǎng)李明顺在(zài)接受《每日经济新闻》记者采访时表示,Meta的Llama 3发布可能会带来更多AI应用落地机会和场景,它(tā)通过提供更大词汇量 的Token词(cMeta继续押宝开源大模型 Llama 3拿下“赛点”?í)典、更长的输(shū)入上下文长度(dù)以及优化的模(mó)型结(jié)构(gòu),增强了模型的编码(mǎ)效率和推理(lǐ)效率。“现在,比起Llama 2,Llama 3在代码能力和(hé)逻辑推理能力上有显著提升,这可(kě)能会促进相关AI应用的性能(提(tí)升 ),尤其是在需要复杂逻辑和代码理解的场景中去落地。”
OpenAI在GPT-2之后调转船头(tóu)走向闭源,Meta则(zé)成(cMeta继续押宝开源大模型 Llama 3拿下“赛点”?héng)为开(kāi)源界的引领者之一。
从2020年发布(bù)GPT-3,到引发轰动的GPT-3.5,以及2023年3月发 布的GPT-4,都是闭(bì)源模型。此前,马斯克起诉OpenAI时曾直言:“如果OpenAI改名为ClosedAI,我就撤销诉讼。”
李明顺认(rèn)为,OpenAI的转变可能与其(qí)商业战(zhàn)略和市场定位有关。“初期开源(yuán)有助(zhù)于快速吸引关注和社(shè)区(qū)参与,但随(suí)着公司的发展,我估计阿尔特曼(Sam Altman)的野心和商业梦想越来越膨胀了,闭源可以更好地让它融资,包括和微软合作,保护领先的技术优势(shì)。”他表示,从OpenAI的转变中可以看出,开源与闭源的选择(zé)并非固定不变,而(ér)是需要根据公司战略目标、市场(chǎng)环境和产(chǎn)品发展阶段(duàn)灵活调整(zhěng)。天下没什么事(shì)情是绝对的,很多开(kāi)源公(gōng)司也是拿着次优代码开源,独家秘方闭(bì)源(yuán)。
在追逐AGI(通用人工智能)这颗明珠(zhū)的道路上,迄今为止,Meta依旧持续沿着开源的路径前行。
2024年初,扎克伯(bó)格在(zài)Meta第四(sì)季度及2023全年财(cái)报电话会议(yì)上表(biǎo)示:“长期以来,我(wǒ)们(men)的策略是构建并开放源代(dài)码通用基础(chǔ)设施,同时保留我(wǒ)们的具体产(chǎn)品实(shí)现为专有技术。”
他(tā)认为,开源(yuán)带来了几个战略好处(chù)。首(shǒu)先,开(kāi)源软件通(tōng)常更加安(ān)全可靠(kào),并且因为(wèi)社区(qū)的持续反(fǎn)馈、审查和开发,更加(jiā)高效。其次,开源软件经(jīng)常成(chéng)为行业标准,“当企业开始基于我们的技术栈建立(lì)标准时,这使得将创新融入我们的产品变得更(gèng)加容易。这种微妙的优势,能够迅速(sù)学习和改进,是巨大的竞争优势,而成(chéng)为行业标(biāo)准正(zhèng)是这一能力的关(guān)键”。第三,开(kāi)源在开发者和研究人员中极(jí)受欢迎。
开(kāi)源与闭源并不矛盾
开源还是闭源,也(yě)许是全球人工智能信徒长久的辩题。在Llama 3诞生前(qián)几(jǐ)天(tiān),国(guó)内同样在进行一(yī)场“辩论”。
4月11日,百度董事长兼首席执行官李(lǐ)彦宏在其内部讲话中直言,大模型(xíng)开(kāi)源的意义不大,闭(bì)源(yuán)模型在能(néng)力上会持续领先,而不是一时领先,做模(mó)型的创(chuàng)业公司既(jì)做模型又做应用的“双轮(lún)驱动”不是一个好的 模(mó)式(shì)。在一周后的Create 2024百度AI开发者大会上,李彦宏再度提到,大家以前用开源(yuán)觉得开源便宜,其实在大模型场景下,开源是最贵的,所(suǒ)以开源模型会越来越落后(hòu)。
360公(gōng)司创始人周鸿祎则持(chí)不同(tóng)的观(guān)点。他(tā)表示:“网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好。一句话,今天没(méi)有开(kāi)源(yuán)就没有Linux(操作系统内核),没有Linux就没有互(hù)联网,就(jiù)连说这话的公司自己都借助了开源(yuán)的力量才成长到(dào)今天。”
这段发言(yán)被解读为对李彦(yàn)宏观点的回怼,周鸿祎随后澄清道(dào):“我一直 是(shì)开(kāi)源的信徒,但是我说开源好,是(4月(yuè))13日在哈佛讲的,李厂长(指李彦宏)说闭源(yuán)好,是(4月)16日在北京讲的。”
生(shēng)数科技联合创始人兼CEO唐家渝站(zhàn)在闭源(yuán)的(de)一边。在4月18日举行的“2024中国生成(chéng)式AI大会”上(shàng),唐(táng)家渝表示:“在我们(men)看来,开源、闭源都有(yǒu)各自可以做的商业生态,但是(shì)从模型能力的提(tí)升来说,或者持续(xù)走到前列(liè)来说,闭源还是会走(zǒu)到开源的前面。”
昆仑万维董(dǒng)事长方汉的观点(diǎn)是,开源模型与闭源模 型之间的差距正在(zài)不断缩小。4月16日,方汉(hàn)在接(jiē)受《每日(rì)经济新闻》记者在内的媒体采访时表示,闭源模(mó)型的确是第一,但是开源大模型在2023年到今年这一年间,从落后两年以(yǐ)上,已经进化到(dào)落后4~6个(gè)月以上。
此外,方汉认为(wèi),在应用侧,闭源对于产品特性和长尾需求的(de)满足都落后于开源大模型,开源大模型是一(yī)种(zhǒng)生(shēng)态构建器(qì),更利于满足用户(hù)的长尾需求。开源大模型和闭源大模型是一个生态(tài)的(de)组成部(bù)分,不是谁压倒Meta继续押宝开源大模型 Llama 3拿下“赛点”?谁,大家都有自己(jǐ)的生存空间,也都有(yǒu)更好的明(míng)天。
不过,从商业(yè)化上来讲,闭源和开源也许并不矛(máo)盾。启明创投合伙人周志(zhì)峰就认(rèn)为,开源闭源在过去几个大浪潮当中没有很大的冲突,不太理解(jiě)为什(shén)么很多人把闭源、开源在AI时代看成对(duì)立的。
李(lǐ)明顺的观点则是,在当前强应用导(dǎo)向的背景下,开源(yuán)模式具(jù)有显著优势,能够吸引全球范围(wéi)内最广泛的人参与,从而使其创新性(xìng)保持在较高水平。
相较之下 ,尽管(guǎn)一些闭源大模型在(zài)技术上具有领先(xiān)地位,但其成本太高。不(bù)过他也强调,开源与闭源(yuán)在不同(tóng)公司(sī)和应用场景中(zhōng)可以相互转换。一(yī)些基于开源的产品 在发掘到独特优势后(hòu),可能会通过闭源策略建立竞争壁垒。同时,一些闭(bì)源(yuán)公司也会不断将(jiāng)其部分产(chǎn)品开源。这两个应(yīng)该是共存的,未来开源可能用户量级上更(gèng)大,但是行(xíng)业内(nèi),商业化(huà)做得比较(jiào)好的(de)公司,往往还是闭源的多一点。
在开(kāi)源与闭源的辩(biàn)论中,也许答案并非非此即彼。AI的未来可能既不是完(wán)全开放的“自由港”,也不是彻底封闭的(de)“孤岛”,而(ér)是一个既包含开(kāi)放协作也(yě)包含封闭竞争的混合生态。在这个生态系统中,开放与封闭不是(shì)对立的两极(jí),而是一枚(méi)硬(yìng)币的两面。
未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了