Meta继续押宝开源大模型 Llama 3拿下“赛点”?
开源与闭源之争(zhēng)延续到大模 型时代(dài)。在寻找“新大陆”的路(lù)上,开源与闭源的辩(biàn)论,就像是一场关于AI未(wèi)来(lái)的“航海策略”讨论。
开(kāi)源一派(pài)认为,开源能够(gòu)促进全(quán)球科研人(rén)员和开发者的协作,加速AI技术的迭代与创新(Meta继续押宝开源大模型 Llama 3拿下“赛点”?xīn)。同时,开源(yuán)让更多人参与到模型(xíng)的(de)改进和优化中,通过(guò)集(jí)体智慧解决复杂的技术难题 。
闭源的倡导者则看重其在商业化、技术保护和产品差异 化(huà)方面的优势。闭源模型 使得企业能够控制产品的开发节奏和市场策略,保护其商业利益。此(cǐ)外,闭源也有助于企业维护其技术优势,避(bì)免竞争对手模仿或超越。
Llama 3的发布让开源大模型在与闭源的竞争中再度“扳回一城(chéng)”。从测试(shì)结果来看,Llama 3的成绩大幅超越了Llama 2,也胜过了GPT-3.5。
在AI这场没有硝烟的“航海竞赛”中,大模型已然成为眼前的灯塔。未知的是,这座灯塔究竟是向所有(yǒu)航海(hǎi)者开放其光芒,还是仅为(wèi)特定的船只照亮前行的航(háng)道。
开源在开发者和研究人员中(zhōng)极受欢迎
Meta正沿着开源(yuán)路径继续前进。
近日,Meta推出开源大模型Llama 3系列,发(fā)布8B和70B两个版本。Meta创始人兼首(shǒu)席执行官扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手(shǒu)现(xiàn)在已经覆(fù)盖Instagram、WhatsApp、Facebook等全系应用,并单独开(kāi)启 了网站。
与Llama 2相比(bǐ),Llama 3进行了几项关键的改进(jìn):使用具128K token(输入数(shùMeta继续押宝开源大模型 Llama 3拿下“赛点”?)据的最小单元)词汇表的tokenizer(编译器),可以更有效地编码语言,从而显著(zhù)提升模型性能;在8B和70B模型(xíng)中都采用分组查询注意力(GQA),以提高Llama 3模型的推理效率;在8192个token的序(xù)列上训练(liàn)模型,使 用(yòng)掩码来确保自注意力(Self-Attention)不会跨越文档边界。
据Meta介绍,Llama 3已经在多种行业基准测试上展(zhǎn)现了最先进的性能,提供了包括改进的推理能力在内(nèi)的新功能,是目前市场上最(zuì)好的开源大(dà)模型。
此外,Llama 3发(fā)布后,微软(ruǎn)Azure、谷歌云、百度智能云等陆续宣布其平台(tái)上线Llama 3。百度方面此前 对《每日经(jīng)济新闻》记者(zhě)表示,百度(dù)智能云千帆大模型平台在国内首家推出针对Llama 3全系列版本的训练推理 方(fāng)案,便于开发(fā)者进行再训练,搭建专属(shǔ)大模型(xíng)。
工业和信息化部工业文化(huà)发展中心AI应用工作组(zǔ)执行组长、行行AI董事长(zhǎng)李明(míng)顺在接受《每日经济新闻》记者(zhě)采访时表示(shì),Meta的Llama 3发布(bù)可能会带来 更多(duō)AI应用落地机会和场景,它通过(guò)提(tí)供(gōng)更大(dà)词汇量的Token词(cí)典、更长的(de)输入(rù)上下文长度以及(jí)优化的模型结(jié)构,增强了模(mó)型的编(biān)码效率和推理效率。“现在,比起Llama 2,Llama 3在代码能力(lì)和逻辑推理能(néng)力上有显著提升,这可能(néng)会促进(jìn)相关AI应(yīng)用的性能(提升),尤其是(shì)在(zài)需要复杂逻辑和代码理解的场景中去落地。”
OpenAI在GPT-2之后(hòu)调转船头走向闭源(yuán),Meta则成为开源界的引领者之一。
从2020年发布GPT-3,到(dào)引发轰动的GPT-3.5,以及2023年3月发布的GPT-4,都是闭源模型。此前,马斯克起(qǐ)诉OpenAI时曾(céng)直言:“如果OpenAI改名为ClosedAI,我就撤销诉讼。”
李明顺认为,OpenAI的转变可能与其商业战略和市场定(dìng)位有关。“初期开源有助于快速(sù)吸引(yǐn)关注和社区(qū)参与(yǔ),但随着公司的(de)发(fā)展(zhǎn),我估计(jì)阿(ā)尔特曼(Sam Altman)的野心(xīn)和商业梦想越(yuè)来越膨(péng)胀了,闭源(yuán)可以更好地让它融资,包括和微软合作,保(bǎo)护(hù)领(lǐng)先的技术优势。”他表(biǎo)示(shì),从OpenAI的转变(biàn)中(zhōng)可以看出,开(kāi)源与闭源的选择并非固定不变,而是需要根据公司战略目标、市场环境和产品发展阶段灵活调整。天(tiān)下(xià)没什么事情是绝对的,很(hěn)多开源公司(sī)也是拿着次优代(dài)码开源,独(dú)家秘(mì)方闭源。
在追逐AGI(通用人工智能)这颗明珠的道路上 ,迄今为 止,Meta依旧持续沿(yán)着开源的路径前行。
2024年初,扎克伯格(gé)在Meta第 四(sì)季度及2023全(quán)年财报电话会议上表示:“长期以来,我们(men)的(de)策略是构建(jiàn)并开放源代码通(tōng)用基础设施,同时保留我们的具体产品实现(xiàn)为专有技术。”
他认为 ,开源带来了几个战略好处。首先,开源软件通常更加安(ān)全可靠,并且因为社区的持(chí)续反馈、审查和开发,更加高效。其(qí)次(cì),开源软件经常成为行业标准,“当企业开始基于我们的技术栈建立标准时,这(zhè)使得(dé)将(jiāng)创新融入我(wǒ)们的产品变得(dé)更加容易。这种微妙的(de)优势,能够迅速学习和改进,是巨大的竞争优势,而成为行业标准正是这一能力的关键”。第三(sān),开源在开发者(zhě)和研究人员中极受欢迎。
开源与闭源并不矛(máo)盾
开源还是闭源,也 许是全球人工智能信(xìn)徒长久(jiǔ)的辩(biàn)题。在Llama 3诞(dàn)生前几天,国内(nèi)同样在进行一场“辩论”。
4月11日,百度董事长兼首席执行官李彦宏(hóng)在其内部讲话中直言,大模(mó)型开源的意义不大,闭源模型在(zài)能力上会持续领先(xiān),而不是一(yī)时领先,做(zuò)模型的(de)创业公司既做模型(xíng)又做应用(yòng)的“双轮驱动”不是一个好的模式。在(zài)一周后的(de)Create 2024百度AI开发者大(dà)会上,李彦宏再度提到,大家(jiā)以(yǐ)前用开源觉得开源便宜,其实在大模(mó)型场(chǎng)景下,开源是最贵的,所(suǒ)以开源(yuán)模型(xíng)会越(yuè)来越落后。
360公(gōng)司创始人周鸿祎则持不同(tóng)的观点。他表示:“网上有些(xiē)名人胡说八道,大家也(yě)别被他们忽悠,说开源不如闭源好。一句话,今天没有开源就(jiù)没(méi)有Linux(操作系统内(nèi)核),没有(yǒu)Linux就没(méi)有互(hù)联(lián)网,就连说(shuō)这话的公司自己都借助了(le)开源(yuán)的力量才成(chéng)长到今天。”
这段发言被(bèi)解读为(wèi)对李彦宏(hóng)观点的回(huí)怼,周(zhōu)鸿祎随后澄(chéng)清道:“我一直是开源的信徒,但是我(wǒ)说开源好(hǎo),是(4月)13日(rì)在哈佛(fú)讲的,李厂长(指李(lǐ)彦宏)说闭源好,是(shì)(4月)16日在北京讲的(de)。”
生(shēng)数科技联合创始人(rén)兼CEO唐家渝站在闭源的一边。在4月18日举行的“2024中国生成式AI大会”上,唐家渝表示:“在我们看来,开源、闭源都有各自可以做的商(shāng)业生态,但是从模型能力的提升来说,或者 持续走到前列来说,闭源还是(shì)会走到开源的前面。”
昆仑万维董(dǒng)事长方汉的观点是(shì),开(kāi)源模型与闭(bì)源模(mó)型之间的差距正在不断缩小(xiǎo)。4月16日,方汉在接受《每日经济新闻(wén)》记者在内的媒(méi)体采访时表示,闭源模型的确是第一,但是开源大模型在2023年到今年这一年(nián)间,从落(luò)后两年以(yǐ)上(shàng),已经进化到落后4~6个月(yuè)以上。
此外,方汉认为,在应用侧,闭源对 于产品特性和长尾需(xū)求的满足都落后于开源大模型,开(kāi)源大模型是一(yī)种生态构建器,更利于满足用户的长尾需求。开源大模型(xíng)和闭(bì)源大模型(xíng)是一个生态的组成部分,不是 谁压(yā)倒谁,大家都有自己的生存空间,也(yě)都有更(gèng)好(hǎo)的明天。
不过,从商业化上来讲,闭源和开源也许并不矛盾。启明创投Meta继续押宝开源大模型 Llama 3拿下“赛点”?(tóu)合伙人周志 峰就(jiù)认(rèn)为,开源(yuán)闭源在过去几个(gè)大浪潮当中没有(yǒu)很大的冲突 ,不太理解为什么(me)很多(duō)人把闭(bì)源、开源在AI时代看成对立的。
李明顺的观点则(zé)是,在当前强应用导向(xiàng)的背景下(xià),开(kāi)源(yuán)模式具有(yǒu)显著(zhù)优势(shì),能够吸引(yǐn)全(quán)球(qiú)范围内最广泛的人(rén)参与,从而使其创(chuàng)新性保持在(zài)较高水平。
相较(jiào)之下,尽管(guǎn)一(yī)些闭(bì)源大模型在技术上(shàng)具有领先地位,但其成本太高。不过他也强调(diào),开源与闭源在不同公司和应用场景中可以相互转换。一些(xiē)基于开源的产品在发掘到独特优势后,可能会通过闭源策略建立竞争壁垒。同时(shí),一些闭源公司也会不断将其部分产品开源。这(zhè)两个应该是共存的,未来开源可(kě)能用(yòng)户量级上更大,但是行(xíng)业内,商业(yè)化做得比较好的(de)公司,往往还是闭源的多一点。
在开源与闭源的辩论(lùn)中,也许答案并(bìng)非非此即彼(bǐ)。AI的未来可能既不是完全开放的“自由港”,也不是彻底封闭的“孤(gū)岛”,而是一个既包含开放协(xié)作也包含封闭(bì)竞争(zhēng)的混合生态。在这个生态系统中,开放与封闭不是对立的(de)两极,而(ér)是(shì)一枚硬币的两面。
未经允许不得转载:橘子百科-橘子都知道 Meta继续押宝开源大模型 Llama 3拿下“赛点”?
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了