AI“源神”启动!影响多大?
开源还是闭源?这是属于大模型的时代之问。
今年年初 ,埃(āi)隆·马斯克在对OpenAI及其CEO萨姆·奥特曼提起诉讼(sòng)时,就对OpenAI逐渐不公开(kāi)其模型研究相(xiāng)关细节的行为大加(jiā)谴责。“时至今日,OpenAI公司网站(zhàn)还宣称,它的宗旨是确保通用人工智能造福全人类(lèi)。然而,在现实中,OpenAI已(yǐ)经转变为科技巨头(tóu)微软(ruǎn)事(shì)实上的闭源子(zi)公司。”这位曾(céng)经的OpenAI联合(hé)创始人(rén)如此表(biǎo)示。
OpenAI不(bù)够“Open”,Meta却“Open”了(le)自己最新的开源人(rén)工智能模型。
4月18日,Meta 发(fā)布了其(qí)最新版本(běn)的开源大模型 Llama 3,引起开源AI社区的一阵欢呼。巧合的(de)是,Llama 3发布当天正好是(shì)AI领域(yù)顶尖(jiān)学者、AI开源倡导者吴恩达的生日(rì)。“(Llama 3是)至今为止最好的礼物,谢(xiè)感谢Meta!”他说。
行至2024,开闭(bì)源之争日(rì)渐白热化。闭(bì)源阵(zhèn)营以目前最强的OpenAI为代表(biǎo),开源阵营Meta的(de)LLaMa、Mistral和Google等也在不断迭代(dài)。闭源阵营坚持(chí)对Scaling Law的信仰,押(yā)注在更强通(tōng)用模型(xíng)的打造上;开源阵营模型能力(lì)不断提升(shēng),并且强调以更垂直的性能(néng)、更灵活的配置(zhì)来推动大模型商业化(huà)落地。
关于应该选择模型开源还(hái)是闭源讨论经(jīng)久(jiǔ)不息。
对于局内人,这(zhè)一选择这不仅决(jué)定了他们将如何点亮AI“科技树”,更将影(yǐng)响他们(men)的商业路(lù)线(xiàn)选择。换言之,这很有可能是这个残酷竞争市场下的生存问题。
两(liǎng)个版本,多重惊喜
Meta此(cǐ)次发布的Llame 3包括8B和70B的预训练和(hé)指令微调(diào)版本(běn)。
据Meta官(guān)网信 息,Llama 3 模型将(jiāng)数据和规模提升到新的高度。它在两个定制24K GPU集群上(shàng)基于超过(guò) 15T 的数据进行了训练——训练数AI“源神”启动!影响多大?据(jù)集(jí)是Llame 2使用量的(de)7倍 有余。它支持 8K 上下文长度,是 Llama 2 容量(liàng)的两倍。
除(chú)了 Llama 3,Meta 还发布了新的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。
据悉,Llama 3 即将在(zài)AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商(shāng)、模型 API 提供商平台上线,Llama还得(dé)到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供(gōng)的(de)硬 件平台的支持。
在官网上,Meta还放出(chū)了(le)Llama3两个版本与(yǔ)谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对(duì)手(shǒu)的参数对比。据Meta官网,Llame3在MMLU(学科知识理解)、GPQA(一般问题 )、HumanEval(代码(mǎ)能力)、GSM—8K(数学能力)、MATH(比较难的数学问题)5个评测集上均表现良好。
值(zhí)得注意的是,Llama3的代码能力(lì)非常优秀。在AI领域公众号(hào)“数(shù)字生命卡兹克”主理(lǐ)人卡兹克分享的用(yòng)户实(shí)测(cè)中,Llama3—8B能够给出国际象棋中经典(diǎn)皇后问题的解题代码。而(ér)其前代版本Llama2需要 专门的代码模型(xíng)才能实现。
市场的反应速度(dù)很快。18日当天,Meta股价(jià)逆势收涨1.54%。次日,百度智(zhì)能云千帆大模型平台开放邀约测试,提供针对Llama 3的训练推理方案,帮助开发(fā)者训练专属大模(mó)型。
8B和70B 两个型号(hào)的(de)模型,仅仅标志(zhì)着 Llama 3 系列的 开端,Meta AI首席(xí)科学家杨(yáng)立昆在其社(shè)交媒体透露,在接下来的几个月(yuè),还会有更(gèng)多版本陆续发布。
英伟达高级科学家Jim Fan认为(wèi)之(zhī)后可能会发布的Llama 3-400B以上的版本(běn)将(jiāng)成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。
不下牌(pái)桌,各显神通
上一轮元宇宙竞争(zhēng)中被认为可能跌进坑里的(de)Meta,在人工智能(néng)的牌桌上(shàng)打(dǎ)出(chū)了Llama系列(liè)这把好牌。要讨论Llama3带来的行业(yè)震荡,首(shǒu)先(xiān)要明白,什么是大模型领域的开源?
大模型领域(yù)的开源通(tōng)常(cháng)意(yì)味着模型的(de)架构、训(xùn)练代码和预训练权重 等都被公开,允(yǔn)许(xǔ)研究人员和(hé)开发者(zhě)自由地访(fǎng)问和使用。
不过,开源的程(chéng)度因模(mó)型而异。“有些(xiē)可能只提供有限的访问权限或部(bù)分(fēn)代码。”郭涛指出,判断大模型是否真正开源(yuán)的基准可能包括:代(dài)码和数据的可访(fǎng)问性、使用许可的宽松程度、社区支持的活(huó)跃度以及对改进和新应用的开放性。
放眼AI界,两条路径上都各有“头号玩家”分(fēn)布(bù)。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内是(shì)百度的文心一言以及风头正劲的月(yuè)之暗面Kimi。
而开源方面(miàn),除了Llama系列,目(mù)前应用较广的开(kāi)源大模型还包(bāo)括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的(de)MPT等。国内则(zé)包括,阿里巴巴的通(tōng)义千问,智谱的(de)ChatGLM-4、百川智能的(de)baichuan-7B中(zhōng)英文大模型、北京智(zhì)源悟道3.0大模型系列和(hé)面壁智能(néng)的(de)CPM-Bee 10B中文(wén)基座大模型等。
形成这样(yàng)的分化,很多时候是受技(jì)术进步和(hé)商业模式迭代等的多重(zhòng)影响(xiǎng)。
天使投资人、资深人工智能专家郭涛认(rèn)为(wèi),从技术角度来看,开源可以促进学术界(jiè)的研究和创新,而闭源(yuán)则有助于在一定时间内保(bǎo)持技术领先优势。
从商业角度来看,开源可以吸引开发者社区的贡献,促进技术的快速迭代和应用的广泛传播,但可能会影响(xiǎng)到公司的盈利模式。闭源则可以保(bǎo)护知识产权,为(wèi)公司创造直接的收入来源,但可能会(huì)限制技术的普(pǔ)及和生态(tài)的建(jiàn)设(shè)。
事(shì)实上,在Llama3发布之前,中文互联网刚刚经历了一轮开闭源论(lùn)战。
据(jù)媒体报道,百(bǎi)度CEO李彦宏近日表态,认(rèn)为(wèi)大模型开(kāi)源意义不大,闭源模型性(xìng)能会不断提升。“有了文心大模型(xíng)4.0,我们可以根据需要兼顾效(xiào)果、响(xiǎng)应速度、推理成本等各种考虑,裁剪(jiǎn)出适合各种场景的(de)更(gèng)小尺寸模(mó)型,且支持精调和post pretrain。通过降维裁剪出的 模(mó)型,比直接(jiē)拿开源 调出来的模型,同等尺寸下效(xiào)果(guǒ)更好,同等效(xiào)果(guǒ)下成本(běn)明显更低。”
李彦宏一直是闭源路(lù)线的忠(zhōng)实拥趸,理由包(bāo)括但不限于认可闭 源商业模式可以更好地(dì)聚集人力和财力等。
而其(qí)反对者——360创始人周鸿(hóng)祎言简意赅(gāi),“一句话,今天没有开源就没有 Linux,没有 Linux 就没(méi)有互联网。”
“源神(shén)”启AI“源神”启动!影响多大?动,影 响几何?
“Llama 3的发布会带(dài)来市场格局的改变。”郭涛在(zài)接受21记者采访时指出(chū),其优异表现可(kě)能吸引更多(duō)的(de)用户和投资者,从而(ér)增加其市场份额(é)。
官网显示,Llama 3将有条件地开源给商业使用(yòng)(月活用户超过7亿(yì)需要单独申(shēn)请)。“不过(guò)这基本等于完(wán)全免费商用了。”卡兹克表示(shì)。
此前,投资人朱啸虎曾经(jīng)就人(rén)工(gōng)智能市场相关话题接受腾讯(xùn)新闻采访。当被问及2023年大模型发(fā)展的(de)关键节点时(shí),他(tā)给出的回答正是Llama上线。这让中(zhōng)国(guó)在应(yīng)用层面创新有了基础,降低了商业化(huà)门槛。
当然,朱啸虎提到的变现是(shì)指(zhǐ)开源生态内的用户。对于开源大模(mó)型发布者的能(néng)否盈(yíng)利,或者能等来盈利机会,很多时(shí)候并没有确定的答案。
闭源大模(mó)型通常通过授权使用、订阅服务或者直接销售产品来盈利。其中(zhōng)的代表(biǎo)便是AI领域的领跑者OpenAI,虽然其一直有推进开源项(xiàng)目的动作,但其处(chù)在核心地位的(de)ChatGPT却一直采取收取API许可费的方式向其他公司提供服务。在API服务过程,其(qí)他公司不会接触到ChatGPT模型的细节和(hé)源(yuán)代(dài)码,仅仅通过API接口进行调用。
创业者服务平台GoDaddy对全美(měi)1003家(jiā)小型企业的调查数据显示,ChatGPT以70%的应用率成为美国小型企(qǐ)业(yè)应(yīng)用最多的(de)生成式AI产品,这(zhè)说明OpenAI选择的闭源模式的商业 化之路在一定程度已经(jīng)跑通。
开源(yuán)模(mó)型如(rú)何寻求(qiú)生存和发展的机会?
首(shǒu)先是以(yǐ)开放的生(shēng)态吸引用户。国盛证券研报就指出,开(kāi)源(yuán)大模型借助更大标识符训(xùn)练(liàn)数据集、DeepSpeed、RLHF等(děng)方式,实现低训(xùn)练成本和高性能,超大模型以下大(dà)模型的壁垒正在消失。
“在拥有用户后,开源大模型通常(cháng)通过提供增值服务、定制开发、技术支持等方式来实(shí)现盈利”。郭涛指出,公司可以在开源(yuán)模型的基础上提供专(zhuān)业(yè)的训练服务或者定制化的应用解决方(fāng)案。
对于Meta甚至众多开源者而言,开源的(de)野心不仅是短期的商业变现,其更想引领规则设计以(yǐ)及搭(dā)建(jiàn)生态。有业内专家(jiā)分析,开源后壁垒并没(méi)有那么容易破除,高质量、标注过(guò)的训练数据集尤其是专业模型 的壁垒。
星纪魅族集(jí)团(tuán)数据合规执行总监朱(zhū)玲凤表示,目前有些(xiē)开源AI由头部公司主导,“越多人使用,就越能强化网格效应,而且不是真(zhēn)正的开放(fàng),后续需要使用它们(men)的配套工具、配套服务。头部公司(sī)还(hái)可(kě)能利用监管豁免(miǎn)的(de)方式,获得寻租空(kōng)间。”换言之,以开源为噱头的巨头游戏,可能会进一步强(qiáng)化大(dà)公 司(sī)的(de)垄断地位(wèi),反而不利于产业竞争。
据报道(dào),去年4月,在扎克(kè)伯格与分析师的一次电(diàn)话(huà)会(huì)议中,他就(jiù)谈到,如果(guǒ)行业能够在Meta使用的基础工具 上达成标(biāo)准化,那么meta就能从其(qí)他人的改进中(zhōng)受益。同年(nián)5月,谷歌(gē)内部泄(xiè)露的文件《我们没有护城河(hé),OpenAI也没有》在SemiAnalysis网站上(shàng)传播,其中的观点包括,比起开源社区需要谷歌,谷歌(gē)更需要开源社区等等。文章作者指出,不同开源(yuán)模型所组成(chéng)的生态(tài)系统(tǒng)永(yǒng)远是OpenAI的潜在竞争对手,与开源AI竞争的结(jié)果必然是失败。
Meta落子,战局(jú)生(shēng)变。大模型的路(lù)线之(zhī)争会不会迎来真正的胜利(lì)者?
“开源与闭源大模型之间不(bù)太可能分出绝对的输赢,因为它们各自适合不同的应用和场景。”郭涛认为,开源大模型更(gèng)适合那些需要快速(sù)创新(xīn)和大规模协作的项目,而闭源(yuán)大模型(xíng)可能更适合 那些对性能和(hé)安全性(xìng)有极高要求的商业应用。
未经允许不得转载:橘子百科-橘子都知道 AI“源神”启动!影响多大?
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了