橘子百科-橘子都知道橘子百科-橘子都知道

AI“源神”启动 !影响多大?

AI“源神”启动 !影响多大?

开源还是闭源?这是(shì)属于(yú)大(dà)模型的时代之问。

今年年初,埃隆(lóng)·马斯克在对(duì)OpenAI及其CEO萨(sà)姆·奥特曼提起诉讼时,就对OpenAI逐渐不公(gōng)开其模型研究相(xiāng)关(guān)细节的行为大加谴责。“时至今日,OpenAI公司网站(zhàn)还宣称,它的宗旨是确保通(tōng)用人工智能造福全人(rén)类。然而,在现实中,OpenAI已经转变为科技巨头微软事(shì)实 上的闭源子公(gōng)司(sī)。”这位曾经的(de)OpenAI联合创始人如此表示。

OpenAI不够“Open”,Meta却(què)“Open”了自(zì)己(jǐ)最(zuì)新的开源人(rén)工智能模型。

4月18日,Meta 发布(bù)了其最新(xīn)版(bǎn)本的开源(yuán)大模型 Llama 3,引起开源AI社区的一阵欢呼。巧合的 是,Llama 3发布当天正好是AI领域顶尖学者、AI开源倡导者吴恩达的生日。“(Llama 3是)至今为止最好的礼物,谢(xiè)感谢Meta!”他说。

行至2024,开闭源(yuán)之争日渐白热化。闭源阵营以目(mù)前最强的OpenAI为代(dài)表,开源阵营Meta的(de)LLaMa、Mistral和Google等也在不断迭(dié)代。闭源阵营坚持对Scaling Law的(de)信仰,押注在更强(qiáng)通用模型的打造上;开(kāi)源阵营模型能(néng)力(lì)不断提升,并且强调以更垂直的性能、更灵活的配置来推动大(dà)模(mó)型(xíng)商业化落地。

关(guān)于应该选择模型开源还(hái)是闭源讨论(lùn)经久不息。

对于局内人,这(zhè)一选择(zé)这不仅决定了他们将如何点亮AI“科技树”,更将影(yǐng)响他们的商业路线选择。换言之(zhī),这(zhè)很有可能(néng)是(shì)这个残酷竞争市场下(xià)的生存问题。

两个版本,多(duō)重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令(lìng)微调版本(běn)。

据Meta官网信息,Llama 3 模型将数据和规模提升(shēng)到新的高度。它在两个定制24K GPU集(jí)群 上基于超过 15T 的(de)数(shù)据进行了训(xùn)练——训练数据集是Llame 2使用量的7倍有余。它支持(chí) 8K 上 下(xià)文长(zhǎng)度,是 Llama 2 容(róng)量的两倍。

除了 Llama 3,Meta 还发(fā)布(bù)了新的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主(zhǔ)要云(yún)提供商、模型 API 提供商平台(tái)上线,Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高(gāo)通提供的硬件平(píng)台的 支持。

在官网上,Meta还放出了Llama3两个版(bǎn)本与谷 歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对手(shǒu)的参数 对比。据(jù)Meta官网,Llame3在(zài)MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代码能力)、GSM—8K(数学能力)、MATH(比较难的数学问(wèn)题)5个评测集上均表现良(liáng)好。

值得注意的是,Llama3的(de)代 码能力非常(cháng)优秀。在AI领域公众号“数字生命卡兹克(kè)”主理人卡兹克(kè)分享(xiǎng)的用户实测中,Llama3—8B能够(gòu)给出国际(jì)象棋中经(jīng)典皇 后问题的解题代码。而其前 代版(bǎn)本(běn)Llama2需(xū)要专门的(de)代码(mǎ)模型才能实现。

市场的(de)反应(yīng)速度(dù)很快。18日当天,Meta股价逆势收涨1.54%。次日,百度智能(néng)云千帆大模型平台开放邀(yāo)约测试,提供(gōng)针(zhēn)对Llama 3的 训练推理方案,帮助开发者训练专属大模型。

8B和70B 两个型号的模型,仅仅标志着 Llama 3 系列的开端,Meta AI首席科学家杨立昆在其社交媒体透露,在接下来的几个(gè)月,还会有更 多版本陆续 发布。

英(yīng)伟达高级科学(xué)家Jim Fan认为之(zhī)后可能会发布的Llama 3-400B以上的版(bǎn)本将(jiāng)成为(wèi)某种“分水岭”,开源社区将能用上GPT-4级别的模型。

不(bù)下牌桌,各显神通

上一轮(lún)元(yuán)宇宙竞争(zhēng)中被认(rèn)为可能 跌(diē)进坑里的Meta,在人工智能的牌桌上(shàng)打出 了(le)Llama系列这把好牌。要讨论Llama3带来的行业(yè)震荡,首先要明白,什么是大(dà)模(mó)型领域的开源 ?

大模型领(lǐng)域的开源通常意味着(zhe)模型的架构、训练代码和预训(xùn)练权重(zhòng)等都被公开,允许研究 人员和(hé)开(kāi)发者自由(yóu)地访问(wèn)和使用。

不过,开源(yuán)的程度因模型而异。“有些(xiē)可能只提供有限的访问(wèn)权限或部分代码。”郭涛指出,判断大模型是否真(zhēn)正开源的基准可(kě)能包括:代码和数(shù)据的可访问性、使用许可的宽松程度、社区支持的活跃度以及对改进和新应 用的开(kāi)放(fàng)性。

放眼AI界,两条路径上都各有“头号玩家”分布(bù)。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内是百度的文心一言以及风头正(zhèng)劲的月之(zhī)暗(àn)面Kimi。

而开源方(fāng)面,除了 Llama系列,目前应用较广的开(kāi)源大模型(xíng)还包括非营利组织AI“源神”启动!影响多大?LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国(guó)内则(zé)包括,阿里巴巴的通(tōng)义(yì)千问,智谱的(de)ChatGLM-4、百川智能的 baichuan-7B中英文(wén)大(dà)模型、北京智源悟道3.0大模型(xíng)系列和面壁智能的CPM-Bee 10B中文基座大(dà)模型等(děng)。

形成这样的分化,很(hěn)多时(shí)候是(shì)受技术(shù)进步和商业模(mó)式迭代(dài)等的多(duō)重(zhòng)影响。

天使投资人、资深人工(gōng)智能专家郭(guō)涛认为,从技术角度来看(kàn),开(kāi)源(yuán)可以促(cù)进学术(shù)界的研究(jiū)和创(chuàng)新,而闭源则有助于在(zài)一定时间内保持(chí)技术领先(xiān)优势(shì)。

从商业角度来看,开源可以(yǐ)吸引开发者社区(qū)的贡献,促进(jìn)技术的快速(sù)迭代和应用(yòng)的广泛传播,但可能会影(yǐng)响到公司的盈利模式。闭源则可(kě)以保(bǎo)护知识产权(quán),为公司创造直接的收入来源,但可能会限制技术(shù)的普及和生态的建设。

事实(shí)上,在Llama3发布之(zhī)前,中(zhōng)文互联网刚刚经历了一轮(lún)开闭源论(lùn)战。

据媒体(tǐ)报道,百度CEO李彦(yàn)宏近日(rì)表态,认为大模型开源意义不大,闭(bì)源模型性能会不断(duàn)提升。“有了(le)文心大模型4.0,我们(men)可以根(gēn)据需要兼顾效果、响(xiǎng)应速(sù)度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,且支持(chí)精(jīng)调和post pretrain。通过降维裁剪出的模型,比直接拿开源调出来的模(mó)型(xíng),同等尺寸下效果更好,同等效果下成本明显更低。”

李彦(yàn)宏一直是(shì)闭(bì)源路线的忠实拥(yōng)趸,理由包括(kuò)但不限于认可闭源商业(yè)模式可(kě)以更好地(dì)聚集人(rén)力和 财 力等。

而其(qí)反对者——360创始人周鸿祎言简意赅(gāi),“一句话,今天(tiān)没(méi)有开(kāi)源就没 有 Linux,没有 Linux 就没有互联网。”

“源神”启动,影响几(jǐ)何?

“Llama 3的(de)发(fā)布会带来(lái)市场格局的改变。”郭涛在接受21记者采访时指出,其优异表现可能(néng)吸引更多的用户和投资者,从而增(zēng)加其市场份额(é)。

官网(wǎng)显(xiǎn)示,Llama 3将有条件地开源给商业使用 (月活用户(hù)超过7亿需要单 独申请)。“不过这基本等(děng)于完全免费商(shāng)用了。”卡兹克表示。

此(cǐ)前,投资(zī)人朱啸虎曾经就人工智能市场相关话题(tí)接受腾讯新闻(wén)采访。当被问及2023年大模型发展(zhǎn)的关键节点时 ,他给出的回答正是Llama上线。这让中国在应用层面创新有了基础,降低了商业化门槛。

当然,朱啸虎提到的变现是指开源生态(tài)内的用户。对于开源大模型发(fā)布AI“源神”启动!影响多大?者的能否盈利,或者能等来盈利机会,很多时候并(bìng)没(méi)有(yǒu)确定(dìng)的(de)答案。

闭 源大模(mó)型(xíng)通常通(tōng)过授权使用、订阅服务或者直接销售产品来盈利(lì)。其(qí)中的代表便是AI领域的领跑者OpenAI,虽然其(qí)一直有推(tuī)进开源项目的动作,但其处在 核心地位的ChatGPT却(què)一直采取(qǔ)收取API许可费的(de)方式向其他公司提供(gōng)服务。在API服(fú)务过程,其他公司不会接触到ChatGPT模型的细(xì)节和源代码,仅仅通过API接口进行调用。

创(chuàng)业者服务平台GoDaddy对全美(měi)1003家小型(xíng)企业的调查数(shù)据显示(shì),ChatGPT以70%的应用率(lǜ)成为美国小(xiǎo)型企业应(yīng)用最多的生成式AI产品,这说明OpenAI选择的闭源模式的商 业化之路在一定程度已经跑(pǎo)通。

开源模型(xíng)如何寻求生存和发展的机会?

首先是(shì)以(yǐ)开放的生(shēng)态吸(xī)引用户。国盛证券研报就 指出,开源大模型借助更大标识符训(xùn)练数据集、DeepSpeed、RLHF等(děng)方式,实现低训练成本和高性能,超大模(mó)型以下大模型(xíng)的(de)壁垒(lěi)正在消失。

“在拥有用户后,开源大模型通常通(tōng)过提供增值服务、定制开发、技术支持等方式来实现盈利”。郭涛指出,公司可以在开源模型的基础上提供(gōng)专业的(de)训练服务或者(zhě)定制化的应(yīng)用解决方案。

对于Meta甚至众多开源者而言,开源的野心不仅(jǐn)是短期的商业变(biàn)现,其更想引领规(guī)则设计以及搭建生态。有业内(nèi)专家分析,开源(yuán)后壁垒并(bìng)没有(yǒu)那么容(róng)易破除(chú),高质量、标注过的训练(liàn)数据 集尤其是专业模型的壁垒。

星纪魅族集团数(shù)据合规执 行(xíng)总监(jiān)朱玲凤表示,目前有些开(kāi)源AI由头(tóu)部(bù)公(gōng)司主导,“越多人使用,就越(yuè)能强化网格效应,而且不是真(zhēn)正的(de)开放,后续需要(yào)使用它们的(de)配套工具、配套服(fú)务。头部公司还可能(néng)利用监管(guǎn)豁(huō)免(miǎn)的方式(shì),获得寻租空(kōng)间。”换(huàn)言之,以 开源为噱头的(de)巨头游戏,可能会进一步(bù)强化大公司(sī)的垄(lǒng)断地位,反而(ér)不利于产业竞(jìng)争(zhēng)。

据(jù)报 道,去年4月,在扎克伯格与分析师的一次(cì)电(diàn)话会议(yì)中,他就谈到,如(rú)果行业能够在Meta使(shǐ)用的(de)基础工具上达成标(biāo)准化,那么meta就能从其他人的改进中(zhōng)受益。同年5月,谷歌内部泄(xiè)露的文件《我(wǒ)们(men)没有护城(chéng)河,OpenAI也没有》在SemiAnalysis网站上传播,其中的观点包括,比起开源社区需要谷歌,谷歌更需要开源社区等等。文章作者指出,不同开源模型所 组成的生态(tài)系统永远(yuǎn)是OpenAI的潜在竞争对手,与开源AI竞争的(de)结(jié)果必然是失败。

Meta落子,战局生变。大 模型的路线之争会(huì)不(bù)会迎来真正的(de)胜利者?

“开源(yuán)与闭源大模型之间不(bù)太可能分出绝对的输赢(yíng),因为它(tā)们各自适合不同的 应用和场景。”郭涛认为,开源大模型更适(shì)合(hé)那些(xiē)需要快速创新(xīn)和大规模协作的(de)项目,而闭源大模型可能(néng)更适合那些对性能和安全性有极高要求的商业(yè)应用。

未经允许不得转载:橘子百科-橘子都知道 AI“源神”启动!影响多大?

评论

5+2=