橘子百科-橘子都知道橘子百科-橘子都知道

将英伟达拉下马,芯片公司出招

将英伟达拉下马,芯片公司出招

如果您希望可以时常见面,欢(huān)迎标星收藏哦~

来源(yuán):内容编译自IEEE,谢谢。

很(hěn)难夸大英伟达在AI领域的主导(dǎo)地位。成立于1993年的英(yīng)伟达最初在个人计算机图形处理单元(GPU)领域崭露头角。然而,是公(gōng)司的AI芯片,而非PC图形硬件,推动英伟达跻身全(quán)球最有价值公司(sī)之列。事实证明,英伟达的GPU在AI方面也(yě)表(biǎo)现出色。因此(cǐ),其股价自2020年初以(yǐ)来已经增长了15倍(bèi)以上,收入从2019财年约120亿美元(yuán)跃升至(zhì)2024年(nián)的600亿美元;这家AI巨头(tóu)的领先芯片如(rú)沙漠中的水(shuǐ)一样稀缺(quē)且备(bèi)受追(zhuī)捧。

"获取GPU对AI研究人员(yuán)来说已经成了(le)巨大(dà)的(de)担忧,以至于他们每天(tiān)都在思考(kǎo)这个(gè)问题。因为没有它们(men),即使拥有最好的模型,他们也无法尽情发挥,”谷歌DeepMind的(de)AI数据负责人詹妮弗·普伦德基(Jennifer Prendki)表示。普伦(lún)德基依赖英伟达的程(chéng)度较(jiào)少,因(yīn)为谷(gǔ)歌拥有自己的AI基础设施。但其(qí)他科技巨头,如(rú)微软和亚马逊,是英伟达最大的客户之一,并继续以极 快的速(sù)度购买其GPU。据新闻报道,美国(guó)司法(fǎ)部(bù)正在就英伟达芯片分(fēn)配和获取问(wèn)题进行反垄断调查。

英伟达在AI领域的主导地位,与机器学习的爆发(fā)一样,是最(zuì)近的现(xiàn)象。但这种(zhǒng)成功源自公司数十年来的努力,旨在将GPU建立为(wèi)除渲染图形(xíng)外对(duì)其他任务也有用的通用 计算硬(yìng)件。这(zhè)一(yī)努力不仅包括公司GPU架构的演变,后者(zhě)现在拥有能够加速AI工作负载(zài)的“张量核心”,还包括其软件(jiàn)平台CUDA,这为开发(fā)人员(yuán)利用硬件优势提供了支持(chí)。

“他们确保每个从大(dà)学毕业的计算机科学专业学(xué)生都掌握了CUDA编程 ,”Moor Insights & Strategy的数据中(zhōng)心首席分析师Matt Kimball说。“他们提供(gōng)工(gōng)具和培训,并在研究上投入了大量资 金。”

CUDA于2006年发布,帮助开发人员使用英伟达GPU的众多(duō)核心。这在加 速高度并(bìng)行的计算任务方面至关重要。英伟达(dá)在建立CUDA生(shēng)态系统上的成功使其硬件成为AI开发的最小阻力路径。虽然英伟达芯片供不应(yīng)求,但比AI硬件将英伟达拉下马,芯片公司出招更难找到的,可能是经验丰富的AI开发人员(yuán)——而许多开发人员都熟悉CUDA。

这给了(le)英伟达(dá)一(yī)条深厚且广泛的护城河来保护其业务,但这并不意味着(zhe)它(tā)缺少准备进攻的竞争对手,这些对手的策(cè)略各不相同。虽然像AMD和英特尔 这样的老牌公司(sī)正在试(shì)图(tú)使用他们自(zì)己的GPU来挑战英伟达,但像Cerebras和SambaNova这样(yàng)的初创公司已经开发出能够显著提高生(shēng)成式AI训练(liàn)和(hé)推理效率的创新芯(xīn)片架构。它们是最有(yǒu)可能挑战英伟达的竞争对(duì)手。

AMD:另一(yī)位GPU制造商

优势:AMD的GPU是说服(fú)力十足的英伟达替代品

劣势:软件生态系统无法与(yǔ)英伟(wěi)达的CUDA相(xiāng)抗衡(héng)

在图形芯片领域,AMD与(yǔ)英伟达的战斗(dòu)已持续了近二十年。这是一场有时(shí)不(bù)平衡的竞(jìng)争。在图形处理方面 ,AMD的GPU在销售和(hé)心智占(zhàn)有率上很少击败英(yīng)伟达(dá)。然而,AMD的硬件有其优势。公司的广(guǎng)泛GPU产品组合涵盖了从笔(bǐ)记(jì)本(běn)电脑的集成图形到拥有1500亿个晶体管的AI专用数据中心GPU。该公司还(hái)早期支持并采用了高带宽内存(HBM),这是如今全球最(zuì)先进GPU所必需的一种(zhǒng)内存形式。

“如果你看硬件……它(tā)与(yǔ)英伟达相比并不逊色,”Kimball说(shuō)道,他指的是AMD的Instinct MI325X,这(zhè)是一款英伟达H100的(de)竞争对手。“AMD在这款芯片的(de)设(shè)计上做(zuò)得非常出色。”

MI325X计划于今年年底推出,拥有超过(guò)1500亿个晶体管和(hé)288GB的高带宽内存,尽管(guǎn)其在实际应用中的表现尚待验证。MI325X的(de)前身MI300X获得了微软的好评 ,微软使用包括MI300X在内的(de)AMD硬件来处理部分ChatGPT 3.5和4的(de)服务。Meta和(hé)戴尔也部署(shǔ)了MI300X,Meta在其最(zuì)新的大语言模型Llama 3.1的部分(fēn)开发中使用了这些芯片。

AMD仍有一个障(zhàng)碍需(xū)要克(kè)服(fú):软(ruǎn)件 。AMD提供了一个开源平台ROCm来帮助开发(fā)人员为 其GPU编程,但它的人气不如CUDA。AMD意识到了这一弱点,并在2024年7月同意(yì)收(shōu)购欧洲最大的(de)私有(yǒu)AI实验(yàn)室Silo AI,该实验室在使用ROCm和AMD硬件进行大(dà)规模AI训练方面有经验。AMD还计划收购ZT Systems,一家在数据中心(xīn)基础设施方面拥有专长的公司,以帮助AMD更好地为(wèi)部署其硬件的客户服务。打造一(yī)个能够与(yǔ)CUDA匹敌的(de)对手绝非易事,但AMD正(zhèng)在全力以赴。

英特尔:软件成功

优势:Gaudi 3 AI加速器(qì)表现强劲

劣势:下一款大(dà)AI芯片(piàn)要到2025年底才会推出

英特尔的挑战与AMD相反。英特尔缺乏英伟达的CUDA和AMD的ROCm的直接(jiē)匹配产品,但(dàn)其(qí)于2018年推出了一个开源统一编程平台OneAPI。与CUDA和ROCm不同,OneAPI涵盖多(duō)个(gè)类(lèi)别的硬件,包括CPU、GPU和FPGA。因此,它可以帮助(zhù)开(kāi)发人员在任何英 特尔硬件上加速将英伟达拉下马,芯片公司出招AI任务(以及其他任务)。

另一(yī)方(fāng)面,硬件(jiàn)是一个弱点,至少与 Nvidia 和 AMD 相比是如(rú)此。英特尔的 Gaudi AI 加速器是英特(tè)尔2019 年收购 AI 硬件初创公司 Habana Labs的成果,取得了进(jìn)展(zhǎn),最新的Gaudi 3 的性能可(kě)与 Nvidia 的 H100 相媲美。

然(rán)而,目前(qián)尚不清楚英特尔的下一代硬件版(bǎn)本究竟会 是什么(me)样子(zi),这引起了一些担忧。Moor Insights & Strategy 创始人帕特里克·穆尔黑德 (Patrick Moorhead ) 表示:“Gaudi 3 非常强大。”但他表示,截至 2024 年(nián) 7 月,“还没有 Gaudi 4”。

相反,英特尔计划转向一(yī)款雄心勃勃的芯片,代号为 Falcon Shores,该芯片采用基于区块的模块化架构,结合(hé)了(le)英特尔x 86 CPU 内核(hé)和(hé) Xe GPU 内核;后者是英特尔最近进军图形硬件领域的一部分。不(bù)过,英特尔尚未(wèi)透露有关 Falcon Shores 架(jià)构(gòu)和性能(néng)的详细(xì)信息,预(yù)计要到(dào) 2025 年底(dǐ)才会(huì)发布。

Cerebras:越大越好

优点(diǎn):晶圆级芯片每颗芯片提供强大的性能和内存

缺点:由于尺寸和成本,应用领域(yù)有限

可以肯定的是,AMD和Intel是Nvidia最具可(kě)信度的挑战者(zhě)。它们在设计成功芯片和构建编程平台方面有着悠久的历史。但在规模较小、未经验证的玩家中,有一个脱颖而出:Cerebras。

这家公(gōng)司专(zhuān)注于(yú)超级计算机的AI,于(yú)2019年推出了Wafer Scale Engine,这是一块巨(jù)大的晶圆级硅(guī)片(piàn),拥有1.2万亿个晶体管。最新版本Wafer Scale Engine 3将这一数字提升到(dào)了4万亿个晶体(tǐ)管。作为比较,Nvidia最新最大的GPU——B200,"仅 "拥有2080亿个晶(jīng)体管。Cerebras围绕这个晶圆(yuán)级(jí)怪物构建(jiàn)的 计算机CS-3,正是Condor Galaxy 3的核心,该超级计算(suàn)机将由64台CS-3组成,处理高达8 exaflop的AI计(jì)算任务。G42,一(yī)家总部位于阿布扎比的企业集团,计划使用该系统训练(liàn)未来的前沿大型语言模型。

“这有点偏向于特定的应(yīng)用,而不是通用 型(xíng)的,”Bernstein Research的高级分析师Stacy Rasgon说。“并不是(shì)每个人都会购买(mǎi)这(zhè)些(xiē)计算机。但他们(men)有一些客户(hù),比如美国国(guó)防部和Condor Galaxy 3超(chāo)级计算机。”

Cerebras的(de)WSC-3在大多数情况下(xià)不会挑战Nvidia、AMD或Intel的硬件;它太大(dà)、太昂贵、太专业化了。但它可能在超级(jí)计算机领域为Cerebras提供(gōng)独(dú)特优势,因为没有其他(tā)公司设计晶圆规模的芯片。

SambaNova:

为Transformer而生的变形架构

优点:可配置的架(jià)构有助于开(kāi)发人员优化AI模型的效率

缺点:硬件还需要证明 对大(dà)众市场的相 关性

成立于2017年(nián)的SambaNova是另一(yī)家利用 非传统芯(xīn)片架构解决(jué)AI训练问(wèn)题的芯片设计公(gōng)司。其(qí)旗舰产品SN40L采用公司所谓的“可重构(gòu)数据流架构”,由存储器和计算资源的模块组成。这些模块之间的连接可(kě)以根据(jù)需要进行动态调整,以促(cù)进(jìn)大型神经网络的数据快速(sù)传输。

Prendki认为,这种可定制的硅片(piàn)在训练大型语(yǔ)言模型时可能会非常有(yǒu)用,因为AI开发人员可(kě)以根据不(bù)同的模型来优化硬件。没有其他公司提供这样的功能。

SambaNova还通过其配套的软件栈SambaFlow取(qǔ)得了成(chéng)功。Moorhead说:“在基础设施层面,SambaNova的平台表现出色。”SambaFlow可以分析机器学习模型,并帮助开发人员重新配置SN40L以加速模型的性能(néng)。虽然SambaNova还有很多要证明(míng)的地方,但其客户包括软银和模拟器件公司。

Groq:专注(zhù)于(yú)功能

优点:出色的AI推理性能

缺(quē)点:目前(qián)仅限于推理(lǐ)应用

另一家在AI硬件(jiàn)上有独特创新的公司是Groq。Groq的策略是紧密结合内存和计算资源,以加(jiā)速大(dà)型语言模型对提示的响应速度。

“他们(men)的架构非常注重内存。内存与处(chù)理器紧密耦(ǒu)合。你需要更多的节点,但每个(gè)token的价格(gé)和性能 简直(zhí)疯狂,”Moorhead说道。“token”是模(mó)型处理的基本数据单位;在大型语言模型中,通常(cháng)是一个词或部分(fēn)词。更令人(rén)印象深刻的是,Groq的(de)芯片——语言处理单元推理引擎——采用(yòng)的是GlobalFoundries的14纳(nà)米技术(shù),而(ér)这(zhè)已经是(shì)比用于制(zhì)造Nvidia H100的台积电技术落后(hòu)几代的工艺(yì)。

2023年7月,Groq展示(shì)了其芯片的推理速度(dù),运(yùn)行Meta的(de)Llama 3 80亿参数大(dà)型(xíng)语言模型时,每秒 超过1250个token。这一表现甚至超过了SambaNova的演示,其推理速度超过每秒(miǎo)1000个token。

高通:功耗至上

优点:广泛的AI功能芯(xīn)片组合

缺点:缺少用于AI训练的大(dà)型前沿芯片(piàn)

高通(tōng)以Snapdragon系统(tǒng)级(jí)芯片闻名,这款芯片为诸如三星Galaxy S24 Ultra和(hé)OnePlus 12等流行的安卓手机提供动力。高通是(shì)一家(jiā)可(kě)以与AMD、Intel和Nvidia抗衡的巨头。

但与这些竞争对(duì)手不(bù)同,高通将其(qí)AI战 略更(gèng)多地集中在特定任务的AI推理和能效上。AI基准组织MLCommons的创始成(chéng)员、AI优化公(gōng)司Krai的(de)CEO Anton Lokhmotov表示,高(gāo)通在关键(jiàn)的基(jī)准(zhǔn)测试中显著提高了其Qualcomm Cloud AI 100服务器的推理能力。在ResNet-50图像分类基准测试中,这些服(fú)务器的性能从180样本/瓦提升至240样本/瓦,使用的硬(yìng)件基本保持不变。

在设备(bèi)上处理本地AI任务而(ér)无需 连(lián)接到云端的高效AI推理也是(shì)一(yī)个优势,Lokhmotov说(shuō)。一个典(diǎn)型例子是微软的Copilot Plus PC。微软和高通与戴尔(ěr)、惠普和(hé)联想等笔记本制造商合作,首批配 备(bèi)高通(tōng)芯片的Copilot Plus笔记本电脑已于7月上市。高通还在智能手机和平板电(diàn)脑市场占据强大地位,其(qí)Snapdragon芯片为三星(xīng)、OnePlus和(hé)摩(mó)托罗拉(lā)等设备(bèi)提供动力。

高通还是AI驾驶辅助和自动驾驶平台(tái)的主要玩家。2024年初 ,现代旗(qí)下的Mobius部门宣布与高通合(hé)作,使用Snapdragon Ride平台——该平台是Nvidia Drive平台的竞争对手——用于高级驾驶辅助系(xì)统。

超大规模数据(jù)中心:

为功耗定(dìng)制智能

优(yōu)点:垂直整合有助于设计

缺(quē)点 :超大规模数据中心可能会优先满足自身需求和使用

超大规模数据中心(xīn)(Hyperscalers)——那些部署硬件规模(mó)庞大的云计算巨头——与“大科技”同义。亚马逊、苹果、谷歌、Meta和微软都希望尽快部(bù)署AI硬件,既用于自身使用,也为其云计算客户服务(wù)。为加(jiā)速这一进程,他们都在内部设计芯片。

谷歌比竞争(zhēng)对(duì)手更早投资于(yú)AI处(chù)理(lǐ)器:该(gāi)公司于2015年(nián)首次宣布的Tensor Processing Units(TPU)如今支撑着其大部分AI基础设施。第六代TPU Trillium于2023年5月宣布,并成为谷歌AI超级计(jì)算机的一部分,这是(shì)一(yī)项针对公司(sī)处理(lǐ)AI任务的云服务(wù)。

Prendki说,谷(gǔ)歌的TPU为公司在追求AI机(jī)会时提供了优势。“我很幸运,不用费(fèi)心考虑芯片从(cóng)哪里(lǐ)来,”她(tā)说。然而,TPU的使用并没有完(wán)全消除供应紧张,因为(wèi)谷歌的不同部门仍然需要共享资(zī)源(yuán)。

谷歌已经(jīng)不再 孤单。亚马逊拥有两款自研芯片(piàn),Trainium用于训练,Inferentia用于(yú)推理。微软拥有Maia,Meta拥有MTIA,而据传苹果也在开发处理其云基础(chǔ)设施中AI任务(wù)的硅(guī)片(piàn)。

这些超(chāo)大规模数据中(zhōng)心的芯(xīn)片并未直接与(yǔ)Nvidia竞 争(zhēng),因(yīn)为他们不向客户销(xiāo)售硬件,但他 们确实通过云(yún)服务提供硬件访问(wèn),比如谷歌的AI超级计算机、亚马逊的AWS和微(wēi)软的Azure。在许多情况下,超大规(guī)模数据中心提供的(de)服(fú)务既运行在自家硬件上,也运行在(zài)Nvidia、AMD和Intel的硬件上;而微软(ruǎn)则被认为是Nvidia的最(zuì)大客户。

中国芯(xīn)片(piàn):不确定(dìng)的未(wèi)来

另一类竞争者的诞生(shēng)并非源自技术(shù)需(xū)求,而是地缘政治现实。美国对AI硬件出(chū)口的限制阻(zǔ)止了芯片制造商向中国公司出售最(zuì)新、最强大的芯片。作为回应,中国公司正在设计自有AI芯片。

国(guó)内科技巨头(tóu)所(suǒ)推(tuī)出的加速器是(shì)Nvidia H100的替代品,然而,代工厂的(de)产量(liàng)问题据称限(xiàn)制了供应(yīng),此外,巨头还在销售“AI一体机”解决方案,旨在为中国企业提供本地化的(de)AI基础 设施。

为(wèi)了绕过美国的(de)出口(kǒu)管制(zhì)规定,中国行业(yè)可能会转(zhuǎn)向替代技术。例如,中国研究人员(yuán)在光子(zi)芯片方面(miàn)取得了进展,这种芯片利用(yòng)光而(ér)不是电荷来(lái)进行计算(suàn)。“光束的优势在于你可以(yǐ)让两束光交叉,”Prendki说(shuō)道。“因此,它(tā)减(jiǎn)少了在(zài)硅芯片上通常遇到的限制,不能交叉路径(jìng)。你可以使电路更复杂,且成本更低。”虽然光子芯片(piàn)仍(réng)处于非常早期的阶段,但中国的投资可能会加(jiā)速其发 展。

更(gèng)多空(kōng)间

显然,Nvidia 并不缺乏竞争对手。同样明显的(de)是,在未来几年内,没有一家(jiā)竞争对手能够挑战 Nvidia,更(gèng)别说击败它(tā)了。本文(wén)采访的所有人都同意,Nvidia 目前占据着无与伦比的(de)主导地位,但这并不意味着它(tā)将永(yǒng)远排挤竞争(zhēng)对手(shǒu)。

“听着,市场需要选择,”Moorhead 说。“如果到 2026 年,我无法(fǎ)想象 AMD 的市场份额会(huì)低于 10% 或 20%,英特尔(ěr)也是如此。通常(cháng),市场喜欢(huān)三家公司,而(ér)我(wǒ)们有三个合理的竞争对手。”Kimball 表示(shì),与此同时,超(chāo)大(dà)规模公司可(kě)能会挑战 Nvidia,因为他们将更多(duō)的 AI 服务(wù)转移到内部硬件上。

然后(hòu)还有不确定因素。Cerebras、SambaNova 和 Groq 是众多(duō)初创公司中的佼佼者,它们希望通过新颖的解(jiě)决(jué)方案蚕食 Nvidia 的市场份额(é)。此外,还有数十家其他公司加(jiā)入其中,包括 d-Matrix、Untether、Tenstorrent和Etched,它们都寄希望于针对生成式 AI 优化(huà)的新芯片(piàn)架构。这些初创公司中可能有(yǒu)许多会失败,但 也许下一个 Nvidia 会从幸存者中(zhōng)脱(tuō)颖而出。

https://spectrum.ieee.org/nvidia-ai

专注半导体(tǐ)领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由(yóu)作(zuò)者原创。文章内容系作者个人观(guān)点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业(yè)观察对该观点(diǎn)赞同或支(zhī)持,如果有任何异议,欢迎联系半导 体行业观察。

今天(tiān)是《半导体行业(yè)观察(chá)》为您(nín)分享的第3888内容,欢迎关注。

『半导体(tǐ将英伟达拉下马,芯片公司出招)第一垂直媒体』

实(shí)时 专业(yè) 原创 深度

公众号(hào)ID:icbank

喜欢我们的内容就点“在看”分享给小(xiǎo)伙伴哦

未经允许不得转载:橘子百科-橘子都知道 将英伟达拉下马,芯片公司出招

评论

5+2=