欢迎来到Borg Holt网网站!

欲与英伟达决高下,英特尔推中国定制版AI芯片

时间:2024-11-09 10:30:03 来源:

21世纪经济报道记者倪雨晴 北京报道 AI芯片的欲英战争正愈演愈烈 。

7月11日 ,伟达英特尔面向中国市场推出了AI芯片 Habana Gaudi 2,决高Gaudi 2直接对于标英伟达GPU的下英芯片100系列,欲争取AI算力市场的特尔推中宝座。

家喻户晓,国定当初GPU资源紧缺,制版英伟达的欲英100系列在国内禁售 ,而百模大战之下算力的伟达需要还在飙升 。对于中国市场而言 ,决高之后急需AI芯片“解渴”,下英芯片对于英特尔而言  ,特尔推中眼下正值算力紧缺的国定窗口期,也是制版侵略的绝佳机缘。

英特尔也夸张 ,欲英Gaudi 2芯片是专为磨炼狂语言模子而构建,接管7纳米制程,有24个张量处置器中间 。事实上 ,去年英特尔就已经在外洋宣告了Gaudi 2,这次在中国推出的是“中国特供版” 。

由于列国的进口操作限度 ,外界主要体贴的是AI芯片在中国市场的提供可不断性。对于此 ,英特尔公司实施副总裁  、数据中间与家养智能事业部总司理Sandra Rivera在接受21世纪经济报道记者采访时做出了确定的回覆 。

Sandra Rivera说道 :“这张卡也是中国定制版的产物,对于进口概况是反对于中国的客户是不任何下场的 。英特尔确定是正当合规地在中国不断反对于咱们的客户,不论是Gaudi 2概况是未来的Gaudi 3  ,咱们确定是在正当合规的情景下做出一些中国定制的产物,以知足中国的客户的需要。”

同时 ,芯片的功能并无打折 ,她展现:“在收集速率上 ,(中国版)以及国内版比照 ,是从24个网口酿成21个网口,可是部份功能仍是根基不同的 。”

“中国定制版”瞄准大模子  

随着大模子的一劳永逸  ,英特尔在近多少个月内环抱着Gaudi2不断妨碍优化。

Sandra Rivera介绍道,在功能上 ,凭证机械学习与家养智能凋谢财富同盟MLCo妹妹ons在六月尾宣告的AI功能基准测试MLPerf Training 3.0服从展现 ,Gaudi 2是除了英伟达产物外,仅有能把MLPerf GPT 3.0模子跑起来的芯片。

在宣告会现场,英特尔也直接将Gaudi2以及英伟达的A100妨碍比力,其野心可见一斑 。凭证英特尔宣告的数据 ,从合计机视觉模子磨炼到1760亿参数的BLOOMZ推理 ,Gaudi 2每一瓦功能约A100的2倍 ,模子磨炼以及部署的功耗飞腾约一半。

同时 ,英特尔高管还介绍道,当初比照A100,Gaudi 2价钱更有相助力 ,且功能更高。接下来到9月  ,接管FP8软件的Gaudi 2估量可能提供比H100更高的性价比 。

部份而言,除了芯片 ,在这次宣告会上,英特尔揭示了一系列反对于大模子的算力处置系统,接下来详细的落地运用以及产物迭代情景也受到关注  。

一方面 ,当初在中国市场上  ,英特尔已经以及浪潮信息、新华三、超聚变等国内主要的效率器厂商相助 ,其中 ,浪潮信息的NF5698G7是专为面向天生式AI市场的新款AI效率器 ,反对于8颗OAM高速互联的Gaudi2减速器,

而在终端客户方面 ,Sandra Rivera展现 :“中国市场对于家养智能处置妄想的需要颇为单薄 ,咱们正在与简直所有传统客户洽谈。咱们的云效率提供商、通讯处事提供商都是企业客户 ,因此对于家养智能处置妄想有着强烈的需要  。”

另一方面,在产物道路上 ,英特尔近些年不断夸张XPU,即多样化 、多组合的异构合计 。在AI相关的产物线上 ,既有集成AI减速器的CPU处置器、有GPU产物 、以及Habana Gaudi系列代表的ASIC规范AI芯片 。

Habana Labs建树于2016年,主要研发倾向为家养智能 、深度学习合计等,守业早期就患上到了英特尔的投资 ,而后在2019年12月以20亿美元被其正式笼络 。

对于GPU以及AI芯片的组合 ,Sandra Rivera泄露:“Gaudi是一总体工智能减速的专属产物,在英特尔产物里 ,假如是针对于大模子这个使命负载 ,它是功能最佳 、最优的一个产物。明年咱们还会有下一代产物Gaudi 3宣告 。在2025年的时候 ,咱们会把Gaudi的AI芯片跟GPU道路图合二为一,推出一个更整合的GPU的产物。”

算力市场争霸减轻

大模子的火热还在不断拉动AI芯片的需要 。

Sandra Rivera见告21世纪经济报道记者:“在4月份回顾一季度的情景时,咱们看到了种种家养智能带来的芯片需要,搜罗Gaudi在内,需要至少翻了两倍以上 。”

TrendForce集邦咨询向21世纪经济报道记者提供的数据展现,目上主要由搭载NVIDIA A100 、H100 、AMD MI300  ,以及大型CSP业者如Google、AWS等自主研发ASIC的AI效率器妨碍需要较为单薄,2023年AI效率器出货量(搜罗搭载GPU、FPGA 、ASIC等)出货量预估近120万台 ,年增率近38%,AI芯片出货量同步看涨 ,可望妨碍突破五成 。

芯片厂商们也在AI规模开足马力。英伟达不用多言,之后不论是100系列仍是800系列 ,都颇为紧缺 ,在AI芯片市场上占当先发优势;在6月中旬  ,AMD推出了新一代AI芯片 、数据中间CPU、以及DPU ,其中AI芯片Instinct MI 300X,直接对于标英伟达H100;此外,google、亚马逊 、baidu等大厂也都在自研AI芯片 ,在算力市场上的相助维度愈加丰硕。

而除了硬件之外 ,软件也同样关键 。好比 ,当初大部份AI芯片都绕不开英伟达的CUDA平台 ,CUDA建树了一套软硬件间的开拓尺度 。若何从CUDA迁移 、若何建树自己的优势生态都是挑战者的紧张课题。

对于软件生态的相助  ,Sandra Rivera展现:“软件开拓概况是开拓者生态,着实是英特尔多年的一个刚强,在全部数据中间规模中的软件生态中,一个是x86的软件生态 ,另一个是CUDA 。而且咱们留意到,随着越来越多的公司愿望运用家养智能 ,软件生态零星也正在减速开掘更多硬件潜能,以大幅后退花难题 。”

她进一步谈道  :“英特尔愿望能在多种语言情景中 ,可能提供更啰嗦的运用  。经由软件 、库以及工具提供一种模块化的措施 ,来优化并减速跨多种架构的异构负载 。尽管在家养智能概况是AI运算的时候 ,简直良多人在用CUDA ,可是大部份开拓者不会做那末底层的开拓,他们是在一个比力高的框架,好比说在PyTorch、TensorFlow下面去立异 。”

Habana Labs首席经营官Eitan Medina进一步向21世纪经济报道记者指出 :“在Gaudi2以前,咱们已经有一代产物,在软件上也做了好多少年的积攒 ,底层的软件库都已经开拓好了,咱们愿望闪开拓者可能在最下层的20%的比例可能做他的开拓,这里的开拓以及CUDA并无那末直接的分割关连。”

Gaudi系列作为英特尔AI的一支旗舰,外界也刮目相待Gaudi 2在实际运用中的功能展现、算力实力 。从硬件迭代到软件生态 ,AI芯片的相助故事还将不断。

(作者 :倪雨晴 编纂 :张星)

更多相关资讯请点击【休闲】频道>>>