炼数成金 门户 商业智能 芯片 查看内容

英特尔发布新版AI云芯片,剑锋直指英伟达!

2018-5-25 15:54| 发布者: 炼数成金_小数| 查看: 19091| 评论: 0|来自: AI前线

摘要: 据 Naveen Rao 介绍,新一版的 NNP 芯片将带来多项更新,性能比上一代产品提升 3-4 倍,目前已经提供给除 Facebook 之外的合作伙伴试用,但要到 2019 年下半年才会向用户开放第一批产品。Naveen Rao 首先介绍了上一 ...

工具 开源 Spring GPU 芯片

发布升级Nervana NNP-L1000云芯

(英特尔副总裁、AI 事业部(AIPG)负责人 Naveen Rao)

在这场并没有受到很多关注的英特尔人工智能开发者大会上,会议伊始,英特尔副总裁、AI 事业部(AIPG)负责人 Naveen Rao 就在演讲台上抛出了最重磅的消息——发布升级版的 Nervana NNP-L1000 云端芯片,新代号为 Spring Crest。

早在 2017 年 10 月 17 日 WSJ D.Live 大会上,英特尔就正式发布了专为机器学习而设计的神经网络处理器(NNP,Nervana Neural Network Processors)系列芯片,代号名称为 Lake Crest。

时隔七个月,这个系列芯片全面升级,并且有了新代号——Spring Crest,并在会议上展出。
据 Naveen Rao 介绍,新一版的 NNP 芯片将带来多项更新,性能比上一代产品提升 3-4 倍,目前已经提供给除 Facebook 之外的合作伙伴试用,但要到 2019 年下半年才会向用户开放第一批产品。

根据现场展示,AI 前线了解到英特尔似乎更强调 Spring Crest 的存储带宽和低延迟性能,而不是 TOPS (trillion operations per second)。
Naveen Rao 首先介绍了上一代产品 Nervana NNP-L1000 (Lake Crest) 的性能。其 GEMM(General Matrix to Matrix Multiplication)操作矩阵为 A(1536, 2048) and B(2048, 1536) ,单芯片计算利用率超过 96.4%,实际性能(非理论)达 38 TOP/s。

支持模型并行训练的多芯片分布式 GEMM 操作实现了 A(6144,2048)和 B(2048,1536)矩阵大小,接近线性缩放和 96.2%的缩放效率。这使得多个 NNP 可以连接在一起,并忽略其他架构的内存限制。

测量显示,这款产品的理论带宽单向 chip-chip 的效率的为 89.4%,延迟时间低于 790ns(纳秒),可以将其应用于 2.4Tb / s(每秒太比特)的高带宽、低延迟互连。

所有这些都可以在单芯片总功率低于 210 瓦的情况下实现。而这只是英特尔从早期合作伙伴那里收集到的关于 Nervana NNP-L1000(Lake Crest)原型的反馈。

Nervana NNP-L1000 的性能比 Lake Crest 提升 3-4 倍,我们可以据之推测新升级芯片的性能。
另外,Spring Crest 还支持 bfloat16(ML 行业神经网络采用的标准),并且 FPGAs、 Xeons 和其他 ML 产品均支持 bfloat16。

其他亮点:渲染平台、作曲神器、三大软件开源工具
(左边的狮子没有使用 AI,右边的狮子使用了 AI,对比比较明显)

除了这颗重磅鱼雷,其他酷炫的产品和平台也得以在大会上展示,包括用于图像渲染的 Xeon 平台,演讲者现场演示 3D 动画渲染的狮子,效果非常逼真。

在现场,英特尔还 DEMO 了一段用计算棒来供能的 AI 作曲。这款 USB 计算棒是英特尔此前推出的基于 VPU 的神经元计算棒,将所有的功能封装到了 U 盘大小的设备中,用户只需要将计算棒插入 USB 2.0 接口里,就可享用机器学习的强大功能。

在软件工具方面,英特尔介绍了三大软件开源工具:nGRAPH 平台、BigDL 大数据开源平台、OpenVINO 开源软件工具。其中 nGRAPH 平台支持主流的 AI 开源框架如 TensorFlow、CNTK、Caffe2 等,还能支持英特尔所有硬件;BigDL 大数据开源平台,让用户可以轻松、简单地在大数据集群中进行深度学习应用;OpenVINO 开源软件工具可以让开发者更简单地在边缘设备上部署视觉计算和深度学习能力。

此外,英特尔还宣布其将成为 2020 年东京奥运会的 AI 平台合作伙伴,继东京奥运会的 5G、无人机等合作伙伴之后,英特尔又增加了一个新的身份。
Nervana 这张“王炸”,能干过英伟达?

在此之前,英特尔通过自己的 Xeon Phi 架构与英伟达开始了争夺机器学习市场的战争,这款产品使用数十个 Atom 核加速 ML 任务。然而,英特尔想必是意识到了单靠 Phi 这一款产品无法与每年在产品性能上都有飞跃的英伟达 PK。因此,这家公司开始寻找其他出路。在 FPGA 方面,英特尔收购了 Altera,为发展嵌入式视觉处理器收购了 Movidius,并买下 MobilEye 开发自动驾驶芯片,到拿下 Nervana 攻克专用神经网络处理器,英特尔在英伟达的重压之下流露出的求生欲可以说是非常强烈了。此外,英特尔还开始自研专用 GPU,并着手研发神经形态和量子计算芯片。

“买买买”成了这家 PC 时代巨无霸布局 AI 的最常用手段之一。

2016 年 8 月,英特尔投入巨资收购了深度学习创业公司 Nervana Systems,成交金额约为 4.08 亿美元,这对于当时只有 48 名员工的 Nervana Systems 来说可以说价值不菲。

(从左至右为英特尔数据中心主管 Diane Bryant,  Nervana 联合创始人 Naveen Rao、Arjun Bansal、Amir Khosrowshahi 和英特尔副总裁 Jason Waxman )

Nervana Systems 是一家创立于 2014 年,位于圣地亚哥的创业公司。该公司的三位创始人 Arjun Bansal、Naveen Rao 和 Amir Khosrowshahi 在高通公司工作时认识,其中 Naveen Rao 在被收购之后成为日后英特尔整合的人工智能产品事业部(AIPG)负责人。

从被收购那一天起,Nervana 就被英特尔当成攥在手里的一张王牌,想要以此对抗在性能提升方面又如神速的英伟达。2017 年 3 月,Nervana 以及其他英特尔内部的人工智能相关业务和资源被整合进一个部门,即人工智能产品事业部(AIPG),包括 Xeon、Xeon Phi、Nervana 和 Altera 四个部分,这个新部门将整合公司的资源,包括工程、实验室、软件等等,打造英特尔 Nervana 平台——既有包括 Nervana 云计算服务、数据库、又包括 Nervana 专用芯片。该部门 Nervana 的联合创始人、前 CEO Naveen Rao 来领导,直接向英特尔 CEO 科再奇汇报。

在整合了 Nervana 的技术之后,英特尔 AIPG 于 2017 年推出 Crest 家族系列产品线。首先亮相的是一款叫做 Lake Crest 的芯片,它是专为训练 DNN 而深度定制的 ASIC 解决方案,2018 年上市量产。据 Naveen Rao 曾经对媒体介绍,相对于当时最快的 GPU, Lake Crest 的加速性能是它的 10 倍。但是至今为止,这款产品除了引起大家无尽的猜测之外,并没有引起多大的浪花,属于还处于沉默中的“鱼雷”。这个雷会在投入市场之后炸响?还是成了一颗“哑雷”?

大会上没有给出更多关于 Spring Crest 的其他信息,但据英特尔 AI 产品组硬件副总裁 Carey Kloss 称,第二代的谷歌 TPU 性能相当于英特尔的 Lake Crest,而最近推出的第三代谷歌 TPU 则与 Spring Crest 颇为相似。

根据他的说法,我们找到了 Carey Kloss 宣称与之对标的谷歌 TPU 3.0 的性能路线图:
据介绍,TPU 3.0 的计算能力较高可达 100PFlops(每秒 1000 万亿次浮点计算),是去年第二代的 8 倍还多,作为对比,包含 16 颗英伟达 GPU 的芯片群的计算能力为 2 petaflops。因此,有人称第三代 TPU 有望取代英伟达 GPU AI 芯片。

对比一下,Spring Crest 与 TPU 3.0 相当,那就是还有机会和英伟达 GPU 一搏了。

但正如 TPU3.0 发布之后遭遇到诸如 Facebook、微软等入局 AI 芯片的科技巨头一样,Spring Crest 的性能有没有优势,能不能拧过英伟达的“大腿”还是个未知数。在 5 月 7 日开幕的微软 Build2018 大会上,微软 CEO Satya Nadella 发布了 Project Brainwave 预览版,并称延迟比 TPU 低 5 倍。看来各个入局的参与者都在憋着招你追我赶,当年 PC 时代的霸主能不能靠新产品扳回一局,真的还很难说...

对于不差钱的英特尔到处买买买的做法,英特尔称此方法是对人工智能的“全面进发战略”。然而,这家公司显然是想要避免把宝全押在单一框架上,就像之前对 Phi 的过度依赖导致其在机器学习市场上与英伟达的差距越来越远一样。但另一方面,这种分散式的战略不免让开发者困惑,因为他们不知道长远来看,英特尔会对哪项技术会投入最多的精力,可能连英特尔自己都搞不清楚吧。

英特尔能不能追上英伟达的脚步呢?现在看来,英特尔似乎要重点将 Nervana 推销给 ML 研究者,也许是因为这是一款可以直接与英伟达竞争的产品吧(至少在英特尔的专用 GPU 面世之前)。

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-10-17 09:51 , Processed in 0.122743 second(s), 24 queries .