从高性能计算到人工智能—GPU的加速能力得到广泛认同原创

GPU开始在超算领域崭露头角。在最新公布的2017中国高性能计算TOP 100排行榜中，已经有28套采用NVIDIA Tesla GPU，其中22套为Tesla P100。

GPU开始在超算领域崭露头角。在最新公布的2017中国高性能计算TOP 100排行榜中，已经有28套采用NVIDIA Tesla GPU，其中22套为Tesla P100。中国工程院院士廖湘科表示，今天人们借鉴GPU在超算领域的经验，已经将其引入人工智能领域。GPU的出现对人工智能新崛起起到了积极推动作用。NVIDIA副总裁暨中国区企业事业总经理沈威也表示AI现在已经变成高性能运算的一个杀手级应用。有越来越多的高性能运算中心有专属的AI超算。

NVIDIA副总裁暨中国区企业事业总经理沈威

从互联网图像、视频分类、语言识别、自然语言处理等服务到医疗领域癌细胞探测、药物发现再到安防领域人脸识别、视频监控、网络安全再到智慧交通领域行人识别、车道跟踪、交通信号识别。基于深度学习和人工智能的快速发展，人们对与计算能力的需求呈指数型增长，对于计算加速也呈现爆炸式增长。同时深度学习已经渗入到各个行业，沈威举例中国移动是中国最大的呼叫中心，有超过1.5万个话务员，他们也使用了深度学习和GPU技术大量了减轻了人工的负担。

在金融领域，平安科技采用GPU和深度学习的方法来协助自身业务。比如车险业务，你只要拿出手机拍个照传输过去，它马上就可以基于照片上拍出来的损坏状况来做定损，也是深度学习在传统行业应用的体现。这些应用背后是NVIDIA的技术创新和应用落地。

NVIDIA推出世界领先的HPC 和 AI 数据中心加速平台TESLA 平台，这个平台包括端到端的产品系列，基于深度学习训练和推理Training - Tesla P100和Inference - Tesla P4 & P40，Tesla P100 with NVLink可以为数据中心HPC and DL应用应用可扩充到多GPUs，数据中心HPC 应用混合的 CPU和 GPU作业，Tesla P100 with PCI-E，集成的深度学习超级计算机DGX-1。

在HPC 2017现场展示上，NVIDIA展示了最先进的产品和应用。

现场展示了DGX Station超级计算机，可以说是业界唯一一款专门针对个人设计的超级计算机。它采用了工作站式的设计、采用了很多新技术。在架构上采用了最新TESLA V100 GPU + NVLink，配置了4个GPU，GPU之间用最新NVLink高速带宽连接起来，性能可高达480 TeraFlops；虽然售价为69000美元，听起来比较贵但是其服务器性能大约相当于124台的CPU服务器性能，从性价比来看，还是非常有优势。设计亮点采用了水冷设计实现静音（35分贝低噪音）,这是目前业界唯一在工作站采用液冷设计的产品，非常静音，适合办公室环境。过去风冷的设计可能噪声会比较大，现在采用了水冷设计，整个机器的噪音只有35分贝，非常低，在办公室里可以很安静的工作，不会打扰我们的正常思维，这是我们设计最大的一个亮点。

而且它是专门针对深度学习这款产品不光有硬件，而且软件都预装好了，开机只要经过简单设置，就可以用Caffe、TensorFlow等做深度学习的训练，图像识别也好，语音识别也好，而无需花费大量的时间自己去配置软件、装驱动、SDK等等。

现场还进行可视化实时仿真的演示。Ansys公司和NVIDIA经历4年时间，利用CUDA制作了一款叫做Discovery Live的软件。目前，这个软件仍为技术预览版，预计明年的2月份会正式发布。

通过NVIDIA强大的加速能力，这款软件能够实现可视化实时仿真，即借助NVIDIA GPU的并行处理能力，实现传统计算仿真和可视化渲染的完美结合。

简单说就是以前只能先进行仿真模拟，在进行可视化渲染，仿真模拟过程错了还需要从头修改，现在通过强大的计算处理能力能够实现仿真模拟和可视化渲染的完美结合。以前若在验证的过程中发现设计存在的缺陷再回头修改设计，是一个重复的过程；现在，计算和可视化能够在单台工作站实现，大大提升了工作效率。

如上图所示：这个测试的是车。刚才介绍的物理场，比如测试车的风阻系数，可以加入这个模拟状态，位置的改变会调整车的风阻模拟参数：比如加入导风设计，车的风阻系数就会发生改变。

DeepStream，能够实现30路高清视频解码、实时分析和元数据提取，可以时时处理30路视频的解码，解码完了以后通过深度学习的算法提取里面感兴趣的物体，在这里可以看到这些人和这些车，提取完了以后可以做一些声音的处理。大家可以看到这个应用可以把30路视频里所有的人和车都提取出来。

最后在至顶网记者看来，NVIDIA 产品大受欢迎核心就是其具有加速的能力、因为不管是高性能计算、还是人工智能以及大数据应用，更快的速度成为其必备的要求之一，具体来讲，采用GPU对于训练和推理来说其具有大的优势，一个是训练，几十亿，上万亿的操作，GPU 可以训练大的模型，加速应用走向市场。二个是数据中心推理，每天数十亿的图像，语音，视频的查询，GPU 推理加速相应时间，使数据中心推理吞吐量最大化。

来源：至顶网存储频道

0赞

好文章，需要你的鼓励

从高性能计算到人工智能—GPU的加速能力得到广泛认同 原创

NVIDIA副总裁暨中国区企业事业总经理沈威

来源：至顶网存储频道

2017

10/30

22:37

分享

点赞

让“爆品方法论”为导航，iCAR品牌升维“有点意思”

Microchip 扩大与台积电合作伙伴关系，加强半导体制造能力

Adjust推出由AI和高级机器学习赋能的移动数据分析解决方案InSight

F5G-A全光品质运力网，联接无处不在的智能

Meta希望将Quest VR头显推向学生与教师群体

中国AIGC最值得关注企业&产品榜单揭晓！首份应用全景图谱发布

中国AIGC产业峰会：大模型引领应用新范式，微软阿里商汤揭秘新进展

中国AIGC最值得关注产品&企业榜单揭晓！首份应用全景图谱发布

大四那年，我做了一个AI产品，两个月后被Xmind收购

AWS宣布Bedrock将支持Anthropic Claude 3和Mistral Large模型

对话宇树科技陈立：我们的人形机器人，为什么会后空翻？

浪潮信息IPF24：发展人工智能+，创新需要激发活力、拓展路径、加速落地

云巨头两面下注：亚马逊云科技既要原研AI芯片，又要英伟达GPU

英特尔挑战Nvidia发布全新Gaudi 3 AI芯片 AMD积极扩大处理器阵容

重磅！维谛Vertiv加入英伟达NPN全球生态伙伴网络

极智芯 | 解读NVIDIA B100 B200 以及两个"留了一手"

极智芯 | 解读NVIDIA新一代Blackwell GPU架构 正式迈向MCM

NVIDIA 2024年GTC大会核心精华一览：AI 和 GPU 技术的最新发展

AWS CEO谈与Nvidia、Anthropic等合作伙伴打造AI新品

英伟达BLACKWELL系统如何“吃下”万亿级参数AI模型

Oracle 携手 NVIDIA在全球提供主权 AI 解决方案

HPE发布基于Nvidia GPU的生成式AI超级计算机平台

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

GPTs的Prompt是如何炼成的？

数据要素价值创新2023年度标杆示范案例

叔叔婶婶的数字“家人”们

CES 2024：万物皆可AI

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

从高性能计算到人工智能—GPU的加速能力得到广泛认同原创

极智芯 | 解读NVIDIA新一代Blackwell GPU架构正式迈向MCM