在 GTC 大会上,Nvidia CEO 黄仁勋宣布 Nvidia GPU 已经支持由 Google 孵育的
Kubernetes 容器编排系统了。

OpenStack Queens
平台于2月28日正式发布,这是该开源云平台的第17版。OpenStack Queens
增加了多项新功能,也优化增强了多项旧功能,包括虚拟 GPU( vGPU
)支持和容器集成的改进。几个新项目也在 OpenStack Queens
这一里程碑中露面,包括提供管理硬件和软件加速资源框架的Cyborg
。本文正文中围绕新功能、vGPU、Cyborg、容器、LOCI,以及接下来的版本
OpenStack Rocky 等几个方面对Queens
进行了整体介绍。此外在文末,开源云中文社区还特别邀请了 OpenStack 
基金会独立董事郭长波为各位粉丝做精彩点评。

澳门葡萄京官方网站 1

澳门葡萄京官方网站 2

澳门葡萄京官方网站,正文

据9月13日消息,在北京时间今天上午举行的GTC2018日本站上,英伟达首席执行官黄仁勋介绍了该公司在AI方面的最新进展,宣布了一系列新产品,其中包括NVIDIA
TensorRT 超大规模平台、NVIDIA Drive AGX Xavier开发套件以及Jetson AGX
Xavier开发套件等。

据称,这么做是为了优化 GPU
在超大型数据中心的使用,在这类环境中,你可以使用成百上千的 GPU
来加速机器学习的过程,且允许开发人员将这些容器带到多个云中,而无需做任何更改。

2018年,OpenStack
已被包括沃尔玛在内的大型组织广泛使用,并成为了多个云供应商的底层基础设施,其中包括
IBM 和 Oracle 的云平台。

现场还补充介绍了英伟达于不久前分别发布的新Quadro RTX和新Geforce
RTX。据介绍,富士公司成为日本第一家采用NVIDIA DGX-2
AI超级计算机的公司,它将用于加速医疗保健和医疗成像系统等领域的AI技术的开发,以及用于显示器的高功能材料等。

黄仁勋说道:“现在我们已经有了所有这些加速框架和代码,那么,我们如何将它们部署到数据中心的世界中呢?事实证明,Kubernetes
可以做到这些!这真是一件让人高兴的事。”

OpenStack Queens 的发布延续了2017年8月推出的 Pike
版本,增加了更多的新功能。“ Pike的特色是以运维为导向的工作比例更高。” 
OpenStack 基金会执行总监Jonathan Bryce 此前表示。

英伟达在本次GTC2018日本站上宣布的新产品具体有:

澳门葡萄京官方网站 3

OpenStack Queens 发布了多项新功能,一些旧功能也获得了增强,包括虚拟 GPU
( vGPU ) 支持和容器集成的改进。几个新项目也在OpenStack Queens
这一里程碑中露面,包括提供管理硬件和软件加速资源框架的 Cyborg 。

NVIDIA TensorRT超大规模平台

Nvidia 为 Kubernetes 开源社区贡献了自家的 GPU
增强功能。对于机器学习,不管是所需的计算还是驱动所需要的数据,工作量往往都很大。而
Kubernetes
可以协助编排这些工作负载,并且,在本次更新中,协调器已经可以识别 GPU。

OpenStack Queens
的改进不仅有利于具有关键任务工作负载的企业,而且还有利于投资于容器、NFV、边缘计算和机器学习等新兴用例的机构。

英伟达今天推出了一个全新的人工智能数据中心平台——TensorRT超大规模平台,能够为语音、视频、图像和推荐服务提供推理加速解决方案。该平台可为端到端应用提供最快性能和更低延迟,使超大规模数据中心能够提供新的服务,例如增强型自然语言交互,以及对搜索查询的给出直接答案而非模糊匹配的一系列结果。处理查询的速度比仅采用CPU时快40倍。NVIDIA预计AI推理行业有望在未来五年内平稳增长至200亿美元的市场。

黄仁勋还表示:“Docker 容器现已获得 GPU
加速能力,我讲到的所有这些框架、推理的工作负载、所有云,都可以 GPU
加速。”

“我们现在看到的市场,最重要的事情是人们希望用云部署做更多的事情。” 
OpenStack  基金会首席运营官  Mark Collier  表示 ,
“机器学习、人工智能和容器等新工作负载大量涌现,Queens
版本中有很多为这些用例提供的功能特性  。”

NVIDIA
TensorRT超大规模平台包括一整套硬件和软件产品,这些产品针对强大、高效的推理进行了优化。关键要素包括:

原文:TechCrunch 
编译:开源中国

新功能一览

NVIDIA Tesla T4 GPU——搭载320个Turing Tensor Core和2560个CUDA
Core,这款全新GPU具有突破性的性能,以及灵活的多精度功能,从FP32到FP16再到INT8及INT4。它采用高能效的75瓦小型PCIe封装,可轻松适用于大多数服务器。FP16的峰值性能为65
teraflops,INT8为130 teraflops,INT4为260 teraflops。

Queens 发布了一些强大的面向企业的功能,其中最引人注目的是 Cinder 中的
Multi-Attach 功能。

NVIDIA TensorRT 5——推理优化器和运行时引擎,NVIDIA TensorRT
5支持Turing Tensor
Core,并对适用于多精度工作负载的神经网络优化集进行了扩展。

Cinder Multi-Attach 使运维者能够将相同的Cinder 卷加载到多个 VM
中。如果一个节点关闭,另一个节点能够接管并访问该卷。这种支持关键任务工作负载的高可用性(HA)是云环境中最受欢迎的功能之一,但迄今为止仍然是计算机领域的难题。

NVIDIA
TensorRT推理服务器
——这一容器化的微服务软件使应用能够在数据中心生产中采用AI模型。其在NVIDIA
GPU
Cloud容器注册中免费提供,可实现数据中心吞吐量和GPU利用率的最大化,支持所有常用AI模型和框架,并集成了Kubernetes和Docker。

Queens
新版本还包括了多项增强功能,以支持新兴的用例,如机器学习、NFV、容器集成和边缘计算。

NVIDIA AGX系列

支持 vGPU( 虚拟图形处理单元 )——在 Nova 中,vGPU
支持让云管理员定义风格以请求 vGPU
的特定资源和分辨率。最终用户可以启动具有 vGPU
的虚拟机,这对于图形密集型工作负载以及许多科学性的、人工智能和机器学习的工作负载来说是一项重要的能力。

英伟达今天还宣布了其AGX阵容,这是英伟达基于Xavier的产品系列的新名称,这些产品专为从机器人到自动驾驶汽车的自动机器系统而设计,嵌入了AI
HPC。今天推出的是Nvidia Drive AGX
Xavier开发套件,这是一个用于构建自动驾驶系统的平台。这种开放、可扩展的软件和硬件解决方案使公司能够无缝地开发和测试定制的自动驾驶技术,简化生产。Nvidia还提供类似的Clara平台,专为医疗应用而设计,作为疾病早期检测、诊断和治疗的新工具。

Cyborg——Cyborg是用于管理硬件和软件加速资源(如
GPU、FPGA、CryptoCards和DPDK /
SPDK)的框架,在Queens发布中首次亮相。加速已经成为一种必要,特别是对于有
NFV 工作负载的电信公司而言。通过 Cyborg
,运维者可以列出、识别和发现加速器,连接和分离加速器实例,安装和卸载驱动。它也可以单独使用或与
Nova 或 Ironic 结合使用。

Jetson AGX Xavier开发套件

Ironic Rescue Mode—— 之前在 Nova 中可以实现虚拟机实例修复,现在 Ironic
中可以实现裸机实例修复。运维者现在可以对错误配置的裸机节点进行故障排除,或从诸如
SSH 密钥丢失等问题中恢复——这是 Ironic
的生产使用率在2017年4月至11月之间从9%跃升至20%之后的重要功能增强。

英伟达今天宣布推出Jetson AGX
Xavier开发套件,部分日本的工业和制造商率先开始使用该新系统。作为世界上第一台为人工智能,机器人和边缘计算而创建的计算机,Jetson
AGX
Xavier的大规模计算性能可以处理对下一代机器人至关重要的测距、定位、测绘、视觉和感知以及路径规划。同时黄仁勋在今天GTC大会上介绍到,雅马哈汽车公司将选择NVIDIA
Jetson AGX Xavier作为开发系统,为其即将推出的自动机器系列提供动力。

Kuryr CNI Daemon—— OpenStack
是在私有云中部署容器的首选平台,社区继续扩展Queens 的微服务功能。Kuryr
增加了一个 CNI守护进程来增加 Kubernetes 运维的可扩展性。为了支持 HA、CNI
守护进程监视 pod 事件,无需为每个事件等待 Kubernetes API
。即使控制器关闭,也可以创建 pod 。

文章来源:网易智能

边缘计算支持 —— 两个新项目 OpenStack-Helm 和 LOCI 支持边缘计算应用。

Zun容器服务—— Zun 是一个新的 OpenStack项目
,它允许用户无需管理服务器或集群即可快速启动和运行容器。它通过与 Neutron
、Cinder、Keystone 和其他核心 OpenStack
服务集成,无缝地将先进的企业网络、存储和身份验证功能添加到容器中。

OpenStack 基金会首席运营官 Mark Collier 表示:“
在云初期,用例相当狭隘,但今天云用例的范围已经扩大到大量的工作负载。就像云范围的发展一样,OpenStack
平台也在不断发展。Queens 版本中的 vGPU
和容器增强功能解决了用例范围的两端问题,并展示了OpenStack
具有支持不断变化的开放式基础设施需求的灵活性和能力。“

Queens 发布还包括增强可管理性、弹性和用户体验的工具。

运维者会喜欢的新功能包括:

OpenStack-Helm——该新增内容提供了一系列Helm chart 和工具,用于在
Kubernetes 之上管理 OpenStack 的生命周期,并将 OpenStack
项目作为独立服务运行。

注册和文档策略——在大多数 OpenStack 项目中,基于角色的访问控制( RBAC
)策略现在存在于项目代码中( 而不是作为项目源中的单独文件
),从而提供更好的关于服务策略的通信以及为 RBAC
策略设置更多的粒度默认值。

HOT拖放 —— Horizon 添加了一个插件,可以通过 Horizon
仪表板上用户体验友好的拖放 UI来创建 Heat 编排模板。

LOCI —— 又一个首次亮相的项目。LOCI 生成Open Container Initiative 兼容
OpenStack 服务的镜像,可以放入像 OpenStack-Helm
这样的重量级部署工具,或者单独使用,来交付像Cinder块存储这样的独立服务。

vGPU

在 OpenStack Queens 中搭载的一个新功能是vGPU 支持。vGPU 支持包含在
OpenStack Nova 计算项目中。

“ vGPU 能力建立在 Nova placement 服务的基础上。” Byrce说。

Nova placement 服务是 OpenStack
中的一个动态库存系统,用于跟踪可用于部署的资源。vGPU功能与硬件相关,目前可与
Nvidia Grid vGPU 和 Intel GVT(图形虚拟化技术)配合使用。

“ 一个 GPU 可能拥有数千个内核,很多公司想要的是一组不同的 GPU
服务器,它们可以在不同的工作负载之间划分。到目前为止,这并不是可以简单地以多租户方式进行管理的。”Bryce说。

Cyborg

新的 Cyborg
项目来自电信领域,它提供了各种加速的通用框架(而不是GPU特定的)。 Byrce
解释说,Cyborg 可以利用物理 GPU 、FPGA
(现场可编程门阵列)或其他类型的加速器。

OpenStack 已经有了 Ironic Bare Metal
服务,可以让云端运营商直接访问物理硬件资产。Cyborg 是 Ironic 的补充。

“它们都是直接管理硬件的工具。”Bryce说,“ Ironic
以管理整个服务器为中心,而 Cyborg 则从硬件功能的视角来加速。”

容器

OpenStack Helm 项目是 Queens 发布的另一个新动作。 Helm
是一个很受欢迎的开源项目,可以作为 Kubernetes 容器编排系统的包管理器。

OpenStack Helm 加入了其他多项工作,包括旨在为 OpenStack
服务提供某种形式的配置和部署管理功能的 OpenStack-Ansible 。

“ OpenStack Helm 和 OpenStack Ansible 的相似之处在于它们都是帮助管理
OpenStack 服务的工具,但它们采用不同的方法。”Bryce说。

Helm 将 Kubernetes 用于其生命周期管理方法,是一种容器原生方法。
Byrce指出,有些机构更愿意使用 Ansible 提供的配置管理工具。

LOCI

轻量级开放容器计划(LOCI)项目是加入 OpenStack Queens
平台的另一项新工作。OCI是云原生计算基金会(CNCF)规范,为容器运行时创建行业标准。
LOCI提供了现有OpenStack
Kola项目的一种替代方案(为每个容器镜像提供一个更完整的打包方法)。

“LOCI 采取的方法更符合 Kubernetes
运行镜像的方式,其中容器本身非常小,管理位于容器外部。”Bryce说。

接下来的Rocky

随着 OpenStack Queens 的推出,下一个版本即 OpenStack Rocky
版本的开发工作开始。尽管处于开发周期的初期阶段,OpenStack Rocky
中可能包含一些事项。

可能包含在 Rocky 中的功能之一就是 Fast Forward
Upgrade,它将使运维者能够更轻松地更新到 OpenStack
新版本。目前,从一个OpenStack
版本只能更新到下一个后续版本。例如,OpenStack Pike 可以更新到 Queens
,但无法直接更新到 Rocky 。

“通过快速更新,可以跳过不止一个版本。” Collier 说,“
更新对于用户来说一直是一个痛点,因为不是每个人都喜欢每六个月就更新云平台。”

董事点评

 Queens 版本项目 update 亮点不少

OpenStack  第17 个版本 Queens
近期发布,其中有很多大家期待已久的功能:不断完善硬件加速功能,包括 Nova
libvirt driver 支持vGPU instance(实验性质),以及管理加速硬件如 FPGA,
GPU 的 Cyborgd
等的快速发展,都将满足日益增长的机器学习、人工智能领域市场;Nova libvirt
driver支持multi-attach 功能,将为使用共享 volume
的上层服务提供便利,比如可以简化文件共享服务Manila 的HA机制; Ironic
支持rescue/unrescue API 将方便对 BareMetal  的管理;  Cinder 
支持更多的类型的硬件存储设备,完善 multi-attach 管理.
所有项目详细功能更新和 BugFix 请见各个项目的 release
notes   。

核心基础组件可组合性扎实推进

Pike 版本发布中,重点提到一些基础组件如Keystone、Neutron、Cinder
等可以被非OpenStack 项目如 Docker/ Kubernetes  单独使用,扩大了
OpenStack
项目的使用范围,没有哪种技术可以解决所有的问题和满足客户的要求,基于开源技术栈的,适合客户需求的组合才具有长久的生命力,在过去的一年里基金会持续投入资源与其它开源社区协作,构建开源技术生态.比如加强Kubernetes
openstack provider,与OpenNFV 的集成测试,

唯一不变的是变化,经过近8年的发展,OpenStack
变得越来越成熟,在过去的一年里,OpenStack 采用率年增长率95%
,积极适应新的技术潮流比如云原生应用,从缩短需求反馈路径的组织形式 SIG,
到与其它开源社区密切协作,不断扩大管理项目范围,聚焦客户价值,从 Data
Center Infrastructure, 到 Container Infrastructure, CI/CD Infrastructure
, Edge Computing
Infrastructure。中国作为OpenStack增长最快的市场,基金会会员超过一半是中国企业,我将与各位华人董事一起努力,从PTG/Summit
举办地等具体问题上入手,让中国公司和个体的诉求变成真正的行动.

——  OpenStack 基金会独立董事郭长波