您现在的位置:首页 >> IT >> 正文
NVIDIA针对大规模数据分析和机器学习推出RAPIDS开源GPU加速平台
发表时间:2018年10月12日 11:39 来源:新科技 责任编 辑:麒麟

HPE、IBM、Oracle、开源社区、创业公司采用RAPIDS,显著提升端到端预测数据分析能力

NVIDIA今日发布了一款针对数据科学和机器学习的GPU加速平台,该平台已为多个行业领先者所采用,并能帮助超大规模公司以前所未有的速度分析海量数据并进行精准的业务预测。

RAPIDS™ 开源软件帮助数据科学家显著地提高了工作绩效,对于这些数据科学家来说,种种业务挑战应接不暇,其中包括预估信用卡诈骗、预测零售存货及理解顾客购买行为等等。众多公司——无论是Databricks和Anaconda等开源社区先驱还是Hewlett Packard Enterprise、IBM和Oracle等技术领袖——在GPU对数据分析的重要性方面日益达成共识,并对RAPIDS表现出越来越多的支持。

据分析师估计,面向数据科学和机器学习的服务器市场每年价值约为200亿美元,加上科学分析和深度学习市场,高性能计算市场总价值大约为360亿美元。

“数据分析和机器学习是高性能计算市场中最大的细分市场,不过目前尚未实现加速,“NVIDIA创始人兼首席执行官黄仁勋在GPU技术大会主旨演讲中发布RAPIDS时表示,”全球最大的行业均在海量服务器上运行机器学习算法,目的在于了解所在市场和环境中的复杂模式,同时迅速、精准地做出将直接影响其决策的预测。

黄仁勋表示,“得益于CUDA及其全球生态系统以及与开源社区紧密合作,我们已创建了RAPIDS GPU加速平台。该平台已与全球最流行的数据科学库及工作流无缝整合,可加速机器学习。如同深度学习一样,我们正在不断地为机器学习提速。”

RAPIDS已为GPU加速分析和机器学习提供了一整套开源库,数据可视化即将是下一个目标。RAPIDS由NVIDIA工程师与主要的开源贡献者在过去两年的合作成果。

RAPIDS第一次为数据科学家提供了他们需要用来在GPU上运行整个数据科学管线的工具。最初的RAPIDS基准分析利用了XGBoost机器学习算法在NVIDIA DGX-2™ 系统上进行训练,结果表明,与仅有CPU的系统相比,其速度能加快50倍。这可帮助数据科学家将典型训练时间从数天减少到数小时,或者从数小时减少到数分钟,具体取决于其数据集的规模。

与开源社区开展紧密合作

RAPIDS构建于Apache Arrow、pandas和scikit-learn等流行的开源项目之上,为最流行的Python数据科学工具链带来了GPU提速。为了将更多的机器学习库和功能引入RAPIDS,NVIDIA广泛地与开源生态系统贡献者展开合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 负责人兼Apache Arrow缔造者Wes McKinney以及迅速增长的Python数据科学库pandas等等。

McKinney表示,“作为GPU加速的数据科学平台,RAPIDS是由Apache Arrow驱动的新一代的计算生态系统。NVIDIA与Ursa Labs的合作将加速Arrow核心数据库的创新步伐,并有助于大幅提升分析及特征工程的绩效。”

为了推动RAPIDS的广泛应用,NVIDIA正努力将RAPIDS与Apache Spark进行整合,后者是分析及数据科学方面领先的开源框架。

Databricks联合创始人、首席技术官兼Apache Spark 创始人Matei Zaharia表示,“在Databricks公司中,我们对RAPIDS在加速Apache Spark工作量方面的潜力感到非常兴奋。我们目前开展的多个项目都意在将Spark更好地与本地加速器进行整合,其中包括借助Project Hydrogen实现的Apache Arrow的支持以及GPU调度。我们相信,就扩大我们客户数据科学及AI工作量来说,RAPIDS将是全新的、振奋人心的机会。”

广泛的生态系统支持及应用

各个行业技术领先的企业均是NVIDIA GPU加速平台及RAPIDS的率先应用者。

沃尔玛执行副总裁兼首席技术官Jeremy King表示,“NVIDIA的GPU加速平台及RAPIDS软件极大改进了我们使用数据的方式,帮助我们实现了复杂模式大规模地运行,同时进行更加精准的预测。RAPIDS的应用得益于NVIDIA和沃尔玛工程师之间的深度合作,我们准备继续推进这种合作关系。”

此外,一些全球领先的技术公司也力图通过全新的系统、数据科学平台和软件解决方案支持RAPIDS:

“HPE致力于改进客户生活和工作的方式。人工智能、分析和机器学习技术能在揭示洞察方面扮演关键的角色,这有助于帮助客户实现突破性的成果,同时改善我们所生存的世界。HPE提供全面的人工智能和数据分析解决方案并在市场中保持独一无二的优势,其中既包括战略咨询,也包括专为特定需求开发的GPU加速器技术、运行支持以及强大的伙伴生态系统;我们旨在为每位客户定制合适的解决方案。我们对与NVIDIA在RAPIDS方面的合作感到非常兴奋,此举能加快数据科学和机器学习的应用,推动我们的客户更快地实现更具洞察力的成果。”

— 惠普企业首席执行官Antonio Neri

“IBM已为企业人工智能构建了全球领先的、在任何部署模式上均能运行的平台。我们期望能拓展与NVIDIA已有的成功合作,利用RAPIDS来为客户提供全新的机器学习工具。”

— Hybrid Cloud高级副总裁兼IBM Research董事 Arvind Krishna

“当今的计算领域要要强大的处理能力,以便应对数据科学和分析智能等纷繁复杂的工作,而这正是NVIDIA GPU的优势。RAPIDS正在不断加速处理和机器学习培训的速度。能在Oracle Cloud Infrastructure上支持这套全新的开源软件让我们感到非常兴奋,我们也希望能与NVIDIA继续合作,以在我们的Oracle Data Science Cloud等各种平台上支持RAPIDS,并进一步加速客户端到端数据科学工作流。RAPIDS软件在Oracle Cloud上无缝运行,这使客户得以支持各种高性能计算、人工智能和数据科学需求,同时利用Oracle Cloud Infrastructure 上可获得的GPU实例组合。”

— Oracle Cloud Infrastructure软件开发部门高级副总裁Clay Magouyrk

本新闻稿得到包括Cisco、DELL EMC、联想、NERSC, NetApp, Pure Storage, SAP和SAS等其它领先创新者以及诸多数据科学先驱的支持。

供货

全套RAPIDS开源库现在即可在http://www.rapids.ai上获得,代码经Apache许可公布。容器化RAPIDS版本现在即可在NVIDIA GPU Cloud container registry上获得。

关于NVIDIA

NVIDIA(纳斯达克:NVDA)于1999 年发明了 GPU,这极大地推动了 PC 游戏市场的发展,重新定义了现代计算机图形技术,并彻底改变了并行计算。超级近,GPU 深度学习为现代人工智能 (AI) 这个新的计算时代带来了新动力 - GPU 在能够感知和理解世界的计算机、机器人和自动驾驶汽车中发挥着大脑的作用。如今,NVIDIA 的“AI 计算公司”名头越来越为人所知。更多信息详见http://nvidianews.nvidia.com/。

 

行业更多支持性引言

Anaconda 公司首席执行官——Scott Collison

“NVIDIA已经使复杂的人工智能模型的培训和部署具有可扩展性和经济可行性。NVIDIA今天发布的RAPIDS声明将同样的好处扩展到数据科学生命周期的早期数据转换阶段。Anaconda为帮助NVIDIA开发这些新功能而感到自豪,这些新功能将通过我们的公共包存储库提供给Anaconda发行版的700万用户社区。此外,我们还会将这些功能纳入Anaconda企业版,该企业版与NVIDIA DGX相结合,为企业提供一种高性能、行之有效的解决方案。NVIDIA DGX上的Anaconda企业版将使各种规模的组织能够加快数据科学和人工智能工作流程。”

BlazingDB公司首席执行官——Rodrigo Aramburu

“我们很激动能成为NVIDIARAPIDS开源软件的早期贡献者,并且已经在RAPIDS上构建了BlazingSQL,这是我们分布式GPU SQL引擎的一个免费使用版本。作为一家初创公司,我们与RAPIDS团队合作,我们与NVIDIA的伙伴关系为我们提供了巨大的价值,作为cuDF的主要贡献者加入,并将继续支持RAPIDS软件,因为我们的愿景是将数据湖(Data Lakes)与人工智能集成,全部使用SQL。”

CISCO数据中心集团产品管理副总裁——Kaustabh Das

“CISCO和NVIDIA正在NVIDIA GPU优化的CISCOUCS平台上合作开发人工智能/机器学习软件堆栈,以简化和加速人工智能/机器学习工作负载部署。我们很高兴地获悉,借助RAPIDS,NVIDIA正在通过加速的软件堆栈来扩展其GPU适用性,以解决传统的机器学习和大数据分析问题。我们期待着能够实现我们GPU加速服务器组合的可能性,包括最近推出的CISCO UCS C480 ML M5机架服务器,这是一个一流的配有8个NVIDIA V100 GPU和NVIDIA NVLink互连专用的服务器。”

DELL EMC公司服务器和基础设施系统部产品管理和市场营销高级副总裁——Ravi Pendekanti

“DELL EMC致力于为我们的客户提供世界级的IT基础设施,使他们能够获得真正的、有竞争力的商业优势。我们与生态系统合作伙伴合作,以确保我们的客户拥有最新的数据科学工具,帮助他们将数据洞察力转换为业务成果。我们的目标在于,把NVIDIA新的GPU加速的开放源数据科学软件与我们NVLink启用的Dell EMC PowerEdge服务器组合相结合,从而显著地加速机器学习和大数据分析领域的发展。”

FASTDATA.io公司创始人兼首席执行官——Alen Capalik

“NVIDIA发起的RAPIDS开源项目将彻底改变数据科学管道。在FASTDATA.io公司,我们很高兴我们的Plasma引擎——第一个充分利用NVIDIA图形处理器实时处理无限运动数据的软件——将在这场变革中发挥作用。”

乔治亚理工学院教授 ——David Bader

“乔治亚理工学院很高兴为RAPIDS作出贡献,这是NVIDIA GPU加速分析的开源平台。在这个海量数据的时代,我们对RAPIDS图形库的贡献将有助于数据科学家从不断增长的数据集中获得有意义的知识。”

Graphistry公司联合创始人兼首席执行官——Leo Meyerovich

“Graphistry公司是最早的GPU云创业公司之一,已经悄悄地为那些必须梳理金融、网络安全、运营和销售记录的敏感的F500和联邦团队带来了可视性的新高度。作为RAPIDS早期贡献者以及Apache Arrow背后的力量,Graphistry在RAPID上下了很大的赌注。该公司将可视化计算结构重新定义为浏览器和云图形处理器的实时结合,因此而闻名并且正在与RAPIDS团队合作,将下一级表格分析添加到其现有的图形GPU可视化分析核心中。”

H2O.ai公司创始人兼首席执行官——Sri Ambati

“机器学习正在改变企业并且NVIDIA图形处理器正在加速企业发展。在开源社区和客户的支持下,H2O.ai使GPU上的机器学习成为主流,并获得了高德纳的认可,成为数据科学和机器学习平台方面的领导者。NVIDIA利用RAPIDS(开源数据科学库)支持GPU机器学习社区,这是为发展GPU数据科学生态系统而作出的及时努力,也是对我们将人工智能带入数据中心这个共同使命的认可。由于了我们的合作,由NVIDIA图形处理器驱动的H2O无驱动人工智能一直呈指数型采用曲线,使人工智能更快捷、更低廉、更容易。”

 

INRIA(scikit-learn)Scikit-Learn 运营部总监——Gael Varoquaux

“NVIDIA正在用RAPIDS等新的生产力工具证明加速数据科学的真正进步。结合高级语言中的非常快速计算是数据分析团队的一项变革。我们很高兴NVIDIA已经选择使RAPIDS与scikit-learn兼容。我们相信它可以造福于我们的社区,并期待着与NVIDIA合作。”

Kinetica公司联合创始人兼首席技术官——Nima Negahban

“开源库的RAPIDS套件是一个重大改进,使数据科学家能够在他们的模型开发工具链上利用GPU的力量。RAPIDS可以极大地简化和优化培训,提高模型精度,而不需要数据科学家进行任何复杂逻辑的再设计。我们很高兴在这个过程中与NVIDIA合作,使人工智能民主化——借助NVIDIA驱动模型的开发和培训以及Kinetica对这些模型的驱动操作化和部署,使企业能从他们的数据中获得最大的洞察力。”

联想数据中心集团总裁——Kirk Skaugen

“企业客户和学术界在开发和测试新战略时,不断面临处理和分析大量数据的挑战。新的RAPIDS开源软件承诺通过在NVIDIA图形加速器上端到端运行工作流来加速工作流。我们相信,这种创新与合作将对客户产生重大影响。”

MapR公司首席执行官——John Schroeder

“RAPIDS是数据科学的一项突破性公告,更重要的是,它能够用数据科学直接影响组织。MapR通过侧重互补数据管理和部署活动来支持这项工作,以配合端到端的RAPIDS数据科学培训和模型工作流程。”

NERSC Python数据分析负责人——Rollin Thomas

NERSC支持大学、国家实验室和工业领域的7000多名研究人员。他们越来越希望通过高效、高性能的方式与来自复杂科学模拟或实验和观测设备(如粒子加速器和望远镜)的数据进行交互。我们期待着与NVIDIA合作,将新的高性能Python数据分析工具(如RAPIDS)交到我们的用户手中,以加快其在众多科学领域中的发现速度。”

NetApp公司ONTAP高级副总裁 ——Octavian Tanase

“组织必须利用新的人工智能功能来驱动竞争优势并加速数字化转型。由NVIDIA图形处理器驱动的RAPIDS与NetApp的AFF A800云连接的全闪存存储相结合,将有助于客户自信地利用不断增长的数据资源,这些数据资源具有提供、培训和操作急需数据的人工智能应用程序需要的几乎无限的可扩展性和性能。”

NumFOCUS董事会董事长——Andy Terrel

“NVIDIA对NumFOCUS的支持代表着对社区的投资。作为数据科学领域的两个领导者,我们认为我们的合作将为科学和企业等带来更好的工具。”

OmniSci首席执行官兼联合创始人——Todd Mostak

“创建机器学习模型时,数据科学家在NVIDIA图形处理加速器上使用OmniSci来加速数据探索和特性工程。现在,我们的用户可以在OmniSci中交互式地查询和可视化数据,然后将结果通过管道输入到RAPIDS的开源库中,从而实现强大的端到端数据科学工作流。此外,NVIDIA与OmniSci一起加快了在模型上构建和迭代,从而提高了准确性和加速了部署时间。”

Pure Storage公司 FlashBlade总经理——Matt Burr

“我们的客户着眼于那些将其与竞争对手分开的洞察力数据,为其终端用户提供不断增长的价值。RAPIDS扩大了NVIDIA图形处理器加速和Pure Storage公司 FlashBlade对数据科学和机器学习工作流的影响,以帮助更多的数据科学家加快其培训管道,同时为更快实现结果保持最佳的低延迟性能。  ”

Quansight公司NumPy SciPy 开创者、Anaconda联合创始人兼总监、Quansight创始人兼首席执行官——Travis Oliphant

“长期以来,NVIDIA一直是先进分析加速工具的领导者,一直免费提供高速库,供数据科学社区的开发人员使用。我很高兴看到他们扩展的数据科学开源框架及其对端到端软件和硬件解决方案的承诺。这些创新将极大地加速整个数据科学工作流程,并在更广泛的开源生态系统中发起创新。”

SAP首席创新官——Juergen Mueller

“SAP在过去几年里与NVIDIA密切合作,将GPU加速应用于众多SAP Leonardo机器学习支持的解决方案。目前我们正在进一步推进这种合作,以探索由RAPIDS提供的可能性,它承诺对GPU上的数据科学管道进行超荷充电。对于数据科学家来说,这是加速数据科学和机器学习的重要一步,因为我们通过SAP Leonardo和SAP HANA为企业带来了智能。”

SAS人工智能和机器学习的负责人——Saratendu Sethi

“我们正在与NVIDIA紧密合作,从而为新的GPU加速数据科学库做出贡献。我们期待着今后的SAS Viya产品能够利用RAPIDS,这样以来我们的客户便能更快地从他们的数据中获得有价值的见解。”

SQream公司首席执行官——Ami Gal

“NVIDIA在RAPIDS方面所做的工作为大大地加速数据科学管道的发展提供了一个激动人心的机遇。通过将大量数据中SQream DB的管道功能融入RAPIDS数据科学平台,我们期望数据科学家能够比以前更快地运行模型,并能够在更多的数据上运行模型。”

加利福尼亚大学,教授兼Gunrock项目负责人,Davis - John Owens

“我们很高兴成为RAPIDS社区的一员,并期待着与NVIDIA及其合作伙伴合作,打造性能最高、最全面的数据分析生态系统。”

高层访谈
凌动智行史文勇:品智出行, 重新定义车辆对生活的价值和意义
众所周知,手机是基础的通讯工具,车是基础的交通或者出行工具,而发动机是传统车里面非常高的..
专访张启亮:勇担工业互联推手,服务百万设备上云
近日,在第二十二届中国国际软件博览会上,徐工信息总经理张启亮向《人民邮电》报记者讲述了工..
观点态度
云计算的第二个十年:三大运营商如何迎接?
2018年,我国云计算进入第二个十年。站在国家方队里三大运营商的云计算也进入了新的发展阶段。<..
国内手机市场半年报:头部格局定型 中小品牌陷入集体焦虑
2018年已过半,回看这半年, 头部品牌的吸附效应越来越明显,中小品牌正陷入到集体焦虑中。

..
移动互联
手机
智能设备
汽车科技
通信
IT
家电
办公打印
企业
滚动
相关新闻
关于我们 | 联系我们 | 友情链接 | 版权声明
新科技网络【京ICP备18031908号-1】
Copyright © 2018 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。