Cloudera表示,它将整合Cloudera数据平台(CDP)和Nvidia的apachespark3.0加速库。
据Cloudera称,这种集成将加快数据管道的速度,并使向流程中添加机器学习工作流变得更容易。
Cloudera数据平台今年早些时候增加了应用学习原型(AMPs)。AMP通常在Nvidia GPU硬件上运行。
Nvidia针对apachespark的GPU加速旨在加速数据准备任务和更快地训练模型,协调从数据到训练再到可视化的管道,并节省基础设施成本。Cloudera说,GPU加速的apachespark3在CDP上本机运行,可以插入高性能计算工具。
Nvidia RAPIDS加速版Apache Spark 3.0库的公共云实现现已正式提供。夏季将提供内部集成。