树液 wants to embrace all your data stores with Data Hub

树液旨在将您的数据保留在找到的位置,仅集中处理而不是存储

20160224股票MWC树液摊位标志100647700 Orig
Stephen Lawson

如果数据仓库用于整理数据(将信息打包成整洁的推理,分类并堆叠,其余信息则丢弃),而数据湖用于收集器(提示所有内容,您永远不知道有什么用处),那么SAP的新Data Hub可能适用于我们其余的人。

这是一个新的数据管理工具,旨在仅处理所需的数据,并在创建或存储数据的地方查找数据,而无需将所有数据都放在一个地方。 

数据科学家将能够使用它来分析来自多个来源和系统的数据。

[找出 首席信息官需要了解的关于数据湖的5件事。 |拿一个 深入了解Microsoft Azure的数据湖。 |获取最新的见解 订阅CIO Insider每日新闻通讯。 ]

树液数据库和数据管理销售全球负责人Irfan Khan说:“数据中心是强大的数据管理保护层,可用于数据集成,数据处理和数据治理。”

“它使我们能够查看您拥有的所有数据,并访问所有信息。但是,它并没有希望将所有这些数据集中在自己的数据湖中;它只是在捕获数据并在哪里访问数据。它今天就存在。”汗说,该产品将于周一发布。

虽然企业数据中心的概念已经存在了一段时间,但SAP所使用的术语与大多数术语有所不同: 地图 或者 Cloudera 在处理之前将所有数据导入巨型Hadoop集群或其他中央存储库中,SAP打算将数据留在原地,直到需要时再使用。

它将通过 创建数据管道 —由可重用,可配置的操作组成的数据流,用于处理从各种来源(包括CSV文件,Web服务API和商业云服务)以及SAP自己的数据存储中提取的数据。这些操作可以是不同文件系统或API,分析或机器学习库(例如TensorFlow)或自定义编码任务的连接器。

树液提供了用于对工作流和管道进行建模的图形工具,以及用于在发生故障时调用作业以及重新启动或回滚任务的业务流程层。这可以代替工作流计划系统,例如 阿帕奇·奥兹(Apache Oozie)汗说。 

他说,流水线的执行可以下推到其他平台,例如SAP的Vora计算引擎。

他说,Data Hub不需要在SAP上建立公司就可以工作:它还可以与第三方产品集成。他说:“您不需要使用SAP的ETL处理,您可以使用Informatica。”或者也许是开源的Kafka消息传递层。

现在可以普遍使用SAP Data Hub,但是要花多少钱?不可避免地,与大多数企业软件一样,这取决于。

据SAP发言人称,定价基于SAP Data Hub管理的整个系统和计算节点。它还需要获得SAP内存数据库引擎HANA的许可证。拥有现有HANA许可证的客户可以使用它们(如果它们具有足够的容量)。没有HANA许可证的客户可以购买少量的HANA容量,以确保满足Data Hub的运行时需求。

有关SAP的更多信息:

版权© 2017 IDG通讯,Inc.