数据资产不是数据产品

日期:2024/6/14 17:15:46 作者: 浏览次数:52 分享:

概述

大多数数据产品的定义都将其与数据资产混为一谈。使数据资产成为数据产品的主要因素是它所处的位置:数据市场。

如果说我们的行业有一件事擅长的话,那就是为现有的东西编造新的术语。最新的是“数据产品”。如今,许多人用这个词来描述数据资产:数据集、SQL查询、仪表板、报告、ML模型或数据组件。但这些类型的资产已经存在了几十年。那么,为什么要改名呢?

我想“数据产品”这个词听起来比“数据资产”更重要、更有价值。或者,数据产品听起来像是一个复杂的数据团队生产的东西,或者可能是因为数据现在是产生收入的真实数据产品的内在组成部分。不管是什么情况,我们都不应该仅仅因为数据资产很时髦就把它称为“数据产品”。

什么是数据产品

我认为数据资产和数据产品之间有一个微妙但根本的区别。数据产品是一种数据资产,具有商店里可以买卖的所有特征。

现实世界中的大多数产品都在数字商店或实体店中找到。商店是顾客购物和卖家与顾客联系的连接点,消除了买卖之间的摩擦。在到达商店之前,产品只是资产或库存。一旦进入商店,产品就具有促进购物过程的某些特征:它们是标准化的、包装好的、可购买的、可交付的和可退货的。

我相信数据产品也是如此。数据产品在驻留在数据市场中之前只是一种资产。在那里,它获得了新的特征:SKU、唯一的元数据(订阅和交付选项)以及服务/使用条款,这些条款阐明了作为正式交易一部分的双向、有约束力的合同。此外,如果数据生产者愿意,他们可以对产品收费,或者免费赠送,如果是内部交易,则可以评估退款费用。从本质上讲,数据产品的外观、性质和行为都与当地杂货店、硬件店或零售店的任何产品相似——除了它是数字和数据产品。

数据市场使数据生产者能够轻松创建、发布和分发数据产品,也使数据消费者能够轻松浏览、评估、比较和获取这些产品。这里的重点是外部的,关注客户如何处理数据资产,而不是内部的,关注开发人员如何构建数据资产、管理人员如何管理数据资产或IT人员如何监控数据资产。公司应该像数据产品一样严格地构建数据资产。正确的数据资产是数据产品的先决条件,但数据资产只有在数据商店的数字货架上(或供应商的价目表上)才能成为数据产品。从本质上讲,数据产品是由其交易性质及其驻留和使用决定的。

内部数据商店的作用

大多数人都熟悉亚马逊、Snowflake和商业数据提供商运营的公共数据市场,如Corelogic、Acxiom和LiveRamp。这些服务的目的主要是推广数据代理的商业数据产品。但它们不能满足大多数希望在内部广泛共享数据资产的组织的需求,也许也不能满足外部的需求。我们的行业真正需要的是内部数据商店,使内部数据生产者能够轻松创建和发布数据消费者可以找到和使用的数据产品。

如果没有内部数据商店,数据所有者就会被数据请求淹没,这些数据请求会占用宝贵的时间和资源,并在宝贵数据资产的交付和消耗方面造成巨大延迟。数据商店扩展了对核心数据资产的访问,同时消除了需要数据所有者审查数据请求以确保数据安全的手动且耗时的过程。数据生产者在没有人为干预的情况下创建一次数据产品并多次分发。数据消费者浏览、评估和获取数据产品,而无需请求许可和等待交付。

在理想的世界里,你不会有阻碍数据自由流动的组织边界,无论是内部还是外部。尽管许多组织建立了数据自由共享的文化,即使是与外部客户和值得信赖的合作伙伴共享,但大多数组织都没有。安全、隐私和风险问题往往会对组织内部和组织之间的数据共享造成巨大障碍。因此,我认为,任何想要实现数据驱动的组织都需要一个内部数据商店或数据市场,在那里它可以发布和共享其数据产品。

数据产品与数据资产

由于数据产品位于数据商店中,因此它包含数据资产所没有的事务元数据。要发布数据产品,数据产品经理需要定义订阅和交付选项、服务条款、访问权限以及SKU或产品编号。这些元数据有助于数据消费者了解数据产品是否能满足他们的需求。

数据产品也有双向合约,尤其是在买卖时。如果数据生产者不遵守服务条款,他可以取消数据消费者的订阅,如果数据产品不符合产品包装中定义的期望,数据消费者可以退货。尽管数据资产可能附带服务级别协议(SLA),但数据产品需要数据合同。

另一个区别是,开发人员根据服务申请单、项目请求或体系结构需求构建数据资产。相比之下,数据产品是产品管理过程的结果,该过程包括前期产品规划,然后是产品开发、包装、治理、客户支持和培训、产品增强和产品退役。需要一个正在进行的程序,而不是一个固定时间的项目,来在数据产品的整个生命周期中生产和管理数据产品。这意味着资源和人员的长期投入,以及持续的迭代和增强,而不是组织通常分配给数据资产的内容。

下表总结了数据资产和数据产品之间的差异。

 数据资产数据产品
范围内部的外部的
使用要求相互作用交易
访问发现数据目录数据存储
获得通道即席或预定义仅预定义
元数据描述订阅
合同约束服务级别协议产品保证
管理模式项目管理产品管理

数据资产和产品之间的相似性

尽管存在这些差异,但数据资产和数据产品有更多的共同点。首先,数据资产和数据产品都是为提前记录其需求的目标受众而设计的。如果没有对客户的高度关注,数据资产和数据产品都不会被证明是有用的。

元数据。其次,数据资产具有元数据——架构、所有者、沿袭等——可以帮助客户了解数据产品是否能满足他们的需求:它的大小是否合适;它有合适的成分吗;它是否过期或过时;它来源于正确的地方吗;它是由值得信赖的开发人员在信誉良好的数据所有者的监督下组装而成,并由领先的超级用户用于构建关键任务解决方案。

管理、监控、保护和测试。此外,必须对两者进行管理、监控和保护,以在目标受众中建立信任,并且必须对其进行持续的测试和监控,以确保可交付成果满足客户的期望。它们都可以是业务人员或技术人员用来组装支持业务需求和目标的应用程序或整个解决方案的构建块。

结论

有些人将数据产品定义为具有定义明确的元数据、严格的治理、系统的测试或持续监控的数据资产。这些都是数据产品的重要特征,但同样适用于数据资产。将数据资产转变为数据产品的唯一方法是其在数据商店中的可用性,这要求数据资产包含有关订阅和交付选项的元数据,以及数据消费者和生产者之间的双向合约。

 

(来源:数据驱动智能)