炼数成金 门户 商业智能 数据分析 查看内容

原创翻译 | 查询数据差距

2018-4-24 10:36| 发布者: 炼数成金_小数| 查看: 16519| 评论: 0

摘要: 在前面的一篇文章中,我们解释了要理解数据差距,我们必须从您的战略业务目标(您想对数据做什么)开始,了解所使用的数据,分析反映您需要的数据的维度,并查看当前数据如何满足这些需求。下一步是能够直观地表示这一 ...

工具 基础 安全 商业智能 ETL

 在前面的一篇文章中,我们解释了要理解数据差距,我们必须从您的战略业务目标(您想对数据做什么)开始,了解所使用的数据,分析反映您需要的数据的维度,并查看当前数据如何满足这些需求。下一步是能够直观地表示这一点,包括描述您的业务数据需求所需的一些多维信息。这是一个强有力的方式,让高层领导参与进来,并获得资源,以便“考虑差距”。

最难的部分通常不是堵塞缺口,而是知道当你不可能一次完成所有工作时,要堵塞哪些缺口。让我们看一个说明性的例子:欺诈检测。


通过堵塞漏洞防止欺诈检测

根据信息安全媒体集团2012年进行的“欺诈面孔”调查,在82%起涉及身份欺诈的案件中,消费者先于公司发现这起盗窃案。毫不奇怪,26%的被调查机构报告说,在一起欺诈事件后,消费者被竞争对手抢走了。因此,我们的战略目标是防止欺诈。


正如 Is Your Data Holding You Back?中提到的那样,防止账户收购是应对欺诈风险的一种常见方法。在帐户接管的情况下,欺诈者获取合法客户的在线帐户凭据,其目的是滥用帐户(例如,将资金从帐户中转到自己的帐户中)。受害者感到自己受到侵犯是可以理解的,并且可能会责怪账户持有人。我们可以将防止账户收购确定为一项功能性要求,即我们的目标是防止欺诈。可能还有其他与此业务目标相关的功能需求。


让我们再深入一点,考虑如何防止账户收购。我们的理论组织有几种方法可以解决这个问题,这些方法成为我们的技术用例。其中一个用例涉及设备识别。这通常用于登录时,将笔记本电脑、台式机或移动电话的签名与合法所有者的签名进行比较,并/或将其与以前与欺诈相关的设备数据库进行比较。因此,设备识别需要客户数据和设备数据。


组织能使用设备识别吗?或者他们有数据缺口阻碍他们?因为这是从应用程序架构师的角度对数据充足性的评估(而不是,比方说,您正在为CDO提供的视图),我们将重点关注应用程序相关的维度,如宽度、深度、延迟和频率。客户和设备数据需要足够广泛,以启用必要的属性,以便将正确的信息与登录事件相关联,具有足够的深度或历史来与之相比有相当数量的已知欺诈手段,具有相对较高的刷新频率以确保信息被使用,并具有较低的延迟,以便能够在怀疑欺诈时触发适当的操作。


因此,在考虑建立设备识别能力时,我们需要评估这些特定维度-宽度、深度、频率和延迟目前是否存在差距-客户数据和设备数据都需要。我们可以通过对其他功能需求和相关用例进行相同的评估来扩展此练习,以防止帐户收购。这开始帮助人们更好地理解开始减少欺诈所需的努力。


通信数据缺口

假设您已经完成了所有重要业务目标的过程,并且已经确定了几个存在数据缺口的领域。现在怎么办?缩小数据缺口是一个复杂的多维问题。找到一种方法来管理这种复杂性是关键。要将人们的思维从“我们必须清理数据直到它是原始的”改变为“我们需要足够好的数据来解决这一重要问题”并不容易。


用视觉交流你的发现是说服你的利益相关者一个很好的方法。下面是我们经常使用的一个可视化示例,它显示了在我们的欺诈示例标识的关键维度(例如宽度、深度、频率和延迟)上是否存在空白,这将阻止这一商业目标的实现。

Visualization of data gaps

您通常会有一个更细粒度的数据类别视图,但这个示例说明了客户、设备等更大的信息类别,以及这些信息如何支持的,按优先顺序显示。在决定如何将数据分类以供评估时,需要考虑的问题如下:


什么在创建数据(例如,人、传感器、软件)?

谁在收集数据(例如,组织内部的部门,第三方)?

这是什么类型的数据(例如,非结构化、结构化、地理空间、图像)?

数据描述的是什么(例如你的客户,你的供应商,制造过程,实验室实验)?


例如,您还需要自定义四箱键(延迟、频率、宽度、深度)中所示的不同尺寸,专注于那些对你的事业有意义的事情。通过对四个维度的评估,不仅可以看到上述可爱的图形,而且我们还发现,将焦点中的维度减少到四个维度的练习有助于组织找出阻碍他们实现目标的主要障碍。


这种观点可以通过许多不同的方式来发现趋势--逐箱、逐行、逐列。

逐箱:这说明了实现一项功能所需的一项数据中的差距。例如,第一行和第一列中的框显示客户数据的宽度和深度方面的差距,用于“登录得分调优”功能。这些差距的存在是因为在足够的时间内没有从客户那里收集到足够的信息来衡量忠诚度。


逐列:这说明了数据需求对一个业务目标的影响差距。例如,任何类别的信息都不能满足业务目标“移动特定监视”的“延迟”要求。监视通常是一种实时活动,需要立即收集数据。如果移动特定监控是一种高优先级的功能,则此列表示,下一步最优先的步骤之一是构建实时处理数据所需的基础设施。


逐行:这说明了缩小一个数据源在所有业务目标上的数据需求差距的机会。设备数据是在不一致的基础上收集的;每个设备以不同的频率发送信息。以一致和更频繁的方式收集设备信息将缩小几乎所有业务目标的频率差距。此图的逐行视图可以帮助将对业务目标的影响较大的后续步骤排序。


结论

保护你的客户不受欺诈表明了你重视他们,建立你们之间的信任,并帮助双方保护底线。评估数据差距并明智地选择在哪里投资填补数据缺口是一种明智的做法。你不可能一次做完所有的事情,所以专注于你能产生较大影响的地方。


有兴趣建立你的数据策略?首先,进行我们的数据成熟度评估,看看您的立场。


英文原文:https://www.svds.com/minding-data-gaps/


欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识

QQ群:81035754


鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-6-22 05:53 , Processed in 0.193332 second(s), 26 queries .