您正在处理复杂数据的 7 个迹象
我们经常谈论 复杂数据 及其为您的商业智能带来的挑战和机遇。但是是什么让数据变得复杂呢?您如何判断您组织的当前数据是否可以被视为“复杂”,或者在不久的将来会如此?这篇文章将解决这些问题。 内容 为什么这很重要? 简单测试:大数据或不同数据 决定数据复杂性的 7 个因素 一、结构 2.尺寸 3.细节 4.查询语言 5.数据类型 6.分散的数据 七、增长率 如何处理复杂的数据? 我们经常谈论 复杂数据 及其为您的商业智能带来的挑战和机遇。但是是什么让数据变得复杂呢?您如何判断您组织的当前数据是否可以被视为“复杂”,或者在不久的将来会如此?这篇文章将解决这些问题。 为什么这很重要? 数据的复杂性可能表明您在尝试将其转化为业务价值时将面临的困难程度——复杂数据通常比简单数据更难准备和分析,并且通常需要不同的 BI 工具 集 这样做。复杂的数据需要额外的工作来准备和建模数据,然后才能“成熟”以进行分析和可视化。
因此了解您的数据
当前的复杂性及其未来潜在的复杂性对于评估您的商业智能项目是否能够胜任这项任务非常重要。 简单测试:大数据或不同数据 概括地说,有两个基本迹象表明您的数据可能被认为是复杂的: 更多阅读 大数据改善 大数据提高公司内部领导力的 3 种方式 IT 不是分析。这就是为什么。 罗姆尼援引分析 电话号码列表 法斥责特朗普 2016 年达沃斯世界经济论坛:CEO 博主 100 强 悼念:罗宾•弗雷•凯里 您的数据是“大”的:由于“大数据”一词看似无限的含义,我们将“大”一词放在括号中。然而,事实仍然是,处理大量数据对处理海量数据集所需的计算资源以及区分小麦和谷壳的难度(即在大量的原始信息。 您的数据来自许多不同的来源:多个数据源通常意味着混乱的数据,或者只是遵循不同内部逻辑或结构的多个数据集。因此,必须将数据转换或整合到中央存储库中,以确保您的来源都使用同一种语言。 这些可以被认为是两个(备用)初始警告标志:如果您正在处理大数据或不同的数据,您应该开始将您的数据视为 复杂的。
但为了更深入地研究
这里有七个更具体的组织数据复杂性指标,实际上是上述两个指标的更详细版本。 (请注意,有一些相似之处,当然不排除另一个——相反,例如,分散的数据通常意味着多种数据结构和类型。) 决定数据复杂性的 7 个因素 是什么让数据变得复杂?资料来源: 揭秘数据建模 (网络研讨会) 一、结构 来自不同来源的数据,甚至来自同一来源的不同表格,通常可能引用相同的信息,但结构完全不同:例如,假设您的人力资源部 文本服务 门有三个不同的电子表格,一个用于员工的个人详细信息,另一个用于他们的角色和薪水,三分之一是他们的资格等——而您的财务部门在一个表中记录相同的信息,以及保险、福利和其他成本。此外,在其中一些表中,可能会用全名提及员工,在其他表中可能会用首字母或两者的某种组合来提及员工。 要有效地使用来自所有这些不同表的数据而不丢失或重复信息,需要数据建模和准备工作。这是最简单的用例:使用非结构化数据源(例如 NoSQL 数据库)会使事情进一步复杂化,因为最初这些数据源没有适当的模式。