搜索 | 会员  
数据可视化并不是数据分析
来源: 51cto   作者:  日期:2017-7-26  类别:大数据  主题:可视化  编辑:竹花夜如玉
可视化工具专注于报告数据而不是分析数据,因此它们只使用限制性平台来限制每个公式可以输入的聚合数。

商业智能解决方案对于一些企业来说,可能是一个欺骗性的解决方案。许多企业声称商业智能软件解决方案实际上只能提供所需功能和效果的一半。

重要的是区分两种类型的业务分析和智能工具:端到端解决方案和仅是前端的解决方案。端到端解决方案由平台后端组成,基本上是处理准备所有数据的工具和算法,以及创建数据可视化和仪表板报告的前端。

虽然人们喜欢看到其数据易于处理可视化,但只有这样的平台还不足以从企业的数据获得真正的见解。使用数据可视化工具,从他们的名字可以想象其作用,人们没有所有的初始,背景阶段的准备和加入的数据。这意味着用户需要首先具有可以送入软件的数据,即预先制作的中央数据库。

当涉及企业需求时,这两种类型的软件之间的区别是显而易见的。人们需要明白的是,可视化虽然很重要,但不能成为强大的商业智能软件的唯一组件。

了解背后的故事

采用仪表板非常简单,因此,大多数用户将清理和链接进入业务报告的大量的数据这些所有在幕后进行的工作视为理所当然的工作。随着质量较差的数据在许多不同的平台和数据库上传播,必须进行工作以创建从其开始分析的基础。在一天结束时,准备数据分析可能需要一个典型项目的80%的时间。

为了有效分析的目的,工作人员首先需要把所有的数据放在一个中心位置,希望能够更新和更改它,同时仍然能够使用相同的数据源。然而。如今为业务创建数据存储库不是那么简单。

企业用于收集数据的大量平台和软件工具(从Excel到Salesforce,从GoogleAnalytics到CRM软件)使得几乎不用人工完成,并创建一个数据库。此外,不同的来源和用户,错误命名,过时和凌乱的数据是不可避免的。

由于缺少内置后端组件来自动执行同步和清理过程的工具,工作人员可能花费大量的时间只是为了弄清楚报告发生了什么。并最终会在每次添加新数据时重复相同的工作,或者甚至投资其他软件来做这样的工作。很多时候,工作人员不能得到真正有趣的见解。

实时更新和协作

为了使分析工具对组织真正有用,必须不断更新分析工具以考虑变化。但是,这可能很容易导致企业在更新时形成瓶颈。没有准备可视化工具将从分散的源中提取数据的能力,这些数据源很容易与访问它们的多个协作者不同步。然后工作会得到一个大量混乱的不同数据与不可靠的仪表板和报告,因为它变得非常难以掌握。企业访问数据源并更改或更新数据源的用户越多,其所犯的错误越多,使用系统的难度就越大。

商业智能软件应允许多人一起协作并更改现有数据集。使用端到端解决方案,企业可以获得使用集中式数据存储库的好处,并能够以任何方式组合数据。任何用户在服务器上运行的任何查询都将依赖于一个版本的真相并解决矛盾的报告。

将“情报”放在商业智能中

一旦工作人员在一个地方获得所有数据,分析就归结为解决涉及几组数字的复杂计算。这可以在有限的程度上由诸如Excel的程序来完成。但问题是,工作人员必须做大量的手动工作,每个计算发生。对于更深入的分析,工作必须创建多阶段公式,同时执行多个计算。例如,要计算每月的平均总销售额,需要同时计算所销售的所有商品的总和和平均值。

可视化工具专注于报告数据而不是分析数据,因此它们只使用限制性平台来限制每个公式可以输入的聚合数。要使其工作,工作人员必须在进行计算之前汇总数据。换句话说,不是同时计算和和平均值,每个步骤必须单独进行,在保存之后,然后一起计算。

使用端到端解决方案可以避免这个繁琐的过程,因为这些使用户能够创建在单独来源中工作的复杂公式。该软件自动执行所有必要的预计算,允许工作人员直接跳过之前的信息。

如果企业要查找的是一个漂亮的报告,则数据可视化工具可能会适合。但是,当它归结到数据分析的根本砂砾,他们绝对是不够的。BI软件是端到端的,并且结合了可以处理大量杂乱数据的健壮的后端对于大多数企业是至关重要的。


德仔网尊重行业规范,每篇文章都注明有明确的作者和来源;德仔网的原创文章,请转载时务必注明文章作者和来源:德仔网;
头条那些事
大家在关注
我们的推荐
也许感兴趣的
干货