文章目录
Tableau概述
1敏捷商务智能
雨果·莫雷斯在福布斯网站上说:“数据分析主要是通过从数据中获得真相和意义,为企业赋能,驱动业务增长。”
当今社会,商务智能(Business Intelligence,BI)已被广泛地应用于各行各业,并在辅助企业的分析决策中扮演着举足轻重的角色。但随着企业数据量不断膨胀,IT环境日益复杂,业务需求灵活多变,以及信息实时性要求不断提高等,传统BI部署方案的弊端越来越明显。
传统BI系统架构的底层是数据源,中层是ETL(抽取、转换、装载),上层的数据仓库形成DWD(明细数据层)。业务人员进行数据分析,需IT人员根据预先定义好的分析需求,对明细数据进行汇总、建模形成DWA(汇总数据层),并通过前端展现工具制作报表,业务人员再在前端查看这些预生成的报表结果辅助分析。典型的传统BI系统架构图如图所示。
这种架构在处理企业数据时存在许多弊端,如下所示。
- 传统BI的开发难度较高,上线周期长,建好一套BI系统的开发周期长达几个月甚至半年;
- 传统BI的系统架构笨重,不能灵活地响应业务需求的变化,在面对需求变更时,调整周期长,无法提供自助式BI服务;
- 运维成本较高,因企业的分析需求不断变化,传统BI系统对变更需求的持续支持需投入大量的人力和财力;
- 整个BI系统一般由多个产品组成,总成本比较昂贵。
随着技术的更新和发展,以及企业对BI系统的轻便性、灵活性的要求日趋强烈,新一代敏捷BI应运而生。敏捷BI与传统BI相比,可以通过更低的成本、更短的上线周期、更快速地响应企业
分析需求的变化,从而帮助企业及时洞察到数据的含义和价值。
敏捷BI具有以下优点。
- 直接把数据装载到内存数据集市中,无需预生成Cube,业务用户就可以通过自服务的方式直接在前端与数据进行交互分析,大大缩短了系统的上线周期;
- 基于细节数据,用户可以实现明细数据级的多维度探索式分析,而不再是仅能利用现有的分析模型,提高了对灵活多样的分析需求的支持度;
- 整个敏捷BI系统往往只需要一个产品即可实现,成本较传统BI系统低了很多。
2 数据可视化明星 Tableau
数据可视化是指借助于图形化的手段,清晰、有效地传达与沟通信息。随着信息技术的不断发展,当今社会已步入大数据时代,如何帮助企业在海量数据中快速获取重要信息应对市场变化,已成为企业亟需解决的难题。
Tableau是一款定位于数据可视化敏捷开发和实现的商务智能展现工具,可以用来实现交互的、可视化的分析和仪表板应用,从而帮助企业快速地认识和理解数据,以应对不断变化的市场环境与挑战。数据可视化让枯燥的数据以简单友好的图表形式展现出来,是一种最为直观有效的分析方式。无需过多的技术基础,任何个人、企业都可以轻松学会Tableau,并运用其可视化功能对数据进行处理和展示,从而更好地进行数据分析工作。
数据可视化技术是Tableau的核心,主要包括以下两个方面。
- 独创的VizQL数据库。Tableau的初创合伙人是来自斯坦福大学的数据科学家,他们为了实现卓越的可视化数据获取与后期处理,并没有像普通数据分析类软件那样简单地调用和整合现行主流的关系型数据库,而是革命性地进行了大尺度的创新,独创了VizQL数据库。
- 用户体验良好且易用的表现形式。Tableau提供了一个非常新颖而易用的使用界面,使得处理规模巨大的、多维的数据时,可以即时地从不同角度和设置看到数据所呈现出的规律。Tableau通过数据可视化技术,使得数据挖掘变得平民化,而其自动生成和展现出的图表,也丝毫不逊色于互联网美术编辑的水平。正是这个特点奠定了其广泛的用户基础(用户总数年均增长126%),带来了高续订率(90%的用户选择续订其服务)。
3 Tableau 的主要特性
Tableau作为轻量级可视化BI工具的优秀代表,在Gartner(高德纳)2022年公布的商业智能和分析平台魔力象限报告中,连续第10次蝉联领先者殊荣(如下图所示)。Gartner认为“Tableau在简单易用性方面排在现有所有BI工具的首位”。德国电子商务网站的数据科学家Lucie Salwiczek也认为:“不管是制作报表,还是深入挖掘数据并进行分析,只需要Tableau这样一个工具就够了。”
Salesforce (Tableau)
Salesforce(Tableau)是这个魔力象限的领导者。它提供了基于可视化的探索,使业务用户能够访问、准备、分析和呈现其数据中的发现。Tableau CRM(前身为 Einstein Analytics)为分析师和公民数据科学家提供增强的分析功能。
2021 年,Tableau 推出了新的 Slack 集成,并改进了其 NLQ 体验 Ask Data,该体验现在与 Explain Data 一起包含在所有license类型中。"Ask Data"可以作为集成对象添加到仪表板中,新的 Lenses 允许分析师管理现有数据集。Tableau 通过添加集中式行级安全性和虚拟数据连接(使用户能够提取和管理数据表)改进了企业功能。
优势
- 以业务用户为中心: Tableau 为业务用户直观地浏览其数据提供了直观的体验。获得专利的VizQL 引擎为无代码拖放界面提供支持。收购用数据叙事供应商Narrative Science将在未来提高Tableau的NLG和数据叙事能力。
- 分析经济: 用户对 Tableau 表现出狂热的态度。Tableau构建的分析生态系统,带来了一个由具有分析技能的客户、合作伙伴和人员组成的庞大社区。Tableau Exchange 中推出了 100 个新的加速器,并在 Tableau Public 中添加了"雇用我"功能,以帮助雇用具有 Tableau 技能的人才。
- Salesforce生态系统机会: 新的收入类别"数据"将整合MuleSoft,Tableau和Tableau CRM,所有这些都以前包含在"平台和其他"中,这表明Salesforce致力于数据和分析业务作为其生态系统的一部分。
警告
- 高级定价: 与该市场的云供应商相比,Tableau 的license成本昂贵,这是客户在向 Gartner 查询时提出的一个问题。 Tableau Prep Builder 与 Creator license捆绑在一起。数据管理,服务器管理和Einstein Discovery需要额外费用;但是,新的企业订阅计划捆绑了数据管理和服务器管理,以帮助客户扩展。
- 服务和支持: Gartner Peer Insights 评审员称,在整体服务和支持方面,Tableau 略低于平均水平,尤其是在供应商响应的及时性方面。一些 Tableau 客户不清楚Tableau 的支持的过程。此外,尽管支持组织不受影响,但 Tableau 不再直接位于中国大陆,这让区域客户感到担忧。
- 不断发展的 Einstein Discovery 体验: 构建和部署 Einstein Discovery 的无代码机器学习模型的过程与 Tableau 用户体验脱节。用户将被重定向到 Salesforce 中的 Tableau CRM Studio,他们必须在其中重新连接到所需的数据集以训练模型,然后手动将训练时使用的字段映射回 Tableau 中使用的字段。解决这种用户体验的计划已列入Tableau 的2022 年路线图。
不能说Tableau是最好的,但绝对是第一流的。
Tableau之所以在业界有如此出色的表现,在于以下几个方面的主要特性。
3.1 极速高效
传统BI通过ETL过程处理数据,数据分析往往会延迟一段时间。而Tableau通过内存数据引擎,不但可以直接查询外部数据库,还可以动态地从数据仓库抽取数据,实时更新连接数据,大大提高了数据访问和查询的效率。
此外,用户通过拖放数据列就可以由VizQL转化成查询语句,从而快速改变分析内容;单击就可以突出变亮显示,并可随时下钻或上卷查看数据;添加一个筛选器、创建一个组或分层结构就可变换一个分析角度,实现真正灵活、高效的即时分析。
3.2 简单易用
简单易用是Tableau非常重要的一个特性。Tableau提供了非常友好的可视化界面,用户通过轻点鼠标和简单拖放,就可以迅速创建出智能、精美、直观和具有强交互性的报表和仪表盘。
Tableau的简单易用性具体体现在以下两个方面。
- 易学,不需要技术背景和统计知识。使用者不需要IT背景,也不需要统计知识,只通过拖放和点击(点选)的方式就可以创建出精美、交互式仪表盘。帮助迅速发现数据中的异常点,对异常点进行明细钻取,还可以实现异常点的深入分析,定位异常原因。
- 操作极其简单。对于传统BI工具,业务人员和管理人员主要依赖IT人员定制数据报表和仪表盘,并且需要花费大量时间与IT人员沟通需求、设计报表样式,而只有少量时间真正用于数据分析。Tableau具有友好且直观的拖放界面,操作上类似Excel数据透视表,即学即会即用,IT人员只需将数据准备好,并开放数据权限,业务人员或管理人员就可以连接数据源自己来做分析。
3.3 可连接多种数据源,轻松实现数据融合
在很多情况下,用户想要展示的信息分散在多个数据源中,有的存在于文件中,有的可能存放在数据库服务器上。Tableau允许从多个数据源访问数据,包括带分隔符的文本文件、Excel文件、SQL数据库、Oracle数据库和多维数据库等。Tableau也允许用户查看多个数据源,在不同的数据源间来回切换分析,并允许用户把多个不同数据源结合起来使用。
此外,Tableau还允许在使用关系数据库或文本文件时,通过创建联接(支持多种不同联接类型,如左侧联接、右侧联接和内部联接等)来组合多个表或文件中存在的数据,以允许分析相互有关系的数据。
3.4 高效接口集成,具有良好可扩展性,提升数据分析能力
Tableau提供多种应用编程接口,包括数据提取接口、页面集成接口和高级数据分析接口,具体包括以下几个。
- 数据提取API。Tableau可以连接使用多种格式数据源,但由于业务的复杂性,数据源的格式多种多样,Tableau所支持的数据源格式不可能面面俱到。为此,Tableau提供了数据提取API,使用它们可以在C、C++、Java或Python中创建用于访问和处理数据的程序,然后使用这样的程序创建Tableau 数据提取 (.tde) 文件。
- JavaScript API。通过JavaScript API,可以把通过Tableau制作的报表和仪表盘嵌入到已有的企业信息化系统或企业商务智能平台中,实现与页面和交互的集成。
- 与数据分析工具R的集成接口。R 是一种用于统计分析和预测建模分析的开源软件编程语言和软件环境,具有非常强大的数据处理、统计分析和预测建模能力。Tableau8.1之后的版本,支持与R的脚本集成,大大提升了Tableau在数据处理和高级分析方面的能力。
4 Tableau 的产品体系
Tableau的产品体系非常丰富,不仅包括制作报表、视图和仪表板的桌面端设计和分析工具,还包括适用于企业部署的Tableau服务器产品,还有适用于网页上创建和分享数据可视化内容的完全免费服务产品Tableau Public。
4.1 Tableau Desktop
Tableau Desktop是设计和创建美观的视图与仪表板、实现快捷数据分析功能的桌面端分析工具,包括 Tableau Desktop Personal(个人版)和 Tableau Desktop Professional(专业版)两个版本,支持Windows和Mac操作系统。
Tableau个人版仅允许连接到文件和本地数据源,分析成果可以发布为图片、PDF和Tableau Reader等格式;而Tableau专业版除了具备个人版的全部功能外,支持的数据源更加丰富,能够连接到几乎所有格式的数据和数据库系统,包括以ODBC方式新建数据源库,分析成果还可以发布到企业或个人的Tableau 服务器、Tableau Online服务器和Tableau Public服务器上,实现移动办公。
因此,专业版比个人版更加通用,但个人版的价格相对专业版也便宜不少。
4.2 Tableau Server
Tableau Server是一款商业智能应用程序,用于发布和管理Tableau Desktop 制作的报表,也可以发布和管理数据源,如自动刷新发布到Server上的数据提取。Tableau Server是基于浏览器的分析技术,非常适用于企业范围内的部署,当工作簿做好并发布到Tableau Server上后,用户可以通过浏览器或移动终端设备,查看工作簿的内容并与之交互。
Tableau Server可控制对数据连接的访问权限,并允许针对工作簿、仪表板甚至用户设置来设置不同安全级别的访问权限。通过Tableau Server提供的访问接口,用户可以搜索和组织工作簿,还可以在仪表板上添加批注,与同事分享数据见解,实现在线互动。利用Tableau Server提供的订阅功能,当允许访问的工作簿版本有更新时,用户可以接收到邮件通知。
4.3 Tableau Online
Tableau Online 针对云分析而建立,是 Tableau Server 的一种托管版本,省去硬件部署、维护及软件安装的时间与成本,提供的功能与Tableau Server没有区别,按每人每年的方式付费使用。
4.4 Tableau Mobile
Tableau Mobile是基于iOS和Android平台移动端应用程序。用户可通过iPad、Android设备或移动浏览器,来查看发布到Tableau Server或Tableau Online上的工作簿,并可进行简单的编辑和导出操作。
4.5 Tableau Public
Tableau Public 是一款免费的桌面应用程序,用户可以连接Tableau Public服务器上的数据,设计和创建自己的工作表、仪表板和工作簿,并把成果保存到大众皆可访问的Tableau Public服务器上(不可以把成果保存到本地电脑上)。Tableau Public使用的数据和创建的工作簿都是公开的,任何人都可以与其互动并可随意下载,还可以根据你的数据创建自己的工作簿。
4.6 Tableau Reader
Tableau Reader是一个免费的桌面应用程序,可以用来打开和查看打包工作簿文件(.twbx),也可以与工作簿中的视图和仪表板进行交互操作,如筛选、排序、向下钻取和查看数据明细等。
打包工作簿文件可以通过Tableau Desktop创建和发布,也可以从Tableau Public服务器下载。用户无法使用Tableau Reader创建工作表和仪表板,也无法改变工作簿的设计和布局。
说明
利用Tableau Public连接数据时,对数据源、数据文件大小和长度都有一定限制:仅包括 Excel、Access和多种文本文件格式,对单个数据文件的行数限制为10万行,对数据的存储空间限定在50MB以内。Tableau Public Premium是Tableau Public的高级产品,主要提供给某些组织使用,它提供了更大的数据处理能力和允许隐藏底层数据的功能。
ccess和多种文本文件格式,对单个数据文件的行数限制为10万行,对数据的存储空间限定在50MB以内。Tableau Public Premium是Tableau Public的高级产品,主要提供给某些组织使用,它提供了更大的数据处理能力和允许隐藏底层数据的功能。
版权归原作者 W_chuanqi 所有, 如有侵权,请联系我们删除。