数极客首页

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

前言

报表制作流程的第一步显然是从各个数据源导入数据,Power BI能从很多种数据源导入数据:如Excel,CSV,XML,以及各类数据库(SQL Server,Oracle,My SQL等),两大主流开源平台(Hadoop,Spark)等等。本文篇幅所限,无法一一说明,仅就网页获取数据的方式进行讲解(其他方式大同小异)。

然后本文将在Power BI后台工作区(下简称后台区)对获取到的数据集进行塑形。所谓塑形就是确定数据集的列名以及数据类型,还有进行一些基本数据清洗转换工作,以保证Power BI报表模块能正确解读数据集。塑形后的数据集其实就是Power BI报表绘制区(下简称报表区)的输入。

一旦数据塑形好,我们就能切换到Power BI报表区绘制各种报表了。最后本文将制作一张报表,愉快地结束本次学习。

Power BI的三大工作区

在上篇中,大致介绍了Power BI的开发流程,如下图所示:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

刚打开Power BI,将进入到报表区。下图标记了报表区中后台区的入口:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

下图标记了后台区进入报表绘制区的入口,点击该按钮会返回到报表区并使用塑形后的数据更新报表:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

本文采用的数据集来源于如下网页:

http://www.bankrate.com/finance/retirement/best-places-retire-how-state-ranks.aspx

该网页描述的主题是”退休以后生活在哪里(美国哪个州)最合适”,表中字段信息均为各州在居住成本、税率、犯罪率等方面在全国的排名。

用浏览器打开看看:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

首先,在报表区点击获取数据:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

数据塑形 – 工作区介绍

进入后台区后,将看到如下视窗:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

另外需要注意的是查询设置窗口。我们在工作区做的任何操作在这里都会记录下来,可随时点选以回退到过去的操作(不要Ctrl + Z哈):

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

关于查询设置窗口还有很多好玩的用法,本文篇幅所限就不一一说明了,读者可自行尝试。

数据塑形 – 工作流程

下面我们回过头来看看获取到的这份表格:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

然后检查各列的数据类型,确保需要统计的字段是可统计的类型(如整数,浮点数等)。具体方法是将功能栏切换到”转换功能栏”,每当我们点选一列时,下图红色标记位置将显示列的数据类型:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

解决方法很简单,在”转换功能栏”配置替换机制将这些异常数据修复。比如将”27(tied)”替换为”27″就可以了。

数据修复完毕后,即可对它进行转型。只需右键->转换类型-> 整型即可,也可以直接在功能区进行修改:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

当然不是的,假如数据量很大,几千行,那不得加班加点搞了。几万行,几十万行呢?在使用任何工具的时候都应该思考如何”偷懒”,这里可使用Power BI的数据合并功能轻松做好这个需求。

在维基百科里,可以搜索到美国各州对应的简称(https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations),打开该网页:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

1. 移除头两行表头信息:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

3. 筛选掉行政特区:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

5. 将第一行选定为表头:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

接下来是见证奇迹的一刻^_^:将两份表格Join起来。具体方法是在”开始功能栏”点选”合并查询”,然后设置连接信息:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

至此,一个阶段的数据塑形算是完成了,接下来就可以进入到报表区绘制报表。下面是本阶段数据塑形的结果表:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

需要提醒读者的是数据塑形得越规整,接下来的报表制作就越是得心应手。所以请读者耐心看完这部分的讲解,心急吃不了热豆腐:)

报表制作 – 工作区介绍

回到报表绘制区,我们将看到如下视窗:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

报表区的右侧则是我们的工作区:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

报表制作 – 详细流程

Power BI中,不论是绘制什么图表,总体的步骤都是以下几步。下面笔者以一个简单报表为例讲解Power BI中报表制作的总体过程。

1. 选中目标绘制图形。我们这里选择一个经典的条状图吧:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

3. 筛掉一部分数据。如果我们想只分析美国事宜退休人员居住排行榜前10的州,可设置筛选器:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

4. 调整可视化元素呈现顺序。关键是在建模功能区设置列的排序方式。我们首先选中需要调整顺序的目标列:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)
数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

6. 排版布局。在报表区的格式功能区有不少排版功能选择:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

7. 保存发布。Power BI保存的本地工程文件为.pbix格式。除此之外用户还可以将报表发布出去,在移动端(如平板)随时展示已制作的报表。发布及发布后的使用方法会在下一章讲解,敬请期待。

小结

总的来说,使用Power BI绘制报表最关键的还是在于数据塑形步骤。只有这个步骤做好了,报表绘制起来才能得心应手。

在充分掌握了数据塑形技巧后,就可以将更多精力放在各种各样的可视化图形上。要注意的是Power BI除了包含不少内置图表,还支持从微软官网或其他地方下载成百上千种图表格式。

课后作业

由于在之前我们已经对数据做了初步塑形了,因此之后的报表制作将非常轻松愉快。接下来读者可尽情发挥自己的想象力制作各种酷炫报表,尽量搞清楚Power BI中所有内置图形的绘制方法。

下面是笔者自己随便做的一份报表,轻拍^_^:

数据可视化系列:Power BI基于Web数据的报表制作(经典级示例)

发表评论

评论已关闭。

相关文章