第2章 连接数据源
2.1 连接到文件
2.1.1 Excel文件
2.1.2 文本/CSV文件
2.1.3 XML文件
2.2 连接到数据库
2.2.1 SQL Server数据库
2.2.2 MySQL数据库
在 Power BI 连接到 MySQL 数据库之前,需要到 MySQL 数据库的官方网站(https://dev.mysql.com/downloads/connector/net/)下载对应版本的Connector/Net驱动程序,如图2-31所示。
2.2.3 Oracle数据库
第3章 数据基础操作
3.1 属性的操作
在Power BI中,属性的操作主要包括新建列、删除列、重命名列和重新排序列等。
在Power BI中进行属性操作之前,需要导入“客服中心话务员个人信息表.xlsx”数据文件,数据视图中显示的数据是其加载到模型中的样子,如图3-1所示。
3.1.1 新建列
3.1.2 删除列
3.1.3 重命名列
3.1.4 数据排序
3.2 图表的操作
3.2.1 导出数据
3.2.2 查看数据
3.2.3 删除
3.2.4 排序
第4章 可视化设计
4.1 可视化设计基本要求
在Power BI中,报表可以有一个或多个报表页面,所有页面统称为报表。报表的基本元素包括视觉对象(可视化效果)、独立图像和文本框等。从各个数据点到报表元素,再到报表页面本身,有多种格式选项可供选择。
报表生成工作在生成第一个视觉对象之前就开始了,因为优质的报表需要提前规划。
了解需要处理哪些数据,并记录要满足的报表需求:业务需求是什么?此类数据的使用方式是什么?用户是谁?用户希望能够根据此报表做出哪些决策?
这些问题的答案决定了设计方向,确保每张报表所传达的信息能够满足业务需求。我们很容易添加能够引人注目的见解的视觉对象,但是如果这些见解不能满足业务需求,那么报表就是没用的,可能还会分散用户的注意力。
在确认业务需求、客户和要添加的指标后,下一步就是选择合适的视觉对象传达信息,并尽可能以最有效的方式呈现这些视觉对象,这涉及到很多方面,我们将从基本的报表设计原则开始讲解。
4.1.1 选择合适的视觉对象
不要为了让报表令人印象深刻而使用更复杂的视觉对象类型,选择能够传达信息的最简单的视觉对象类型即可。
尽量避免使用滚动条,尝试应用筛选器和层次结构(向下钻取)。如果无法避免使用滚动条,要考虑选择其他类型的视觉对象。如果一定要使用滚动条,那么水平滚动比垂直滚动更易于被接受。
①调整视觉对象大小
②移动视觉对象
4.1.2 选择合适的度量值
不要为了构建视觉对象而构建视觉对象,不要害怕重新开始尝试更吸引人的信息传达方式,也许信息传达方式不是最佳的,可能需要采用不同的衡量方式,以及选择合适的度量值等。
4.2 调整可视化对象元素
4.2.1 坐标轴
4.2.2 数据颜色
4.2.3 数据标签
4.2.4 标题
4.2.5 背景
4.3 自定义可视化效果
4.3.1 可视化模板下载
除使用Power BI自带的可视化图表外,我们还可以进行自定义设置,截至2017年11月8日,微软官方网站共有113种可视化效果模板,可以到微软官网进行下载,
或者直接通过可视化板块下的省略号进入
4.3.2 可视化模板导入
在Power BI界面中,单击“导入自定义视觉对象”按钮,在弹出的菜单中选择“从文件导入”选项,如图4-22所示。
第5章 可视化图表
5.1 堆积条形图
5.2 堆积柱形图
5.3 簇状条形图
5.4 簇状柱形图
5.5 百分比堆积条形图
5.6 百分比堆积柱形图
5.7 折线图:折线图强调一系列值的整体形状,通常以时间的推移来显示。
5.8 分区图
5.9 堆积面积图
5.10 折线和堆积柱形图
5.11 折线和簇状柱形图
5.12 功能区图
5.13 瀑布图
5.14 散点图
5.15 饼图
5.16 环形图
5.17 树形图
5.18 漏斗图
5.19 仪表盘
5.20 卡片图
5.21 多行卡
5.22 KPI
5.23 切片器
5.24 表
5.25 矩阵
第6章 自定义可视化效果
Power BI自带的可视化图表比较丰富,但是有些行业对可视化效果的要求比较高,自带的图表不能满足其要求,Power BI对于这些高级用户也提供支持,一个突出的特点就是让用户可以自定义展示效果。由于这些图表太多,本章仅讲解一些具有代表性的可视化效果。
在本章中,部分可视化效果需要使用R语言,读者应确保在打开案例文件前已经安装相应版本的R软件及其依赖包,本书使用的R语言版本是3.4.2,具体安装步骤请参考其他书籍,在Power BI中运行R代码的方法请参考本书的第10章内容。
6.1 阿斯特图Aster Plot
6.2 博彦日历Beyondsoft Calendar
6.3 子弹图
6.4 和弦图
6.5 相关图Correlation plot
6.6 聚类图DBSCAN Clustering
6.7 决策树DecisionTree
6.8 双KPI DualKpi
6.9 甘特图Gantt Chart
6.10 直方图Histogram Chart
6.11 点线图LineDotChart
6.12 网络导航图NetworkNavigator
6.13 雷达图Radar Chart
6.14 桑基图Sankey Chart
6.15 社交网络图SocialNetworkGraph
6.16 流线图Stream Graph
6.17 阳光图Sunburst Chart
6.18 时间序列图TimeSeries
6.19 龙卷风图Tornado chart
6.20 词云Word Cloud
第7章 报表
7.1 Power BI报表简介
Power BI报表是数据集的多角度视图,可以包含单个可视化效果,也可以包含设置了可视化效果的多个页面,如图7-1所示。
7.1.1 报表的优点
Power BI报表以单个数据集为基础,报表中的可视化效果表示信息的一个功能。此外,可视化效果不是静态的,可以添加和删除数据、更改可视化效果类型,并在深入探究数据时应用筛选器和切片器等,从而挖掘隐含的有价值信息并寻找答案。
例如,当单击饼图中的客户细分区域时,其他图标就会变化,突出显示相应的统计数据,如图7-2所示。
7.1.2 报表与仪表板的比较
报表类似于仪表板,但具有高度互动性和高度可定制性,并且可视化效果可以随着基础数据的变化而更新。
仪表板容易与报表混淆,因为它们都是填充可视化效果的画布,它们之间的差异如表7-1所示。
7.2 报表添加页面
7.2.1 向报表添加页面
7.2.2 向报表添加筛选器
向特定可视化效果添加筛选器,有两种方法可以实现:第一种方法是通过可视化效果中已有的字段;第二种方法是通过可视化效果中尚未使用的字段,并将该字段直接添加到“视觉级筛选器”存储桶中。
1.通过可视化效果中已有的字段添加筛选器
打开“可视化”“筛选器”和“字段”窗格,然后选择视觉对象,将其**。视觉对象使用的所有字段会在“字段”窗格中被标识出来,并在“筛选器”窗格中列出来(“视觉级筛选器”标题下方),如图7-6所示。
此时可以向可视化效果中已有的字段添加筛选器,向下拖动滚动条,找到“视觉级筛选器”区域,然后单击箭头按钮以展开要筛选的字段。筛选器类型有“基本筛选”“高级筛选”和“前N个筛选”3类,这里选择“基本筛选”,然后勾选“东北”“华东”和“中南”复选框,如图7-7所示。
视觉对象会随新筛选器的选项变化而变化。将报表与筛选器保存后,就可以通过选择或清除值的方式与筛选器进行交互,如图7-8所示。
2.通过可视化效果尚未使用的字段
在“字段”窗格中,选择要添加到“视觉级筛选器”中的字段,然后将它拖到“视觉级筛选器”区域中,这里将“细分”字段拖动到“视觉级筛选器”中,并选中“公司”复选框,如图7-9所示。
7.3 报表设计原则
7.3.1 调整页面布局
在大多数情况下,人们习惯从左往右、从上往下进行浏览,因此可以将最重要的元素放在报表左上角,而其他视觉对象的排列方式要有助于用户有逻辑地浏览和理解信息。
1.对齐
对齐并不意味着不同组件的尺寸必须相同,也不是说报表上的每一行都必须有相同数量的组件,只是要求报表页面采用有助于用户浏览和提高可读性的结构。
Power BI提供了一些帮助对齐视觉对象的工具,如果选择多个视觉对象,就可以使用“格式”功能区中的“对齐”和“分布”选项来对齐和分布视觉对象,如图7-11所示为“对齐”选项。
2.调整页面尺寸
在设计报表时要注意采用4:3、16:9,还是其他宽高比,小屏幕还是大屏幕,还是要适应所有可能的屏幕宽高比和尺寸。
3.整齐有序
杂乱无章的报表页面用户很难一眼就理解,甚至可能会令用户感到不知所措。因此,要删除所有不必要的报表元素,不要添加对信息理解或浏览没有作用的附加项,报表页面要尽可能明确、快速、一致地传达信息。
7.3.2 信息表达清楚
1.文本框
文本框可以描述报表页面、一组视觉对象或单个视觉对象,可用于阐述结果或更好地定义视觉对象、视觉对象中的组件或视觉对象之间的关系。文本框可以根据文本框中突出显示的不同条件来吸引用户的注意力。
在Power BI Desktop中,单击“开始”功能区中的“文本框”按钮,如图7-13所示,即可添加文本框。
如果报表上有太多的文本,就会分散用户对视觉对象的注意力。当报表页面需要大量文本才能被用户理解时,可以选取其他视觉对象来更好地传达信息,调整视觉对象的标题,使其更易于理解。
2.形状
形状也有助于用户浏览和理解信息,使用形状可以将相关信息归到一起、突出显示重要数据,还可以使用箭头引导用户的视线。添加“形状”的方法如图7-15所示。
3.颜色
使用颜色是为了保持一致性,精心选择颜色,确保颜色不会干扰用户快速理解报表,过多明亮的颜色也会妨碍理解。在设置报表页面的背景时,要选择不会令报表黯然失色、与页面上的其他颜色不冲突或一般不会引起眼
部不适的颜色。调整颜色的方法如图7-16所示。
4.页面标题
标题是描述报表内容的简短语句。在“可视化”窗格中将“标题”设置为“开”,单击箭头按钮以展开“标题”选项,在“标题文本”文本框中可输入新的标题名,如图7-17所示。
7.3.3 报表外观美观
第8章 仪表板
仪表板是单个页面,通常称为画布,它是Power BI服务的一项功能,在Power BI Desktop中不可用,也无法在移动设备上创建,但是可以查看和共享。仪表板不仅是一张漂亮的图片,它还具有高度互动性和高度可定制性,可以随着基础数据的更改而更新。
仪表板是监控业务、寻找答案和查看所有重要指标的绝佳方法。仪表板上的可视化效果可能来自一个或多个基础数据集,也可能来自一个或多个基础报表。仪表板可以将本地数据和云数据合并到一起,提供合并视图。
8.1 创建Power BI仪表板
8.1.1 从报表创建仪表板
8.1.2 创建仪表板的副本
8.2 Power BI中的磁贴
仪表板磁贴是Power BI服务的一项功能,但不是Power BI Desktop的功能。虽然无法在Power BI移动设备中创建和固定仪表板磁贴,但可以查看和共享这些磁贴。在Power BI移动设备中,可以使用iPhone应用将照片添加到仪表板。
8.2.1 仪表板磁贴
磁贴就是固定到仪表板的数据快照。磁贴可以从报表、数据集、仪表板、问答框、Excel和SQL Server Reporting Services(SSRS)等中创建。
除固定外,还可以使用添加磁贴功能直接在仪表板上创建独立磁贴。独立磁贴包含文本框、图像、视频、流数据和Web内容。
如果用于创建磁贴的原始可视化效果进行了更改,则磁贴不会更改。例如,如果从报表固定一个折线图,然后将折线图更改为条形图,则仪表板磁贴将继续显示为折线图,数据将会刷新,但可视化效果类型不会变。
还可以直接在仪表板上使用“添加磁贴”功能创建图像、文本框、视频、流数据和Web内容的独立磁贴。
获取一个磁贴后,可以拖动它在仪表板上移动。将鼠标指针悬停在图柄上,单击按钮可以重设磁贴大小。将鼠标指针悬停在磁贴上可以显示“省略号”图标,如图8-18所示,单击“省略号”图标可以打开磁贴操作菜单,如图8-19所示。
8.2.2 从报表固定磁贴
可以将整个报表页固定到仪表板上,这也称为固定“动态”磁贴,如图8-20所示。“动态”是因为可以使用仪表板上的磁贴进行交互,而且与单独的可视化磁贴不同,在报表中所做的更改可以与仪表板同步,但不能固定共享报表或Power BI Desktop中的磁贴。
将鼠标指针悬停在想要固定的可视化效果上方,然后单击“固定”图标,Power BI将会打开“固定到仪表板”对话框,如图8-21所示。
在该对话框中进行选择以决定是将磁贴固定到现有仪表板,还是固定到新建仪表板。
●现有仪表板:选择后可从下拉列表中选择仪表板的名称。已与其共享的仪表板不会出现在下拉列表中。
●新建仪表板:选择后可输入新仪表板的名称。
在某些情况下,正在固定的项可能已经应用了“主题”。例如,从Excel工作簿固定的视觉对象。如果是这样,则选择要应用到该磁贴的主题。
8.2.3 磁贴固定到仪表板
8.2.4 磁贴添加超链接
8.3 编辑仪表板磁贴
8.3.1 添加图像
8.3.2 添加文本
8.3.3 添加视频