| 目录 |
| 序 言 |
| 1.1 大数据时代的技术挑战 |
| 1.2 数据可视化的技术难点 |
| 1.3 可视化工具的必备特性 |
| 第一部分:大数据可视化基础篇 |
| 2.1 集群的安装及网络配置 |
| 2.1.1 Hadoop集群概述 |
| 2.1.2 集群软件及其版本 |
| 2.1.3 集群网络环境配置 |
| 2.2 集群案例数据集简介 |
| 2.2.1 数据字段说明 |
| 2.2.2 数据导入说明 |
| 2.2.3 运行环境说明 |
| 2.3 连接Hive的图形界面工具 |
| 2.3.1 DBeaver |
| 2.3.2 Oracle SQL Developer |
| 2.3.3 DbVisualizer |
| 2.3.4 SQuirrel SQL Client |
| 3.1 Tableau |
| 3.1.1 Tableau简介 |
| 3.1.2 Tableau连接Hive |
| 3.1.3 Tableau连接Spark |
| 3.2 Zeppelin |
| 3.2.1 Zeppelin简介 |
| 3.2.2 Zeppelin连接Hive |
| 3.2.3 Zeppelin连接Spark |
| 3.3 Python |
| 3.3.1 Python简介 |
| 3.3.2 Python连接Hive |
| 3.3.3 Python可视化案例 |
| 4.1 Python环境安装 |
| 4.1.1 Anaconda |
| 4.1.2 PyCharm |
| 4.2 Python代码开发工具 |
| 4.2.1 Spyder |
| 4.2.2 Jupyter Notebook |
| 4.2.3 Jupyter Lab |
| 4.3 Python连接数据源 |
| 4.3.1 连接单个文件数据 |
| 4.3.2 连接关系型数据库 |
| 4.3.3 连接Hadoop集群 |
| 5.1 Matplotlib |
| 5.1.1 Matplotlib库简介 |
| 5.1.2 Matplotlib可视化案例 |
| 5.2 Pyecharts |
| 5.2.1 Pyecharts库简介 |
| 5.2.2 Pyecharts可视化案例 |
| 5.3 Seaborn |
| 5.3.1 Seaborn库简介 |
| 5.3.2 Seaborn可视化案例 |
| 5.4 ggplot |
| 5.4.1 ggplot库简介 |
| 5.4.2 ggplot可视化案例 |
| 5.5 Bokeh |
| 5.5.1 Bokeh库简介 |
| 5.5.2 Bokeh可视化案例 |
| 5.6 Pygal |
| 5.6.1 Pygal库简介 |
| 5.6.2 Pygal可视化案例 |
| 5.7 Plotly |
| 5.7.1 Plotly库简介 |
| 5.7.2 Plotly可视化案例 |
| 5.8 其它可视化库 |
| 5.8.1 Altair |
| 5.8.2 Pyqtgraph |
| 5.8.3 NetworkX |
| 第二部分:Matplotlib数据可视化篇 |
| 6.1 Matplotlib主要参数配置 |
| 6.1.1 线条的设置 |
| 6.1.2 坐标轴的设置 |
| 6.1.3 图例的设置 |
| 6.2 绘图参数文件及主要函数 |
| 6.2.1 修改绘图参数文件 |
| 6.2.2 绘图主要函数简介 |
| 6.3 Matplotlib参数配置案例 |
| 7.1 直方图 |
| 7.1.1 直方图及其参数说明 |
| 7.1.2 每日利润额的数值分布 |
| 7.2 折线图 |
| 7.2.1 折线图及其参数说明 |
| 7.2.2 每周商品销售业绩分析 |
| 7.3 条形图 |
| 7.3.1 条形图及其参数说明 |
| 7.3.2 不同省份利润额的比较 |
| 7.4 饼图 |
| 7.4.1 饼图及其参数说明 |
| 7.4.2 不同类型商品销售额比较 |
| 7.5 散点图 |
| 7.5.1 散点图及其参数说明 |
| 7.5.2 销售额与利润额的关系 |
| 7.6 箱形图 |
| 7.6.1 箱形图及其参数说明 |
| 7.6.2 销售经理业绩比较分析 |
| 8.1 树形图 |
| 8.1.1 树形图及其应用场景 |
| 8.1.2 不同省份销售额的比较分析 |
| 8.2 误差条形图 |
| 8.2.1 误差条形图及其应用场景 |
| 8.2.2 门店业绩考核达标情况分析 |
| 8.3 火柴杆图 |
| 8.3.1 火柴杆图及其应用场景 |
| 8.3.2 不同省份送货准时性分析 |
| 8.4 甘特图 |
| 8.4.1 甘特图及其应用场景 |
| 8.4.2 企业信息化项目进度管理 |
| 8.5 自相关图 |
| 8.5.1 自相关图及其应用场景 |
| 8.5.2 股票价格的自相关分析 |
| 8.6 图形整合 |
| 8.6.1 图形整合及其应用场景 |
| 8.6.2 区域销售额与利润额分析 |
| 第三部分:Pyecharts数据可视化篇 |
| 9.1 全局配置项 |
| 9.1.1 基本元素配置项 |
| 9.1.2 坐标轴配置项 |
| 9.1.3 原生图形配置项 |
| 9.2 系列配置项 |
| 9.2.1 样式类配置项 |
| 9.2.2 标记类配置项 |
| 9.2.3 其它类配置项 |
| 9.3 运行环境 |
| 9.3.1 生成 HTML |
| 9.3.2 生成图片 |
| 9.3.3 Jupyter Notebook |
| 9.3.4 Jupyter Lab |
| 10.1 折线图 |
| 10.1.1 折线图及其参数配置 |
| 10.1.2 各门店销售业绩比较分析 |
| 10.2 条形图 |
| 10.2.1 条形图及其参数配置 |
| 10.2.2 各省市商品订单数量分析 |
| 10.3 箱形图 |
| 10.3.1 箱形图及其参数配置 |
| 10.3.2 不同类型商品的收益分析 |
| 10.4 涟漪散点图 |
| 10.4.1 涟漪散点图及其参数配置 |
| 10.4.2 不同收入等级客户价值分析 |
| 10.5 K线图 |
| 10.5.1 K线图及其参数配置 |
| 10.5.2 企业股票价格趋势分析 |
| 10.6 双坐标轴图 |
| 10.6.1 双坐标轴图及其参数配置 |
| 10.6.2 区域销售业绩及数量分析 |
| 11.1 日历图 |
| 11.1.1 日历图及其参数配置 |
| 11.1.2 企业股票每日交易量分析 |
| 11.2 漏斗图 |
| 11.2.1 漏斗图及其参数配置 |
| 11.2.2 华东地区各省市利润额分析 |
| 11.3 仪表盘 |
| 11.3.1 仪表盘及其参数配置 |
| 11.3.2 企业2019年销售业绩完成率 |
| 11.4 环形图 |
| 11.4.1 环形图及其参数配置 |
| 11.4.2 不同教育群体的购买力分析 |
| 11.5 雷达图 |
| 11.5.1 雷达图及其参数配置 |
| 11.5.2 不同区域销售业绩的比较 |
| 11.6 旭日图 |
| 11.6.1 旭日图及其参数配置 |
| 11.6.2 绘制我的家庭树旭日图 |
| 11.7 主题河流图 |
| 11.7.1 主题河流图及其参数配置 |
| 11.7.2 不同类型商品销售情况分析 |
| 11.8 词云 |
| 11.8.1 词云及其参数配置 |
| 11.8.2 商品类型关键词词云 |
| 11.9 玫瑰图 |
| 11.9.1 玫瑰图及其参数配置 |
| 11.9.2 不同职业群体的购买力分析 |
| 12.1 搭建Django开发环境 |
| 12.1.1 Django框架简介 |
| 12.1.2 Django开发环境 |
| 12.2 Pyecharts与Django集成案例 |
| 12.2.1 创建项目运行环境 |
| 12.2.2 配置项目参数文件 |
| 12.2.3 测试项目运行效果 |
| 附录A:Python常用第三方工具包 |
| A1:数据分析类包 |
| A2:数据可视化类包 |
| A3:机器学习类包 |
| 附录B:集群各节点的参数配置 |
| B1:Hadoop的参数配置 |
| B2:Hive的参数配置 |
| B3:Spark的参数配置 |
| B4:Zeppelin的参数配置 |
| B5:集群的启动与关闭 |
| 参考文献 |
相关文章: