6.3 使用Spark SQL读写数据库

Spark SQL可以支持Parquet、JSON、Hive等数据源，并且可以通过JDBC连接外部数据源

6.3 使用Spark SQL读写数据库

1.准备工作

ubuntu安装mysql教程

在Linux中启动MySQL数据库：

6.3 使用Spark SQL读写数据库

输入下面SQL语句完成数据库和表的创建： 6.3 使用Spark SQL读写数据库

2.读取mysql数据库中的数据

下载MySQL的JDBC驱动程序，比如mysql-connector-java-5.1.40.tar.gz
把该驱动程序拷贝到spark的安装目录” /usr/local/spark/jars”下
启动一个spark-shell，启动Spark Shell时，必须指定mysql连接驱动jar包

6.3 使用Spark SQL读写数据库

执行以下命令连接数据库，读取数据，并显示：

6.3 使用Spark SQL读写数据库

load()读取数据，封装到DataFrame内存中。

6.3 使用Spark SQL读写数据库

3.向mysql数据库写入数据

　　在MySQL数据库中创建了一个名称为spark的数据库，并创建了一个名称为student的表创建后，查看一下数据库内容：

6.3 使用Spark SQL读写数据库

　　现在开始在spark-shell中编写程序，往spark.student表中插入两条记录

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

6.3 使用Spark SQL读写数据库

二、连接Hive读写数据

1.准备工作

数据仓库（Data Warehouse）是一个面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策。

6.3 使用Spark SQL读写数据库

图数据仓库的体系结构

2.向Hive中创建数据库和表

3.连接Hive读写数据

相关文章：

2022-01-05
2022-12-23
2022-12-23
2022-12-23
2022-12-23
2021-06-06
2021-11-11
2022-02-22

猜你喜欢

2022-12-23
2021-08-25
2021-11-08
2021-08-14
2022-12-23
2021-04-03

相关资源

下载 2023-01-10
下载 2022-12-11
下载 2023-04-04

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode