【发布时间】:2019-10-19 10:40:07
【问题描述】:
我正在尝试从 python 应用程序加载 MySQL JDBC 驱动程序。我没有调用“bin/pyspark”或“spark-submit”程序;相反,我有一个 Python 脚本,我在其中初始化“SparkContext”和“SparkSession”对象。 我知道我们可以在调用 'pyspark' 时传递 '--jars' 选项,但是如何在我的 python 应用程序中加载和指定 jdbc 驱动程序?
【问题讨论】:
-
为什么不用pymysql?这是从 python 连接的标准方式,可以使用 pip 轻松安装。 pymysql.readthedocs.io/en/latest
-
谢谢。原因是我使用的设计是通过“jaydebeapi”连接到所有数据库(可以通过 JDBC 连接)
-
在这种情况下,我需要将我的 DataFrame 写入我需要通过 Spark 连接的 MySQL。
-
你试过了吗?在连接中提供 JDBC 路径? conn = jdbc.connect(jdbc_class, [url, user, pw], jdbc_path)
-
我正在尝试使用 spark 的 DataFrameWriter,它不接受 jar 文件作为选项。
标签: python apache-spark pyspark