【发布时间】:2019-10-18 10:37:21
【问题描述】:
我正在尝试使用 Jupyter Notebook 中的 pyspark 从 MS SQL 服务器加载数据。 Spark 已经过测试并且工作正常。 我正在使用以下内容:
from pyspark import SparkContext, SparkConf, SQLContext
appName = "PySpark SQL Server Example - via JDBC"
master = "local"
conf = SparkConf() \
.setAppName(appName) \
.setMaster(master) \
.set("spark.driver.extraClassPath","mssql-jdbc-7.4.1.jre8.jar")
sc = SparkContext.getOrCreate(conf=conf)
sqlContext = SQLContext(sc)
spark = sqlContext.sparkSession
# Loading data from a JDBC source
jdbcDF = spark.read \
.format("jdbc") \
.option("url", "jdbc:postgresql:dbserver") \
.option("url", "jdbc:sqlserver://188.188.188.188:10004;databaseName=dbnme") \
.option("dbtable", "dbo.tablename") \
.option("user", "usernmame") \
.option("password", "pawwrod") \
.load()
我的 MS SQL 驱动程序 (mssql-jdbc-7.4.1.jre8.jar) jar 与我的 python 脚本所在的位置相同。
我得到的错误:
和:
【问题讨论】:
-
请更改被涂黑的字符串的字符,然后粘贴
option。如果里面有特殊字符等 -
我的密码中有“_”。这可以接受吗?
-
是的。错误中有关于
-的内容
标签: python python-3.x apache-spark pyspark jupyter-notebook