【发布时间】:2015-06-22 13:07:30
【问题描述】:
我在本地 Windows 上使用独立集群,并尝试使用以下代码从我们的一台服务器加载数据 -
from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
df = sqlContext.load(source="jdbc", url="jdbc:postgresql://host/dbname", dbtable="schema.tablename")
我已将 SPARK_CLASSPATH 设置为 -
os.environ['SPARK_CLASSPATH'] = "C:\Users\ACERNEW3\Desktop\Spark\spark-1.3.0-bin-hadoop2.4\postgresql-9.2-1002.jdbc3.jar"
在执行 sqlContext.load 时,它会抛出错误,提示“找不到适合 jdbc:postgresql 的驱动程序”。我已经尝试搜索网络,但无法找到解决方案。
【问题讨论】:
-
它的“没有找到适合 jdbc:postgresql 的驱动程序”只有.. 更新的问题。
-
那么在这种情况下,驱动程序所需的 jar 文件不可用。
-
存在所需的 jar 文件,但不知何故 SPARK 无法识别它。 SPARK_CLASSPATH 存在一些问题。我不确定如何设置 SPARK_CLASSPATH。
-
"..\postgresql-9.2-1002.jdbc3" 听起来不像 jar 文件的名称,因为它们通常以
.jar结尾。您需要将 jar 文件添加到类路径,而不是包含 jar 文件的文件夹。 -
添加了 Mark 但仍然无法正常工作...
标签: postgresql jdbc apache-spark apache-spark-sql pyspark