【问题标题】:PYSPARK SQL ODBC connectionPYSPARK SQL ODBC 连接
【发布时间】:2019-11-21 02:32:32
【问题描述】:

我已经有一个从 python 到 SQL 服务器的 ODBC 连接,我希望使用 pyspark 来运行查询,如何使用我当前与 pyspark 的连接。

谢谢

【问题讨论】:

    标签: python pyspark apache-spark-sql odbc pyodbc


    【解决方案1】:

    您的问题相当广泛,但这里有。 您可以使用以下方法从 SQL 数据库中读取:

    from pyspark.sql import SparkSession
    
    spark = SparkSession.builder.getOrCreate()
    
    df = (
      spark.read.format("jdbc") 
           .option("url", f"jdbc:{sql_flavour}://{ip}:{port};databaseName={database}") 
           .option("dbtable", "table_name") 
           .option("user", username) 
           .option("password", password) 
           .option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver") 
           .load()
    )
    

    我想重要的是使用JDBC 格式,但指定您的driver。如果您遇到此问题,您可能需要下载特定的驱动程序/jar。希望这可以帮助。请尝试包含代码 sn-p 或您下次尝试的示例。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-01-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多