【发布时间】:2018-10-05 12:38:00
【问题描述】:
我在 Databricks 上创建了一个 PySpark DataFrame。
%python
# File location and type
file_location = "/FileStore/tables/file.csv"
file_type = "csv"
# CSV options
infer_schema = "true"
first_row_is_header = "true"
delimiter = ";"
# The applied options are for CSV files. For other file types, these will be ignored.
df1 = spark.read.format(file_type) \
.option("inferSchema", infer_schema) \
.option("header", first_row_is_header) \
.option("sep", delimiter) \
.load(file_location)
现在我想将 df1 与 SparkR 一起使用
%r
library('SparkR')
df1
sparkR 无法使用或找到由 PySpark 创建的 df1。
Error in eval(parse(text = DATABRICKS_CURRENT_TEMP_CMD__)) :
Error in eval(parse(text = DATABRICKS_CURRENT_TEMP_CMD__)) :
object 'df1' not found
如何使用 sparkR 访问 pySpark 数据帧,反之亦然?还是每个 Dataframe 都是完全不同的对象?
【问题讨论】:
-
你找到答案了吗?
标签: pyspark sparkr apache-spark-dataset