【发布时间】:2016-04-13 18:19:42
【问题描述】:
我正在使用 Memsql::Streamliner::Transform (Python) 实用程序。必须重写一个转换方法才能提供自定义转换功能。
def transform(self, sql_context, dataframe, logger):
dataframe.column[0] 是一个字节数组(JSON 字符串)。
如何将字节数组转换为具有命名列的 DataFrame?
目标:访问转换后的 DataFrame 中的各个列。
【问题讨论】:
标签: python pyspark spark-dataframe singlestore