【发布时间】:2020-03-03 19:01:45
【问题描述】:
在 pyspark 中考虑以下数据框:
+-----------+
| Col A|
+-----------+
| [0.5, 0.6]|
| [0.7, 0.8]|
| [1.1, 1.5]|
+-----------+
Col A 的类型是向量,我怎样才能创建一个新列,它的值是 Col A 但类型是数组或字符串?
df:
+-----------+-----------+
|Col A |new_column |
+-----------+-----------+
| [0.5, 0.6]| 0.5, 0.6 |
| [0.7, 0.8]| 0.7, 0.8 |
| [1.1, 1.5]| 1.1, 1.5 |
+-----------+-----------+
提前致谢!
【问题讨论】:
标签: python apache-spark pyspark apache-spark-sql