【发布时间】:2018-12-14 21:35:45
【问题描述】:
我有一个 PySpark Row 列表:
data_list_array = [Row(url='[a,b,c]'),Row(url='[d,b,c]')]
my_list = [(i.url) for i in data_list_array]
print(my_list)
还给我
['[a,b,c]', '[d,b,c]']
但我希望我的最终数据如下:
[['a','b','c'], ['d','b','c']]
无论如何我可以从字符串列表转换为列表列表吗?
【问题讨论】:
-
您的最终数据不是有效的python。您需要在字符串周围加上引号。
-
您可以执行
[x.strip("[]").split(",") for x in my_list],但您似乎应该解决上游创建data_list_array的问题。虽然这适用于此处发布的特定示例,但它不能很好地概括(假设数据包含有效的逗号或方括号)。 -
列表列表是什么?我的意思是,你想在内部列表中存储什么?字符串?也许是变量?
-
@JosuéCortina 我正在尝试创建一个
gensim字典,如下所示:radimrehurek.com/gensim/corpora/dictionary.html 我面临的唯一问题是 pyspark 将单词列表作为我提到的字符串返回给我以上
标签: python string python-3.x list pyspark