【发布时间】:2021-11-24 13:21:56
【问题描述】:
我的数据框如下所示:
_id answers options singleAnswer
a [{'title': 'dog', 'value': True}, [] []
{'title': 'cat', 'value': False},
{'title': 'bird', 'value': False}]
b [{'title': 'food', 'value': False}, [] []
{'title': 'water', 'value': True},
{'title': 'wine', 'value': False}]
c [] [bed, [sleep]
chair,seat]
d [] [[one],[two], [four]
[three]]
它们显示为字典的原因是因为 BigQuery 中有一个嵌套记录,我导入它时没有取消嵌套。至于最后两列,这就是它们在初始数据集中的样子。
现在,我想构建一个额外的列,只为我提供每行单词的总长度。所以对于第一行,我会考虑dog、cat、bird 并获得长度10。对于最后一行,我将采用one、two、three、four 并获得长度15。
如果有一个简单的字符串,我会做df['Length']=df['columnName'].str.len(),但我不能这样做,因为它给了我列表的长度。这对于字典键的长度也是有问题的,对于这些奇怪的列表列表更是如此。
是否可以按原样取出字符串长度,还是应该先将所有内容转换为我感兴趣的字符串?
【问题讨论】:
标签: python pandas string list dataframe