【问题标题】:Error in having a sequence - TypeError: sequence item 0: expected str instance, list found有序列时出错 - TypeError:序列项 0:预期的 str 实例,找到列表
【发布时间】:2020-05-10 05:06:20
【问题描述】:

我需要您的帮助来将单词列表连接成字符串。我试图将它映射到一个字符串,但无济于事。这是我的 for 循环的 sn-p。

for i in range(len(tokenized)):
    tokenized[i] = ' '.join(tokenized[i])

这是存储在标记化中的内容


0                         [, halv, cancel, due]
1    [mercyofallah, good, time, wrap, granular, det...
2    [day, digit, india, murder, e, learn, g, onlin...
3    [india, like, run, remain, rna, kit, essenti, ...
4    [tough, time, best, way, grow, learn, case, te...
Name: clean_art, dtype: object```

【问题讨论】:

  • tokenized[i] 是一个列表吗?我想只有这样你才能加入。
  • 是的,这是一个列表@Sajan

标签: python-3.x pandas nltk token


【解决方案1】:

这是你需要做的,不确定标记化的数据类型是什么:

df = pd.DataFrame({
'tokenized': [
    ['mercyofallah', 'good', 'time', 'wrap', 'granular'],
    ['day', 'digit', 'india']
]
})
df['string'] = df['tokenized'].apply(lambda x: ' '.join(x))
print(df)



                                   tokenized                                string
0  [mercyofallah, good, time, wrap, granular]  mercyofallah good time wrap granular
1                         [day, digit, india]                       day digit india

【讨论】:

  • 这就是数据的样子,字符串。检查一下,因为我已将其包含在问题中。尝试了您的解决方案,但无济于事。 @NYC 编码器
猜你喜欢
  • 2021-05-06
  • 2019-07-24
  • 2020-04-28
  • 1970-01-01
  • 2019-05-29
  • 1970-01-01
  • 2022-10-18
  • 2017-06-05
  • 1970-01-01
相关资源
最近更新 更多