【发布时间】:2019-08-29 22:16:37
【问题描述】:
我正在尝试在 pandas 数据框中标记一个句子,但我遇到了一些麻烦
我知道这段代码只能隐藏一行
TextBlob(df['H'][0]).words
但是当我尝试在 for 循环中应用它时出现错误
for i, row in df.H():
ifor_val = TextBlob(df['H'][i]).words
df.at[i,'ifor'] = H
错误信息: TypeError:“系列”对象不可调用
编辑:
data = {'H':['the quick brown fox jumps over the road', 'the weather is nice
today'], 'marks':[99, 98]}
df = pd.DataFrame(data)
想要的
H marks
['the','quick','brown', 'fox'....] 99
['the','weather','is', 'nice'....] 98
解决方案:
df['H']=df['H'].apply(word_tokenize) df['H'].head()
【问题讨论】:
-
请修正您的缩进并发布您的错误信息。它将帮助我们解决您的问题。
-
请添加一个minimal reproducible example,其中包含 5 行左右的预期输出数据。谢谢。
-
@d_kennetz TypeError: 'Series' 对象不可调用
标签: python pandas for-loop textblob