【发布时间】:2021-06-25 11:57:03
【问题描述】:
我试图从这个数据框中删除提及和特殊字符作为“!?$ ...”,尤其是字符“#”,但保留主题标签的文本。
我想要这样的东西:
tweet clean_tweet
---------------------------------------------|-----------
"This is an example @user2 #Science ! #Tech" | "This is an example Science Tech"
"Hi How are you @user45 #USA" | "Hi How are you USA"
我不确定如何在推文列中的数据框中进行迭代和执行此操作 我试过用这个来处理特殊字符
df["clean_tweet"] = df.columns.str.replace('[#,@,&]', '')
但我有这个错误
ValueError: Length of values (38) does not match length of index (82702)
【问题讨论】:
标签: python dataframe data-cleaning