【发布时间】:2022-08-15 16:24:30
【问题描述】:
我试图用预处理的文本数据替换 DataFrame 中的列。
我已将 Excel 文件导入为 pandas 数据框。
df = pd.read_excel (*file path*)
该文件由 x 行文档和 12 列组成。
我为 NLP 提取了列 \'Text\'。
text_article = (df[\'Text\'])
我已预处理此列(删除数字、停用词、标记化、词形还原等),产生以下变量:text_article[\'final\']
我现在想用 text_article[\'final\'] 替换列 (df[\'Text\']),但不知道如何。
当我导出数据框时,我得到原始列 \'Text\'
df.to_excel(\'*name*.xlsx\', index=False)
我尝试了以下代码来替换列或添加列,但它似乎不起作用。
df.insert(text_article[\'final\'])
和
text_article[\'final\'] = df[\'Text\']
我对 Python 比较陌生,所以我希望我已经清楚地提出了我的问题。提前致谢。
标签: python pandas dataframe nlp