【发布时间】:2019-10-07 14:18:18
【问题描述】:
我有 2 个 csv 文件:一个是 dictionary.csv,另一个是 file.csv,其中包含很多单词。我想检查dictionary.csv 中的单词是否存在于file.csv 的特定列中。
如果存在,则应创建一个新文件new.csv。该文件应包含 file.csv 中的所有数据,但有一个额外的列,如果存在则写入 1,如果不存在则写入 0。
这是我的脚本:
import csv
import pandas as pd
news=pd.read_csv("file.csv")
dictionary=pd.read_csv("dictionary.csv", squeeze=True)
pattern = '|'.join(dictionary)
exist=news['sentences'].str.contains(pattern, na=False)
with open('new.csv', 'w') as outFile:
for cols in exist:
if pattern in exist:
outFile.write(exist, "1")
结果,我得到一个空的 csv 文件,我想我可能遗漏了什么。
file.csv
id sentences
0 Roses are red
1 burgers are delicious
dictionary.csv
red
blue
green
new.csv 文件应包含以下输出:
id sentences exist/not exist
0 Roses are red 1
1 burgers are delicious 0
【问题讨论】:
标签: python-3.x pandas csv export-to-csv