【发布时间】:2020-11-21 14:19:39
【问题描述】:
我有 25 个 csv 文件,每个文件有 4 列,我必须在所有 25 个 CSV 中比较 1 个名为 City 的列,然后在 csv 中写入输出,以了解哪个城市存在于多少具有文件名的文件中。
例如
在 excel 中,我希望 New york 在前 0 列的第一行,然后在下一列中,我想获取纽约市所在的文件名。赞csv_output.csv:
New york File 1, File 2, File 3, File 5, File 25
Jakarta File 1, File 7, File 19.
如何使用 Python、Pandas 或 CSV 或任何其他选项来实现。
目前我最初检查了两个 csv,但这也不起作用。 我的要求是 25 个 CSV 文件。
import pandas as pd
Data1 = pd.read_csv('C:/Users/File1.csv')
Data2 = pd.read_csv('C:/Users/File2.csv', usecols=['City'])
for df in [Data1, Data2]:
df['City'] = df['City'].str.rstrip()
result = pd.merge(netscan, computer, on='City', how='outer')
result.to_csv('Report.csv', index=False)
print(result)
【问题讨论】:
标签: python pandas csv data-science