【发布时间】:2020-11-26 13:51:02
【问题描述】:
我达到了我的极限,我的头发越来越少了。 我真的需要你的帮助。
1.试试
我想在一个文件夹中从*.xlsx 中提取包含特定单词“Super Banana”的数据行。
这是文件图片。 [1]:https://i.stack.imgur.com/Cb3yD.png
但是
2。问题
-
此无组织的 Excel 文件中没有列。有很多文件和 我无法手动将列添加到所有文件。
我正在寻找提取的方法:
-
包含关键字“超级香蕉”的行
或
-
包含关键词的行前后的行
https://i.stack.imgur.com/Cb3yD.png
- A1 标题“2020 年星期一购物清单”将更改(星期一 2020 年购物清单,2021 年星期一购物清单...)
3.我的代码
import glob
files = glob.glob('*.xlsx')
print(files)
import pandas as pd
for file in files:
df = pd.read_excel(file).fillna(value = 0)
for row in df.values:
data = df[df[''].str.contains('Super Banana',na=False)]
data.to_excel('excel-data_find.xlsx', encoding='utf-8')
print(data)
print('Data was extracted')
【问题讨论】:
-
请不要发布您的数据图像。添加一个最小可行数据集,以便人们可以使用它。
-
感谢您的评论。但它不包括我的重要数据。