如何从没有列的杂乱无章的excel文件中提取特定数据）答案

【问题标题】：How to extract the specific data from the unorganized excel file without columns)如何从没有列的杂乱无章的excel文件中提取特定数据）
【发布时间】：2020-11-26 13:51:02
【问题描述】：

我达到了我的极限，我的头发越来越少了。我真的需要你的帮助。

1.试试

我想在一个文件夹中从*.xlsx 中提取包含特定单词“Super Banana”的数据行。

这是文件图片。 [1]：https://i.stack.imgur.com/Cb3yD.png

但是

2。问题

此无组织的 Excel 文件中没有列。有很多文件和我无法手动将列添加到所有文件。

我正在寻找提取的方法：

包含关键字“超级香蕉”的行

或
包含关键词的行前后的行

https://i.stack.imgur.com/Cb3yD.png

A1 标题“2020 年星期一购物清单”将更改（星期一 2020 年购物清单，2021 年星期一购物清单...）

3.我的代码

import glob

files = glob.glob('*.xlsx')
print(files)

import pandas as pd
for file in files:
    df = pd.read_excel(file).fillna(value = 0)
    for row in df.values:
        data = df[df[''].str.contains('Super Banana',na=False)]
        data.to_excel('excel-data_find.xlsx', encoding='utf-8')
        print(data)
        print('Data was extracted')

【问题讨论】：

请不要发布您的数据图像。添加一个最小可行数据集，以便人们可以使用它。
感谢您的评论。但它不包括我的重要数据。

标签： python pandas glob

【解决方案1】：

使用正确的文件路径。例子： df = pd.read_excel('C:\\Users\\file.xlsx').fillna(value = 0)

【讨论】：

感谢您的评论。路径没问题。它在同一个目录中。问题是我不想手动添加列的空列。因为mamy文件太多。有什么解决办法吗？