【问题标题】:How to extract the specific data from the unorganized excel file without columns)如何从没有列的杂乱无章的excel文件中提取特定数据)
【发布时间】:2020-11-26 13:51:02
【问题描述】:

我达到了我的极限,我的头发越来越少了。 我真的需要你的帮助。

1.试试

我想在一个文件夹中从*.xlsx 中提取包含特定单词“Super Banana”的数据行。

这是文件图片。 [1]:https://i.stack.imgur.com/Cb3yD.png

但是

2。问题

  • 此无组织的 Excel 文件中没有列。有很多文件和 我无法手动将列添加到所有文件。

    我正在寻找提取的方法:

  1. 包含关键字“超级香蕉”的行

  2. 包含关键词的行前后的行

https://i.stack.imgur.com/Cb3yD.png

  • A1 标题“2020 年星期一购物清单”将更改(星期一 2020 年购物清单,2021 年星期一购物清单...)

3.我的代码

import glob

files = glob.glob('*.xlsx')
print(files)

import pandas as pd
for file in files:
    df = pd.read_excel(file).fillna(value = 0)
    for row in df.values:
        data = df[df[''].str.contains('Super Banana',na=False)]
        data.to_excel('excel-data_find.xlsx', encoding='utf-8')
        print(data)
        print('Data was extracted')

【问题讨论】:

  • 请不要发布您的数据图像。添加一个最小可行数据集,以便人们可以使用它。
  • 感谢您的评论。但它不包括我的重要数据。

标签: python pandas glob


【解决方案1】:

使用正确的文件路径。 例子 : df = pd.read_excel('C:\\Users\\file.xlsx').fillna(value = 0)

【讨论】:

  • 感谢您的评论。路径没问题。它在同一个目录中。问题是我不想手动添加列的空列。因为mamy文件太多。有什么解决办法吗?
猜你喜欢
  • 2014-02-09
  • 2022-11-19
  • 2018-06-30
  • 2020-11-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-01-21
  • 1970-01-01
相关资源
最近更新 更多