【问题标题】:Manipulating Excelsheet with pandas or matplotlib使用 pandas 和 matplotlib 操作 Excel 工作表
【发布时间】:2020-02-24 18:16:21
【问题描述】:

我是 Python 新手,所以我不知道哪种方法是完成我必须完成的任务的最佳方法。

基本上我有一个包含我的数据的电子表格;日期、时间戳和 6 列,具有 6 种不同尺寸的不同粒子计数。我已经设法使用 pandas 阅读了工作表,然后使用 matplotlib.pyplot 库将其绘制为折线图。这一切都相对简单。

但是,我想在绘图中添加更多线条,对于每个计数,我想要过去 1000 次计数的平均值。

我不确定是否要使用 pandas 操作数据集,或者是否有其他更有效的方法来执行此操作。我读到您也可以使用 numpy 数组来执行此操作……但我也没有这方面的经验。

这是我目前的代码:

import pandas as pd
import matplotlib.pyplot as plt

dataset = "2019-10-09-08_DATA.XLS"

dataset_all = pd.read_excel(dataset, skiprows=6, usecols=(
   "Date", "Time", "0.3um", "0.5um", "1.0um", "2.0um", "5.0um", "10.0um"))

dataset_all.plot()

print(dataset_all)
plt.show()

这是电子表格的链接:https://drive.google.com/file/d/1GFU_wwt5KMuLkziQlEyWJMHrkV4Pta3k/view?usp=sharing

【问题讨论】:

  • 计数是什么意思?示例数据集也很有帮助,因此我们可以更好地重现您的情况。
  • @molybdenum42 它是一个粒子计数器,可以计算 6 种不同的粒子大小。我在问题中添加了一个链接,您可以在其中下载表格
  • 我并不是特别热衷于从互联网上的陌生人那里下载文件,但听起来@Evan 确实为您提供了正确的答案——应该能够满足您的需求。
  • @molybdenum42 可以理解 :)) 我会调查的,干杯!

标签: excel python-3.x pandas matplotlib


【解决方案1】:

我下载了您的文件并立即在此处呈现(在一台不太快的机器上)。我与熊猫一起使用的文件要大得多(超过 500mb)。除非您的数据量是这种大小的许多倍,否则无需优化。

如果绘图开始变慢,您还可以生成像 PNG 这样的文件输出。

【讨论】:

    猜你喜欢
    • 2021-04-19
    • 2019-05-30
    • 1970-01-01
    • 1970-01-01
    • 2015-08-29
    • 1970-01-01
    • 2021-04-16
    • 2017-12-26
    • 2021-12-27
    相关资源
    最近更新 更多