【问题标题】:Copy row from excel sheet into a new sheet withou copying doubles将行从excel工作表复制到新工作表而不复制双打
【发布时间】:2019-11-08 11:18:43
【问题描述】:

我对 python 比较陌生。我有一个可以计算灰尘的传感器。它将其数据写入 Excel 工作表 (DownloadedSheet)。我想创建一个大型数据集,其中来自计数器的所有数据都是(MainSheet)。

从传感器获取数据时,它会下载包含所有最后 10000 次测量的 Excel 表,任何旧数据都会被覆盖。

我有 MainSheet,所有数据都应该复制到其中,但我不知道如何查看 DownloadedSheet 并将这个与 MainSheet 与所有数据进行比较,并且只复制不是在 MainSheet 中。

所有度量的共同点是日期和时间戳。 日期在一列,时间在另一列。

这是数据集的提取物的样子:

Date    Time    Sample t    Vol.    Units   0.3um   0.5um   1.0um   2.0um   5.0um   10.0um
2019-10-06  09:44:38    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:44:59    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:45:20    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:45:41    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:46:02    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:46:23    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:46:44    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:47:05    00:00:21    0.99    L   1   0   0   0   0   0
2019-10-06  09:47:26    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:47:47    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:48:08    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:48:29    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:48:50    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:49:11    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:49:32    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:49:53    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:50:14    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:50:35    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:50:56    00:00:21    0.99    L   0   0   0   0   0   0
2019-10-06  09:51:17    00:00:21    0.99    L   0   0   0   0   0   0

【问题讨论】:

  • 到目前为止你尝试了什么?

标签: python excel python-3.x pandas


【解决方案1】:

首先将数据集连接在一起,然后删除重复的行,例如

import pandas as pd

main = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                     'B': ['B0', 'B1', 'B2', 'B3']})

download = pd.DataFrame({'A': ['A2', 'A3', 'A4', 'A5'],
                         'B': ['B2', 'B3', 'B4', 'B5']})

main = pd.concat([main,download])
main = main.drop_duplicates(keep='last')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多