【发布时间】:2016-05-28 09:51:13
【问题描述】:
我有一个大的 CSV 文件,我们将使用它来将资产导入我们的资产管理数据库。下面是一个较小的 CSV 数据示例。
Serial number,Movement type,Posting date
2LMXK1,101,1/5/15 9:00
2LMXK1,102,1/5/15 9:30
2LMXK1,201,1/5/15 10:30
2LMXK1,202,1/5/15 13:00
2LMXK1,301,1/5/15 14:00
JEMLP3,101,1/6/15 9:00
JEMLP3,102,1/7/15 10:00
JEMLP3,201,1/7/15 13:30
JEMLP3,202,1/7/15 15:30
JEMLP3,203,1/7/15 17:30
BR83GP,101,1/5/15 9:00
BR83GP,102,1/5/15 13:00
BR83GP,201,1/6/15 9:00
BR83GP,202,1/7/15 15:30
BR83GP,301,1/5/15 13:00
BR83GP,201,1/6/15 9:00
BR83GP,301,1/9/15 15:30
以下是要求:“每个序列号的最新机芯类型是什么?”
我需要解析 CSV 文件,并为每个唯一序列号获取具有最新“发布日期”的运动类型。
例如,序列号 2LMXK1 的最新发布日期/时间是 2015 年 1 月 5 日 14:00。
这基本上是我需要获得的:
“序列号 2LMXK1 的机芯类型为 301,最后更新时间为 2015 年 1 月 5 日 14:00”。
我从一些解析 CSV 文件并创建字典的代码开始。
#Import modules
import csv
import pandas as pd
fields = ['Serial number','Movement type','Posting date']
df = pd.read_csv('import.csv', skipinitialspace=True, usecols=fields)
dc = df.to_dict()
#print (df['Serial number'])
for value in dc.items():
print (value)
此代码用于解析 CSV 并创建字典。
但是,我需要有关日期比较和过滤技术的帮助。如何创建另一个仅列出具有最新发布日期的唯一序列号的字典?一旦我创建了一个新的过滤数据字典,我就可以使用它来导入我们的资产管理数据库。我的想法是,在导入我们的系统之前,我将使用 python 来分析和操作数据。
【问题讨论】:
标签: python csv datetime dictionary pandas