【发布时间】:2019-10-04 17:59:07
【问题描述】:
我正在尝试在 python 中使用 pandas 读取 csv 文件。我已经提到了这个链接 pandas.read_csv moves column names over one
并使用以下代码显示 csv 文件的第一行。
prodid ProdParent productname StartDate wfStatus ErrorMessage
FCT TDAR 2752_bg42328_US 3/8/2019 15:21 "PROCESs IS empty"
VEE TNL 2752_bg42329_US 3/8/2019 15:26 "success"
FCT TRAD 2752_bg42328_US 3/8/2019 15:21 "PROCESs IS empty"
VEE TNL 2752_bg42329_US. 3/8/2019 15:32
VEE TNL 2752_bg42329_US 3/8/2019 15:34
VEE TNL 2752_bg42329_US 3/8/2019 15:38
JUR TLO 2755_bg567_US 4/8/2019 03:19
如何使用 pandas 遍历每一行。 在我的 csv 文件中,有一个 headercolumns 即 errorMessage 和 productName、开始日期、wfstatus 等... 我面临的问题是,我的 csv 文件中有大约 8000 行,我只需要在以下条件下过滤/获取那些行/列值:
如果errorMessage_column_value == blank/null value 或
wfSTATUS_columnvalue == blank/null
然后获取与上述条件匹配的相应 productName 单元格/列值。
现在,如果在同一日期存在多个具有不同时间跨度的 productname 列值(在 startdate 列中),我只需要获取最新/最近的 productName 值。
如何做到这一点。
df = pd.read_csv(csv_ctrl_file, index_col=False)
print(df.head(1))
【问题讨论】:
-
您可以使用
df.loc将输入数据和预期输出作为文本发布到问题中,以便我们更好地帮助您。 -
我已经更新了,试图用实际输入的 csv 文件内容和我的 reqmnt 来解释。你能给我一个如何使用 df.loc 获取特定列值的示例。我对 python 编程很陌生。因此很难读取和显示输出
标签: python python-3.x pandas