【发布时间】:2017-02-20 02:52:14
【问题描述】:
如果这个问题不清楚,我非常愿意接受建设性的批评。
我有一个包含大约 50 行数据的 Excel 表,每行的第一列是日期。我只需要访问一个日期的所有数据,而那个日期只出现大约 1-5 次。这是最近的日期,所以我已经按日期组织了表格,最近的日期位于顶部。
所以我的目标是将该日期存储在一个变量中,然后让 Python 仅查找该变量(该日期)并仅获取与该变量对应的列。我还需要在 100 个其他 excel 文件上使用此代码,因此它需要任意取最近的日期(尽管总是在顶部)。
我下面的当前代码只取前 5 行,因为我知道这是该日期出现的次数。
import os
from numpy import genfromtxt
import pandas as pd
path = 'Z:\\folderwithcsvfile'
for filename in os.listdir(path):
file_path = os.path.join(path, filename)
if os.path.isfile(file_path):
broken_df = pd.read_csv(file_path)
df3 = broken_df['DATE']
df4 = broken_df['TRADE ID']
df5 = broken_df['AVAILABLE STOCK']
df6 = broken_df['AMOUNT']
df7 = broken_df['SALE PRICE']
print (df3)
#print (df3.head(6))
print (df4.head(6))
print (df5.head(6))
print (df6.head(6))
print (df7.head(6))
【问题讨论】: