【发布时间】:2017-07-14 19:09:42
【问题描述】:
我有 14 个 .csv 文件(每个位置 1 个 .csv 文件)将用于制作 14 个每日降雨量的条形图。以下代码是一个条形图的外观示例。
import numpy as np
import pandas as pd
from datetime import datetime, time, date
import matplotlib.pyplot as plt
# Import data
dat = pd.read_csv('a.csv')
df0 = dat.loc[:, ['TimeStamp', 'RF']]
# Change time format
df0["time"] = pd.to_datetime(df0["TimeStamp"])
df0["day"] = df0['time'].map(lambda x: x.day)
df0["month"] = df0['time'].map(lambda x: x.month)
df0["year"] = df0['time'].map(lambda x: x.year)
df0.to_csv("a2.csv", na_rep="0") # write to csv
# Combine for daily rainfall
df1 = pd.read_csv('a2.csv', encoding='latin-1',
usecols=['day', 'month', 'year', 'RF', 'TimeStamp'])
df2 = df1.groupby(['day', 'month', 'year'], as_index=False).sum()
df2.to_csv("a3.csv", na_rep="0", header=None) # write to csv
# parse date
df3 = pd.read_csv("a3.csv", header=None, index_col='datetime',
parse_dates={'datetime': [1,2,3]},
date_parser=lambda x: pd.datetime.strptime(x, '%d %m %Y'))
def dt_parse(date_string):
dt = pd.datetime.strptime(date_string, '%d %m %Y')
return dt
# sort datetime
df4 = df3.sort()
final = df4.reset_index()
# rename columns
final.columns = ['date', 'bleh', 'rf']
final[['date','rf']].plot()
plt.suptitle('Rain 2015-2016', fontsize=20)
plt.xlabel('Date', fontsize=18)
plt.ylabel('Rain / mm', fontsize=16)
plt.savefig('a.jpg')
plt.show()
我怎样才能自动化这段代码(例如,写一个 for 循环?),这样我就不必为每个 .csv 文件重新键入代码?如果代码还将带有 .csv 名称的图形保存为 .jpg 文件的名称,那就太好了。
这14个文件的名称如下: 名称 = ["a.csv","b.csv","c.csv","d.csv","e.csv","f.csv"...]
这是我正在使用的文件类型的示例:https://dl.dropboxusercontent.com/u/45095175/test.csv
【问题讨论】:
标签: python csv pandas for-loop plot