【发布时间】:2021-03-15 20:18:56
【问题描述】:
所以我正在处理 csv 文件并想从中绘制一些图表。但是,我找不到直接从 Dataframe 获取所需信息的方法。代码: 将 numpy 导入为 np 将熊猫导入为 pd
path_main = '850566403_T_ONTIME.csv'
df1 = pd.read_csv(path_main, header=0, sep=",")
#remove columns and rows with nan
df1.dropna(axis=1, how='all', inplace=True)
df = df1.dropna(subset=['ARR_DELAY_NEW'])
所述数据框的输出:
YEAR MONTH AIRLINE_ID DEST_AIRPORT_ID ARR_DELAY_NEW
0 2015 2 19805 12892 0.0
2 2015 2 19805 12892 0.0
3 2015 2 19805 12892 0.0
4 2015 2 19805 12892 0.0
5 2015 2 19805 12892 0.0
... ... ... ... ...
429186 2015 2 19393 14107 0.0
429187 2015 2 19393 14107 35.0
429188 2015 2 19393 14679 99.0
429189 2015 2 19393 14679 23.0
429190 2015 2 19393 14679 20.0
[407663 rows x 5 columns]
我想知道是否有办法让我建立字典。拥有我的航空公司 ID 的键(重复多次),键的值是每个不同 AIRLINE_ID 的“ARR_DELAY_NEW”的平均值。 它看起来像这样:
d = {19805:average1; 19393:average2}
【问题讨论】:
标签: python pandas csv dictionary