【发布时间】:2013-11-03 18:00:48
【问题描述】:
以下来自dataferame(底部)的摘录有一个以区域和Quardate为索引的多索引,我想获得一个具有相同索引的新数据框,并且只有每个区域具有最大日期的行..我不知道如何访问数据框索引值。 我想要类似的东西:
most_recent_date=totRegscore.region.Quradate.max()
这只是告诉我'DataFrame'对象没有属性'region' 我也想做:
last_quarter = most_recent_date - relativedelta(months=3)
然后做类似的事情:
quarter_score_diff = [most_recent_date, last_quarter].diff()
这是我无法工作的答案的变体...Summary calculations on a Pandas Dataframe 示例输入:
Score1 Score2
region Quradate
North_Central-Birmingham-Tuscaloosa-Anniston 2010-01-15 47 50
2010-04-15 45 60
2010-07-15 45 40
我认为此时我的主要问题是无法使用索引名称选择多索引数据帧的特定行...... 因此,在获得一个只有当前日期的 dF 和一个只有上个季度日期的 dF 时,两个数据框的差异看起来像 示例输出:
Score1 Score2
region Quradate
quarterly_diff North_Central-Birmingham-Tuscaloosa-Anniston 2010-07-15 7 6
quarterly_diff Huntsville 2010-07-15 6 5
【问题讨论】:
-
可能只有我一个人,但如果您添加示例输入和示例所需的输出,创建工作解决方案会容易得多
-
编辑问题以澄清输入和输出(我希望)
-
显示一些生成您开始使用的确切数据帧的代码会有所帮助,这看起来您需要使用
xs,请参阅here