【发布时间】:2020-10-05 02:49:54
【问题描述】:
我希望这个问题很清楚,但我正在调查 Zillow 房屋销售数据,并且无法将某些年份的所有月份合并到新声明的“年份”变量中。这实际上应该将所有具有 Jan-YY、Feb-YY、Mar-YY...等的数据存储到 YY。
我尝试过 Pandas 内置的函数,例如 Stack() 和 Pivot(),但这些似乎都不起作用。
如果没有可行的方法来做到这一点,我有什么替代方案?提前致谢!
示例: 取 Column1 = '1/31/1996' 和 Column2 = '2/28/1996'...等。和 Column12 = '12/31/1996' 并组合成一个新的 名为 Y1996 的列。这将比每月细分更容易分析。
我的代码:
import pandas as pd
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt
%matplotlib inline
zil = pd.read_csv('zillow.csv')
df_zil = pd.DataFrame(df_zil)
df_zil.head(4)
#My attempt at merging into one
y1996 = (df_zil['1/31/1996'] + df_zil['3/31/1996'] + df_zil['4/30/1996'] + df_zil['5/31/1996'] +
df_zil['6/30/1996'] + df_zil['7/31/1996'] + df_zil['8/31/1996'] + df_zil['9/30/1996'] +
df_zil['10/31/1996'] + df_zil['11/30/1996'] + df_zil['12/31/1996'])
Screen shot of how data is formatted via excel -- Starts on Column I
参考 Zillow 数据:https://www.zillow.com/research/data/
【问题讨论】: