【发布时间】:2020-12-13 11:13:20
【问题描述】:
我有一个包含多列元组数据的数据框。我正在尝试对每列每行的元组中的数据进行规范化。这是一个带有列表的示例,但对于元组也应该是相同的概念-
df = pd.DataFrame(np.random.randn(5, 10), columns=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'])
df['arr1'] = df[['a', 'b', 'c', 'd', 'e']].values.tolist()
df['arr2'] = df[['f', 'g', 'h', 'i', 'j']].values.tolist()
如果我希望为几列标准化每个列表行,我会这样做-
df['arr1'] = [preprocessing.scale(row) for row in df['arr1']]
df['arr2'] = [preprocessing.scale(row) for row in df['arr2']]
但是,由于我的原始数据集中有大约 100 个这样的列,我显然不想手动对每列进行标准化。如何循环遍历所有列?
【问题讨论】:
标签: python pandas list tuples normalization