【发布时间】:2023-03-29 21:52:01
【问题描述】:
我有一个看起来像这样的字典,其中的值是相同数量索引的列表。它是构建一个熊猫数据框。我想获取这些列表中每个索引的最大值的键名。 (即这些列表的第一个索引为 0.00023478,第四个索引为 0.23849287)。我试图将其转换为熊猫数据框,然后找到最大索引,但这需要太多时间,因为我处理的数据太多。我需要找到特定索引的最大值,然后在将字典转换为数据框之前返回键。
{'DT': [0, 0, 0, 0, 0, 0, 0, 0], 'NN': [0.00023478, 0, 0, 0, 0, 0, 0, 0],
'POS': [0, 0, 0, 0.000192837, 0, 0, 0, 0], 'MD': [0, 0, 0, 0, 0, 0, 0, 0],
'VB': [0, 0, 0, 0, 0, 0, 0, 0], 'VBN': [0, 0, 0, 0, 0, 0, 0, 0],
'IN': [0.0000028945, 0, 0, 0, 0, 0, 0, 0], 'JJ': [0, 0, 0, 0, 0, 0, 0, 0],
'NNS': [0, 0, 0, 0, 0, 0, 0, 0], 'CC': [0, 0, 0, 0.23849287, 0, 0, 0, 0],
'RBS': [0, 0, 0, 0, 0, 0, 0, 0], 'NNP': [0, 0, 0, 0, 0, 0, 0, 0],
'VBZ': [0, 0, 0, 0, 0, 0, 0, 0], 'TO': [0, 0, 0, 0, 0, 0, 0, 0]}
for i in range(len(test)): # how many sentence
list1 = [[0 for x in range(len(test[i]))] for y in range(len(pos_list))]
q = dict(zip(pos_list, list1))
for j in range(len(test[i])):
【问题讨论】:
-
你试过了吗:
pd.DataFrame(data=data).idxmax(1)?
标签: python arrays pandas dataframe dictionary