【发布时间】:2017-08-24 07:02:04
【问题描述】:
我正在使用 Excel 中的一个大数据集,我试图在其中按每个索引值的前 25 个对数字进行排序。
数据站点如下所示:
最终的 PAC ID 是公司编号和更改(这不会显示在给定的数据中)。 PAC 贡献是我想要排序的数字。
例如,公司 C00003590 将有 50 个贡献给不同的候选人,金额为“PAC 贡献”,我想对每个公司完成的前 25 个贡献进行排序。
我尝试过使用字典,为每家公司创建一个字典,并将候选数字作为字符串键添加,并将贡献作为值添加。
我目前的代码如下(虽然这可能是完全错误的方法):
import pandas as pd
df1 = pd.read_excel('Test2.xlsx')
dict_company = {}
k1 = str(df1['Final PAC ID'])
k2 = str(df1['Candidate ID'])
for each in range(0,100):
dict_company[k1)[each]] = {}
dict_company[k1)[each]] = k2[each]
if each % 50 == 0:
print(each)
print(dict_company)
for each in range(0,100):
dict_company[k1][k2][each] = round(float(k1[each]))
if each % 50:
print(each)
print(dict_company)
【问题讨论】:
标签: python excel sorting pandas