【发布时间】:2016-08-04 15:56:53
【问题描述】:
我有一个熊猫数据框:
x_axis y_axis data
0 Cheese farms 4
1 wales Cheese 3
可以使用以下代码生成:
import pandas
cols=['x_axis','y_axis','data']
row1=['Cheese','farms',4]
row2=['wales','Cheese',3]
data=pandas.DataFrame([row1,row2],columns=cols)
print data
实际上,我拥有的数据要大得多,x 和 y axis 是热图的标签。因为这些标签通常非常大,我想枚举它们并用索引替换它们(跨越x 和y axes 即如果cheese 是1 在x 它也是1 在@ 987654331@)。我还需要能够编写一个将新索引映射到其原始值的图例。
所需的输出可能如下所示:
x_axis y_axis data
0 1 2 4
1 3 1 3
那么传说是:
cheese=1
farms=2
wales=3
谁能给我一些关于如何以编程方式执行此操作的建议?
【问题讨论】:
-
您的映射可能不完全清楚。如果有重复行,例如附加行 row3=['Bread','wales',3],会发生什么?
-
嗨 tfv,所以“面包”总是 4(例如)而 wales 总是 5 - 无论列如何
标签: python string pandas dataframe indexing