【发布时间】:2020-09-08 12:08:40
【问题描述】:
我正在构建一个数据框,需要将定义列表中的值分配给数据框中的新列。我找到了一个答案,它提供了一种将列表中的元素随机分配到数据框中的新列的方法 (How to assign random values from a list to a column in a pandas dataframe?)。
但我希望能够通过分配出现频率或其他方法来控制每个列表元素在数据框中出现的次数,从而控制列表中元素在新数据框中的分布。
例如,如果我有一个列表 my_list = [50, 40, 30, 20, 10] 我怎么能说对于具有 n 行数的数据框 (df) 分配 50 到 10% 的行,40到 20%、30 到 30%、20 到 35% 和 10 到 5% 的行。
欢迎使用任何其他方法来控制列表元素的分布,以上是一个简单的解释,以说明一种能够控制频率的方法可能看起来如何。
【问题讨论】:
标签: python-3.x pandas numpy dataframe