【问题标题】:Select 50 items from list at random从列表中随机选择 50 项写入文件
【发布时间】:2013-03-08 19:51:28
【问题描述】:

到目前为止,我已经弄清楚了如何导入文件、创建新文件和随机化列表。

我无法从列表中随机选择 50 个项目来写入文件?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

所以如果总随机化文件是

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

我想要 3 个文件 (out_file1|2|3),第一个随机集 3,第二个随机集 3,第三个随机集 3(对于这个例子,但我要创建的应该有 50 )

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

所以最后的 '4' 将不包括在内,这很好。

如何从我随机化的列表中选择 50 个?

更好的是,我如何从原始列表中随机选择 50 个?

【问题讨论】:

    标签: python file list select random


    【解决方案1】:

    如果列表是随机排列的,你可以取前 50 个。

    否则,使用

    import random
    random.sample(the_list, 50)
    

    random.sample帮助文字:

    sample(self, population, k) method of random.Random instance
        Chooses k unique random elements from a population sequence.
    
        Returns a new list containing elements from the population while
        leaving the original population unchanged.  The resulting list is
        in selection order so that all sub-slices will also be valid random
        samples.  This allows raffle winners (the sample) to be partitioned
        into grand prize and second place winners (the subslices).
    
        Members of the population need not be hashable or unique.  If the
        population contains repeats, then each occurrence is a possible
        selection in the sample.
    
        To choose a sample in a range of integers, use xrange as an argument.
        This is especially fast and space efficient for sampling from a
        large population:   sample(xrange(10000000), 60)
    

    【讨论】:

    • 我可以让random.sample 也返回它选择的索引吗?
    • 从索引列表 (range(len(list)) 中提取样本,然后从随机索引列表和原始列表中重建样本。
    【解决方案2】:

    选择随机项目的一种简单方法是随机播放然后切片。

    import random
    a = [1,2,3,4,5,6,7,8,9]
    random.shuffle(a)
    print a[:4] # prints 4 random variables
    

    【讨论】:

    • @MonicaHeddneck 为什么随机洗牌和切片会更好?通过随机化选择来选择多个样本是否与随机洗牌然后取一片洗牌样本具有相同的优点?你能解释一下吗?谢谢。
    • 我用它轻松地为机器学习项目创建了一个测试/训练集。使用random.choice(mylist,3) 不会像这样创建两个不相交的集合。
    【解决方案3】:

    我认为random.choice() 是更好的选择。

    import numpy as np
    
    mylist = [13,23,14,52,6,23]
    
    np.random.choice(mylist, 3, replace=False)
    

    函数从列表中返回一个由 3 个随机选择的值组成的数组

    【讨论】:

    • 我认为你需要使用random.choice(mylist, 3, replace=False)。使用 import numpy as npnp.random.choice(mylist, 3, replace=False) 也不会造成混淆
    • 这是有可能重复列表项
    • 不,这不是一个更好的选择,它慢了大约 100 倍
    【解决方案4】:
    1. 我们有 3 个样本(“橙色”、“芒果”、“苹果”)。创建的系列,应包含 7 个元素并从列表中随机选择。

      random.choice
      import random
      
      import numpy as np
      
      fruits = ['orange','mango','apple']
      
      np.random.choice(fruits, 7, replace=True)
      

      输出

      array(['orange', 'mango', 'apple', 'orange', 'orange', 'mango', 'apple'],
            dtype='<U6')
      
    2. 从列表中随机选择(少于 3 个值)

      random.sample
      import random
      
      random.sample(fruits, 3)
      

    【讨论】:

      【解决方案5】:

      假设您的列表有 100 个元素,并且您想随机选择其中的 50 个。以下是要遵循的步骤:

      1. 导入库
      2. 为随机数生成器创建种子,我把它放在了 2
      3. 准备一个随机号码列表
      4. 从数字列表中随机选择

      代码:

      from random import seed
      from random import choice
      
      seed(2)
      numbers = [i for i in range(100)]
      
      print(numbers)
      
      for _ in range(50):
          selection = choice(numbers)
          print(selection)
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-11-17
        • 1970-01-01
        • 2012-09-11
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多