经常遇到由于样本巨大,需要sample一部分文件进行案例分析的情况,下面的程序主要为了随机抽取一个大文件中的N行。

 1 #!/usr/bin/python  
 2 # -*- coding: <encoding name> -*-
 3 import sys
 4 reload(sys)
 5 sys.setdefaultencoding('utf-8')
 6 
 7 import os
 8 import json
 9 import codecs
10 import random
11 import linecache
12 
13 ## from 1 to 1000w or ...
14 Random_number_list=[x for x in range(815003)]
15 ## select 100 or ...
16 Random_data_line = random.sample(Random_number_list, 100)
17 ## open a file
18 write_fname=open('aa.txt','a+')
19 for tmp_line in Random_data_line:
20     tmpdata=linecache.getline('readfile',tmp_line)
21     write_fname.write(tmpdata)
22 write_fname.close()

 

相关文章:

  • 2022-12-23
  • 2021-12-06
  • 2021-12-07
  • 2021-07-06
  • 2021-12-15
  • 2021-12-05
  • 2021-12-05
  • 2022-01-01
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-11-18
相关资源
相似解决方案