GarfieldTom

从博客园或其它地方拷贝代码,经常前面有代码序号,像下面这个样子:

 1 wbContent.Navigate(vURL);
 2
 3     Result:=GetHtml(wbContent);
 4
 5     while not ContainsText(Result,\'共找到\') do
 6     begin
 7       Sleep(100);
 8       Application.ProcessMessages;
 9       Result:=GetHtml(wbContent);
10     end;
11
12     Result:=GetHtml(wbContent);

 

可以使用Python的正则表达式来简单地去掉前面的序号:

 

import re,sys

def refile():
    
    #sf=\'e:\\temp\\t.txt\'
    #df=\'e:\\temp\\t_new.txt\'

    #命令行输入
    argvc=len(sys.argv)
    if argvc==1:
        sf=input(\'请输入要转换的原文件名:\')
        df=input(\'请输入要转换的目标文件名:\')
    if argvc==2:
        sf=sys.argv[1]
        df=input(\'请输入要转换的目标文件名:\')
    if argvc==3:
        sf=sys.argv[1]
        df=sys.argv[2]

    fr=open(sf,\'r\')
    fw=open(df,\'w\')
    pat=re.compile(\'\A(\s\d)|(\d{1,3})\')
    s=fr.readline()
    while s:
       m=pat.match(s)
       s=fr.readline()
       if m:
          ss=re.sub(pat, \'\', s)
       else:
          ss=s
       fw.write(ss+\'\n\')
    fr.close()
    fw.close()

if __name__ == \'__main__\':
    refile()

 

 

上面只是简单示例,将拷贝出来的源码存为t.txt,然后运行程序,则会生成t_new.txt文件。

分类:

技术点:

相关文章:

  • 2021-12-24
  • 2021-11-20
  • 2021-12-24
  • 2021-11-11
  • 2021-10-04
  • 2021-12-12
  • 2021-09-22
猜你喜欢
  • 2021-12-24
  • 2021-12-24
  • 2021-09-30
  • 2021-12-24
  • 2021-07-09
  • 2021-12-06
相关资源
相似解决方案