【发布时间】:2013-11-25 00:12:39
【问题描述】:
我正在尝试实时解析程序块缓冲的输出,这意味着在进程结束之前输出不可用。我需要的只是逐行解析,过滤和管理输出中的数据,因为它可以运行几个小时。
我尝试使用 subprocess.Popen() 捕获输出,但是是的,正如您可能猜到的那样,Popen 无法管理这种行为,它会一直缓冲直到进程结束。
from subprocess import Popen, PIPE
p = Popen("my noisy stuff ", shell=True, stdout=PIPE, stderr=PIPE)
for line in p.stdout.readlines():
#parsing text and getting data
所以我找到了 pexpect,它实时打印输出,因为它将标准输出视为一个文件,或者我什至可以做一个肮脏的把戏,打印出一个文件并在函数之外解析它。但是好吧,它太脏了,即使对我来说也是如此;)
import pexpect
import sys
pexpect.run("my noisy stuff", logfile=sys.stdout)
但我想这应该是一种更好的 Pythonic 方式,只需像子进程一样管理标准输出。波本可以。我该怎么做?
编辑:
运行 J.F. 提案:
这是一次故意错误的审核,大约需要 25 秒。停下来。
from subprocess import Popen, PIPE
command = "bully mon0 -e ESSID -c 8 -b aa:bb:cc:dd:ee:00 -v 2"
p = Popen(command, shell=True, stdout=PIPE, stderr=PIPE)
for line in iter(p.stdout.readline, b''):
print "inside loop"
print line
print "outside loop"
p.stdout.close()
p.wait()
#$ sudo python SCRIPT.py
### <= 25 secs later......
# inside loop
#[!] Bully v1.0-21 - WPS vulnerability assessment utility
#inside loop
#[!] Using 'ee:cc:bb:aa:bb:ee' for the source MAC address
#inside loop
#[X] Unable to get a beacon from the AP, possible causes are
#inside loop
#[.] an invalid --bssid or -essid was provided,
#inside loop
#[.] the access point isn't on channel '8',
#inside loop
#[.] you aren't close enough to the access point.
#outside loop
改用此方法: 编辑:由于输出中的大量延迟和超时,我不得不修复孩子,并添加了一些技巧,所以最终代码看起来像这样
import pexpect
child = pexpect.spawn(command)
child.maxsize = 1 #Turns off buffering
child.timeout = 50 # default is 30, insufficient for me. Crashes were due to this param.
for line in child:
print line,
child.close()
返回相同的输出,但它实时打印行。所以...解决了谢谢@J.F.塞巴斯蒂安
【问题讨论】:
-
您需要发送对命令的回复还是只是读取输出?对于可能运行数小时的程序,您需要行缓冲输出还是块缓冲输出(例如,使用 4096 字节缓冲区)就足够了?
-
嗨,J.F. 我只需要解析输出。该程序本身审核数据流,因此我想根据该程序的输出行为管理其他程序。所以我的代码会不断读取输出。
-
使用
print line,(注意:逗号结尾——sys.stdout.softspacehack)来避免重复换行。
标签: python parsing subprocess output pexpect