【问题标题】:Expect: extract specific string from output期望:从输出中提取特定字符串
【发布时间】:2015-01-21 06:34:37
【问题描述】:

我正在使用 bash 脚本中的期望在远程计算机上导航基于 Java 的 CLI 菜单,并且我试图在不离开期望会话的情况下从输出中提取某些内容。

我的脚本中的期望命令是:

expect -c "
spawn ssh user@host
expect \"#\"
send \"java cli menu command here\r\"
expect \"java cli prompt\"
send \"java menu command\"
"
###I want to extract a specific string from the above output###

预期输出是:

Id       Name
-------------------
abcd 12  John Smith

我想从上面的输出中提取abcd 12 到另一个expect 变量中,以便在expect 脚本中进一步使用。这是第 3 行,第一个字段,使用双空格分隔符。 awk 等效项是:awk -F ' ' 'NR==3 {$1}'

最大的问题是,如上所述,我使用 Expect 导航的环境是基于 Java CLI 的菜单,因此我不能只使用 awk 或 bash shell 提供的任何其他东西。

退出 Java 菜单,处理输出然后再次进入不是一个选项,因为登录过程持续 15 秒,所以我需要留在里面并仅使用预期内部命令从输出中提取我需要的内容。

【问题讨论】:

  • 问题的核心是您试图将期望脚本放入双引号外壳文字中。这将迫使您使用 lots 的反斜杠引用。虽然您可以这样做,但将期望脚本放在它自己的文件中(例如,mydostuff.exp)会使一切变得简单得多。然后你可以用expect mydostuff.exp运行它...

标签: tcl expect


【解决方案1】:

您可以使用-re 标志直接在expect 中使用regexp。感谢 Donal 指出单引号和双引号问题。我已经使用两种方式给出了解决方案。

我创建了一个文件,内容如下,

Id       Name
-------------------
abcd 12  John Smith

这不过是您的 java 程序的控制台输出。我已经在我的系统中对此进行了测试。即我刚刚用cat 模拟了你的程序的输出。您只需用您的程序命令替换cat 代码。简单的。 :)

双引号:

#!/bin/bash
expect -c "
spawn ssh user@domain
expect \"password\"
send \"mypassword\r\"
expect {\\\$} { puts matched_literal_dollar_sign}
send \"cat input_file\r\"; # Replace this code with your java program commands
expect -re {-\r\n(.*?)\s\s}
set output \$expect_out(1,string)
#puts \$expect_out(1,string)
puts \"Result : \$output\"
"

单引号:

#!/bin/bash
expect -c '
spawn ssh user@domain
expect "password"
send "mypasswordhere\r"
expect "\\\$" { puts matched_literal_dollar_sign}
send "cat input_file\r"; # Replace this code with your java program commands
expect -re {-\r\n(.*?)\s\s}
set output $expect_out(1,string)
#puts $expect_out(1,string)
puts "Result : $output"
'

如您所见,我使用了{-\r\n(.*?)\s\s}。这里的大括号防止任何变量替换。在您的输出中,我们有一个充满连字符的第二行。然后换行。然后是您的第 3 行内容。让我们解码使用的正则表达式。

-\r\n 是将一个文字连字符和一个新行匹配在一起。这将匹配第二行中的最后一个连字符和换行符,而换行符现在又进入第三行。因此,.*? 将匹配所需的输出(即 abcd 12),直到遇到与 \s\s 匹配的双倍空格。

您可能想知道为什么我需要用于获取子匹配模式的括号。

一般情况下,expect 会将 expect 的整个匹配字符串保存在 expect_out(0,string) 中,并将所有匹配/不匹配的输入缓冲到 expect_out(buffer)。每个子匹配都会保存在后续的字符串编号中,如expect_out(1,string)expect_out(2,string)等。

正如 Donal 所指出的,最好使用单引号的方法,因为它看起来不那么凌乱。 :)

在双引号的情况下,不需要用反斜杠转义\r

更新:

我已将 regexp-\r\n(\w+\s+\w+)\s\s 更改为 -\r\n(.*?)\s\s

通过这种方式-您的要求-例如match any number of letters and single spaces until you encounter first occurrence of double spaces in the output

现在,让我们来回答您的问题。您提到您已经尝试过-\r\n(\w+)\s\s。但是,\w+ 存在问题。请记住 \w+ 不会匹配空格字符。您的输出中有一些空格,直到双倍空格。

正则表达式的使用取决于您对要匹配的输入字符串的要求。您可以根据需要自定义正则表达式。

更新版本 2:

.*?有什么意义。如果您单独询问,我将重复您的评论。在正则表达式中,* 是一个贪心运算符,? 是我们的救命稻草。让我们将字符串视为

Stackoverflow is already overflowing with number of users.

现在,看看正则表达式.*flow的效果如下。

* 匹配任意数量的字符。 更准确地说,它匹配尽可能长的字符串,同时仍然允许模式本身匹配。 因此,模式中的.* 匹配模式匹配中的字符Stackoverflow is already overflow字符串中的文本flow

现在,为了防止.* 仅匹配字符串flow 的第一次出现,我们将? 添加到它。它将帮助模式以非贪婪的方式表现。

现在,再次回到您的问题。如果我们使用了.*\s\s,那么它将匹配整行,因为它试图尽可能地匹配。这是正则表达式的常见行为。

更新版本 3:

按以下方式编写您的代码。

x=$(expect -c "
spawn ssh user@host
expect \"password\"
send \"password\r\"
expect {\\\$} { puts matched_literal_dollar_sign}
send \"cat input\r\"
expect -re {-\r\n(.*?)\s\s}
if {![info exists expect_out(1,string)]} {
        puts \"Match did not happen :(\"
        exit 1
}
set output \$expect_out(1,string)
#puts \$expect_out(1,string)
puts \"Result : \$output\"
")
y=$?

# $x now contains the output from the 'expect' command, and $y contains the
# exit status
echo $x
echo $y;

如果流程正常,则退出代码的值为0。否则,它将为1。这样,您可以在bash脚本中检查返回值。

查看here 以了解info exists 命令。

【讨论】:

  • 您需要反斜杠引用$ 否则unix shell 会破坏它;使用expect -c "…" 只会给所有东西添加整层烦人的混乱。 \rs 可能还需要一个额外的反斜杠。
  • @linux_newbie :我已经更新了我的答案。请检查。
  • @DonalFellows:非常感谢 Donal 帮助我了解更多相关信息。我已经更正并测试了我的答案。让我知道任何其他更改。
  • 谢谢你们,我刚试过,它有效。但是我的 Java 命令的输出是可变的,有时我可以使用 abcabc def ghiabc def ghi jkl 而不是 abcd 12。我正在尝试使用一个正则表达式,它基本上说“匹配任意数量的字母和单个空格,直到你遇到双空格”,但我没有设法让它工作。如果您有任何建议,我将不胜感激。
  • 我不明白为什么下面的正则表达式不能匹配任意数量的“单词”:-\r\n(\w+)\s\s\w+ 不是表示“至少匹配一次”吗?从 tcl man 中,一个词定义为:[[:alnum:]_] 事实上,我的正则表达式不匹配任何内容,即使结果是单个词也不匹配。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-06-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多