【问题标题】:Search contents of multiple pdf files and return the pdf's file name and matching content?搜索多个pdf文件的内容并返回pdf的文件名和匹配的内容?
【发布时间】:2013-04-28 13:07:05
【问题描述】:

我试过了:

PDF=$(find /"$DIRECTORY"/ -name '*.pdf' -exec pdftotext {} - \; | grep 'palindrom')

以这种方式,echo "$PDF 仅打印 .pdf 文件中的一些文本,在该文件中找到了我的单词“palindrom”,但我也想知道他在其中找到该单词的 .pdf 文件名。

/"$DIRECTORY"/ 中有很多文件夹、.pdf 和 .txt 文件,所以我只需要返回文本转换与我的单词“回文”匹配的 .pdf 文件

谢谢

【问题讨论】:

    标签: bash unix pdf find pdftotext


    【解决方案1】:

    你能试试下面的命令吗?而不是 'bash' 可能是 'sh' 可能会有所帮助。

    find "$DIRECTORY" -name \*.pdf | xargs -I {} bash -c 'echo {}; less {} | grep palindrom'
    

    【讨论】:

      【解决方案2】:

      find "$DIRECTORY" -name "*.pdf" -exec grep "palindrom"pdftotext "{}"\; -print 可以工作吗?

      编辑:它不喜欢我的反引号:pdftotext "{}" 应该是`pdftotext "{}"`

      【讨论】:

      • 它说:“发现:缺少“-exec”的参数
      • 我不在电脑旁,但你最后输入了什么命令?我知道这让我的建议很奇怪。
      猜你喜欢
      • 2011-06-06
      • 2011-09-25
      • 1970-01-01
      • 2011-08-15
      • 2011-04-21
      • 1970-01-01
      • 2013-05-19
      • 1970-01-01
      • 2017-03-02
      相关资源
      最近更新 更多