【问题标题】:count the number of pages in pdf file计算pdf文件的页数
【发布时间】:2014-06-29 03:41:55
【问题描述】:

当我使用此代码计算 pdf 文件中的页数时遇到问题:

if j[i].rstrip() == "Page" or j[i].rstrip() == "page":
            rxcountpages = re.compile(r"/Type\s*/Page([^s]|$)", re.MULTILINE|re.DOTALL)
            data = file("/home/suleiman/Desktop/CVE-2011-2462_36EE5F9C51316E060657AA86D48670E8","rb")

            print len(rxcountpages.findall(data))

错误是:

Traceback(最近一次调用最后一次): 文件“pdf_scanner.py”,第 89 行,在

main()

文件“pdf_scanner.py”,第 72 行,在 main

print len(rxcountpages.findall(data))

TypeError:预期的字符串或缓冲区

有人可以帮我吗?

【问题讨论】:

    标签: python pdf


    【解决方案1】:

    你必须阅读文件的内容:

    data = open("/home/suleiman/Desktop/CVE-2011-2462_36EE5F9C51316E060657AA86D48670E8","rb").read()
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-12-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-11-19
      • 1970-01-01
      • 1970-01-01
      • 2023-02-19
      相关资源
      最近更新 更多