环境安装:

pip install tabula-py

 

代码如下:

import tabula

df = tabula.read_pdf("111.pdf", encoding='utf-8', pages='all')
# print(type(df))

for indexs in df.index:
    print(df.loc[indexs].values)

输出结果如下:

使用tabula处理pdf

切记,一定要安装pip install tabula-py

而不是:pip install tabula

否则会出现一大堆的No name ------

搞了一早上,才有的数据!

相关文章: