【发布时间】:2014-11-11 18:17:31
【问题描述】:
这是我的 pdf 我找到了THIS,并用它来废弃我的 pdf。
6 BEDROOMS
NameAddressUnitSizeKeyRentSq FtMove in DateNotesTenant
Prop #
Texan 261009 West 26th3076x3$4,6952,1368/15/14$1,000 Bonus (1) Park -
它很混乱。还是因为 PDF 的格式不可读?我认为有一种方法可以废弃每一行并通过迭代或其他方式创建包含列的 CSV。
就像用列填充 CSV
T26 | Texan 26 | 1009 West 26th | 307 | 6x3 | ...
e075| Texan North Campus| 5117 N Lamar |See below | 6x3 |...
有没有办法解决这个问题?
【问题讨论】:
-
能否提供实际的PDF文档?
标签: python pdf scrapy pdf-scraping