【发布时间】:2012-07-20 23:55:29
【问题描述】:
我正在为我的学校制作一个应用程序,人们可以检查他们是否有时间表更改。此处列出了所有计划更改:http://www.augustinianum.eu/roosterwijzigingen/14062012.pdf。我想在该页面中搜索关键字(在 EditText 中输入的用户组)。我已经找到了如何让应用程序检查 edittext 是否与某个字符串匹配,所以现在我只需将该页面上的所有文本下载到一个字符串中。但问题是它不是一个简单的网页,而是一个PDFpage。我听说您需要一个特殊的 pdf 库或其他东西来从 PDF 中提取文本,然后将该文本放入一个字符串中,然后使用 contains() 在字符串中搜索关键字。
但是我对此有一些疑问:
此 PDF 是使用 PDF 创建器制作的,它不是扫描页面左右。例如,您实际上可以选择文本或使用 CTRL+F 搜索关键字。所以我想知道是否真的需要提取PDF和其他东西,或者是否有更简单的方法。
我希望应用程序每隔一个小时检查一次更改。所以它还必须每小时下载一次PDF并提取文本(大约8页),那会不会很消耗果汁?
我听说有很多库可以满足我的需求。那么我应该使用哪个? (如果可能的话,我想要一个免费的:))
谁能向我解释如何在我的代码中使用它? (我不是很有经验,所以请保持简单一点:))
非常感谢大家!!!
【问题讨论】:
标签: android eclipse pdf extract download