【发布时间】:2012-11-08 23:18:02
【问题描述】:
我有一个 Java 应用程序,它将解析 html 页面并从中提取数据。目前,我有一个类作为模板或说明如何阅读特定网页。该应用程序将需要从几个不同的站点读取,这些站点的格式将不同。我希望能够读取随附的 XML 文件(或其他文档),而不是为每种格式创建一个新的模板类,该文件将提供有关哪些数据和提取位置的说明。
我试图在互联网上搜索如何做到这一点,但我猜我没有问正确的问题或使用正确的关键字。
解决方案不一定要用 XML 作为模板,但这是我的第一个想法。
谁能指出我正确的方向?
【问题讨论】: