【发布时间】:2014-12-06 18:25:18
【问题描述】:
我有一个固定的结构良好的 html 源,传入的数据清晰而小,只包含一个小 div 列表。我知道使用 html 解析器进行 html 解析,但这看起来像一个特殊情况,我不确定我应该使用哪个。下面的问题条件
- 数据清晰且结构合理
- 数据很小
- 性能很重要,应用程序必须能够获取尽可能多的数据
- 应用程序将数据写入 MongoDB 数据库
- 实现编程语言将是 Scala 或 Python
任何意见都很有价值,我该怎么办?
【问题讨论】:
标签: python html regex scala html-parsing