【发布时间】:2013-05-14 09:31:23
【问题描述】:
我的要求是从 flv 文件中提取文本和音频。请建议我如何使用任何网络爬虫来实现这一目标。如果网络爬虫无法使用,请向我推荐任何其他工具。
谢谢
【问题讨论】:
标签: parsing flv web-crawler nutch
我的要求是从 flv 文件中提取文本和音频。请建议我如何使用任何网络爬虫来实现这一目标。如果网络爬虫无法使用,请向我推荐任何其他工具。
谢谢
【问题讨论】:
标签: parsing flv web-crawler nutch
使用 Nutch,您可以从 FLV 文件中解析和提取元数据。 如果文本已作为元数据的一部分添加到文件中,您可以使用 Nutch 检索它并将其放入数据库中。
但您可能应该结合使用 wget(下载内容)+“FLV 流提取工具”来实现您的需求。
【讨论】: