【问题标题】:how to extract contents from flv file using any web crawler?如何使用任何网络爬虫从 flv 文件中提取内容?
【发布时间】:2013-05-14 09:31:23
【问题描述】:

我的要求是从 flv 文件中提取文本和音频。请建议我如何使用任何网络爬虫来实现这一目标。如果网络爬虫无法使用,请向我推荐任何其他工具。

谢谢

【问题讨论】:

    标签: parsing flv web-crawler nutch


    【解决方案1】:

    使用 Nutch,您可以从 FLV 文件中解析和提取元数据。 如果文本已作为元数据的一部分添加到文件中,您可以使用 Nutch 检索它并将其放入数据库中。

    但您可能应该结合使用 wget(下载内容)+“FLV 流提取工具”来实现您的需求。

    Nutch

    Wget

    FLV metadata

    【讨论】:

    • 感谢您的回复,但我怀疑我们不能从 flv 文件中获取文本,如果它包含任何文本....如果不建议我使用任何其他工具,请建议我这样做跨度>
    • 如果文本是指“硬文本”作为框架位图的一部分,那么不;这将需要某种 OCR 功能。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-03-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多