【发布时间】:2012-06-13 00:31:24
【问题描述】:
在我的应用程序中,我将收到一个文件。我必须检查文件是否具有可搜索的文本(文本内容)或不可搜索的文本(图像)并显示。
我不能使用文件扩展名,因为在 PDF 文件中,我们也可以有不可搜索的类型。
为此我需要 Java 代码。谁能帮帮我。
【问题讨论】:
-
我觉得这个链接可以帮到你:stackoverflow.com/q/620993/1001027
-
对于 PDF 文件,您必须实际打开文件并检查其结构以查看其包含的数据类型。其他文件类型也是如此,例如 Word 文档。这是大量的工作:您必须实际实现对您希望程序理解的每种文件格式的支持。没有神奇的
File.containsSearchableData()方法。
标签: java