【发布时间】:2016-10-14 07:34:54
【问题描述】:
我尝试过很多类似How to extract text from word file .doc,docx,.xlsx,.pptx php 的方法。 但这不是解决方案。
我的服务器基于 Linux,因此启用 extension=php_com_dotnet.dll 不是解决方案。
另一个解决方案是在服务器上安装 LIBRE office 并将 .doc 文件即时转换为 .txt ,然后计算该文件中的单词。这是一项非常繁琐且耗时的工作。
我只需要一个简单的 php 脚本,从 .doc 文件中删除特殊字符并计算字数。
【问题讨论】:
-
.doc 几乎无法被任何非 Microsoft Word 软件解析。如果可能的话,我建议使用其他文件格式。
-
我正在开发一个 wordpress pluing 来计算文件中的单词数。这还包括 .doc 文件,因为您知道它们是广泛使用的扩展名。所以我不能忽略 .doc 文件