【发布时间】:2013-01-22 09:28:29
【问题描述】:
我正在开发一个项目(asp.net、c#、vb 2010、.net 4),我需要阅读我之前上传的 DOC 和 DOCX 文件(我已经完成了上传部分)。棘手的部分是我没有在服务器上安装 MS Office 并且我无法使用它。
是否有任何公共库可以包含在我的项目中而无需安装任何东西? 两个文档都非常简单:
NUMBER TAB STRING
NUMBER TAB STRING
NUMBER TAB STRING
...
我需要为每一行(段落)提取数字和字符串。
有人可以帮忙吗?我应该再次重申,我受到限制,无法在服务器上安装任何东西。
【问题讨论】:
-
文档和文档? docx 是一个 zip 风格的 XML 文档压缩存档和可能的二进制文件(如果图像在其中等),doc 是二进制编码的 - 需要完全不同的引擎。
-
对于 DOCX,有免费和商业图书馆,但对于 DOC,我所知道的唯一选择是商业......商业图书馆是一种选择吗?
-
@TomTom 是的,我知道 doc 和 docx 有不同的背景,但我很想知道它是否可以以某种方式合并到一个库中?或者是否有两个库我以后可以自己合并...谢谢
-
肯定有 2 个库。并且可能是 .doc 的商业版
-
你完全不需要商业图书馆。好吧,除非您真的无法安装任何东西,而不仅仅是无法安装大型、面向客户端的应用程序。否则,您可以使用Office IFilter,它在技术上安装了something,但第三方库不也是吗?