【问题标题】:Converting a docx and uploading to sql table转换 docx 并上传到 sql 表
【发布时间】:2009-08-17 04:48:46
【问题描述】:

我有一个 docx 格式的 word 文档,其中的数据采用重复格式模式。

我想从重复集中取出每个数据并上传到 SQL 表中的一行。

此处的数据示例:

Question No : 1
How is LINQ to SQL different from Entities?

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

Question No : 2
How is NVARCHAR different from VARCHAR

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

我能想到几种方法:
- 使用 Office API 以 docx 格式阅读文档
- 从 Word 将文档另存为 XML 并解析 XML [转换后的 XML 文档似乎没有结构/架构]
- 从 Word 中将文档另存为 HTML 并解析 HTML [DOM 结构格式不正确]

您会建议以上哪一项,为什么?是否有任何工具可以帮助转换文档并上传到 SQL 表或访问数据库?

谢谢!

【问题讨论】:

    标签: sql-server ms-word docx


    【解决方案1】:

    DOCX 只是 XML 文件的 ZIP 目录树。使用 WinZip 或 7-Zip 将其解压缩到一组子目录中。将这些 XML 文件上传到 SQL Server,添加它们的文件名和文件夹路径。 使用 SQL Server XML 方法(.node 等)将它们分解成您想要的关系形式。

    请注意,它们确实具有 XML 模式和结构。

    【讨论】:

      【解决方案2】:

      如果您不经常处理这些文件,那么我会说将其保存为不同的格式(更易于通过 SQL 处理)——甚至可能是纯文本格式。 如果要定期执行此过程(将此文件导入数据库) - 进行本机 DOCX 处理,而不将其转换为中间格式。 快速谷歌搜索显示有可用的组件可以将 docx 格式读入数据库(例如http://www.brothersoft.com/code-library-for-.net-(sql-server-msde)-22050.html

      【讨论】:

        猜你喜欢
        • 2018-09-19
        • 2020-12-13
        • 2010-12-02
        • 2023-02-11
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多