【发布时间】:2009-08-17 04:48:46
【问题描述】:
我有一个 docx 格式的 word 文档,其中的数据采用重复格式模式。
我想从重复集中取出每个数据并上传到 SQL 表中的一行。
此处的数据示例:
Question No : 1
How is LINQ to SQL different from Entities?
A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1
Answer : D
Explanations :
Some explanation.
Question No : 2
How is NVARCHAR different from VARCHAR
A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1
Answer : D
Explanations :
Some explanation.
我能想到几种方法:
- 使用 Office API 以 docx 格式阅读文档
- 从 Word 将文档另存为 XML 并解析 XML [转换后的 XML 文档似乎没有结构/架构]
- 从 Word 中将文档另存为 HTML 并解析 HTML [DOM 结构格式不正确]
您会建议以上哪一项,为什么?是否有任何工具可以帮助转换文档并上传到 SQL 表或访问数据库?
谢谢!
【问题讨论】:
标签: sql-server ms-word docx