一、概念分析

1、doc:Word2003版以前的文档保存后缀。docx:Word2007版以后的文档保存后缀。

2、java apache poi组件是专门针对office文档的解析组件,目前是最主流和最成熟的。
重要链接:点击打开链接

3、使用maven需要配置文件,pom.xml即为配置文件。还需要有远程jar包仓库。

二、相关配置

。maven配置

<!-- 加入解析doc,docx的依赖 -->
      <dependency>
         <groupId>org.apache.poi</groupId>
         <artifactId>poi-ooxml</artifactId>
        <version>3.17</version>
      </dependency>
      <dependency>
         <groupId>org.apache.poi</groupId>
         <artifactId>poi-scratchpad</artifactId>
        <version>3.17</version>
      </dependency>

。代码解析

①doc文档解析

Java maven 读取doc,docx文档

②docx文档解析

Java maven 读取doc,docx文档

③测试功能

Java maven 读取doc,docx文档

三、注意事项

1、要将文档放在工程下才可以写相对路径,不然要写绝对路径。

2、有事可以抽取工具类可以抽取出来,方便以后直接调用。

3、引入相关包的时候注意别引错了。

4、写maven配置文件的时候下面有红线旁边没有红点的时候不是错了。

相关文章: