【问题标题】:Construction of XSSFWorkbook very slow for .xlsm workbooks.xlsm 工作簿的 XSSFWorkbook 构建速度非常慢
【发布时间】:2012-08-23 12:24:17
【问题描述】:

我们有一个预先创建的 Excel 文件,其中包含可交叉引用工作表的精美图表和公式。它还包含宏。源数据应该复制粘贴到一张纸中,工作簿的其余部分从预先存在的布线中填充。

注意:我真的不关心阅读/修改此工作簿中的其他工作表,我只需要省去每次复制粘贴原始数据到此工作簿中此数据表的痛苦.

我正在使用 Apache POI 并尝试从这个“模板”excel 文件创建一个 XSSFWorkbook 实例。但是,构建此对象需要很长时间(在多次运行中几乎持续一分钟)。 excel文件本身只有400KB左右,不是一个大文件。我使用 jconsole 对此进行了分析,它似乎不受 CPU 或堆的限制 - 它仅使用大约 90 MB 的堆内存(我用 2GB 的已提交堆启动它)和大约 52% 的 CPU。

用原始数据实际填充数据表并写出最终更新的文件需要很短的时间(大约 3-4 秒)。这是我的启动代码:

public static void startup() throws FileNotFoundException, IOException {
    long start = System.nanoTime();
    System.out.println("Started...");
    TEMPLATE_WORKBOOK = new XSSFWorkbook(new FileInputStream(new File(TEMPLATE)));
    long end = (System.nanoTime() - start) / NANOS;
    System.out.println("It took " + end + " seconds..");
}

我曾考虑加载此 TEMPLATE_WORKBOOK 一次,然后重用相同的句柄为每个后续请求写入新数据 - 我在我的主类中用睡眠和永远模拟了这一点。但我显然不能这样做,我得到了一个异常“线程“主”org.apache.xmlbeans.impl.values.XmlValueDisconnectedException中的异常”。 TEMPLATE_WORKBOOK 对象不可重用。

我确实看到有一个基于事件的 API,但在我进入它之前,我想看看我是否在这里遗漏了什么!同样,内存/CPU 在这里不是问题,我们有足够的堆空间。我正在努力减少时间。

P.S:我在这里尝试了提示:XSSFWorkbook takes a lot of time to load - 它们对启动时间没有帮助。

【问题讨论】:

  • 您只想将数据复制到您的“数据表”中?
  • 是的,你是对的!这就是我需要做的一切......

标签: java apache-poi


【解决方案1】:

我认为你在你想做的事情上处于不利地位。我遇到了同样的问题(请参阅here),不幸的是,您的情况没有解决方案。

即使您想在数据表中恰到好处,唯一的方法就是以XSSFWorkbook 的形式打开文件,即使在基于事件的 API 中也是如此。

SXSSFWorkbook 不能从文件、InputStream 或 OPCPackage 构造。您只能从头开始构建它或从 XSSFWorkbook 构建它。

唯一真正可怕耗时的可能解决方案(我不知道是否可能)是尝试使用读取解析器输入数据,这意味着您应该自己将excel文件解析为xml。

我们的最终解决方案是等待解决我们问题的解决方案。

很抱歉,您无法得到您想要的答案。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-08-19
    • 2020-12-14
    • 1970-01-01
    • 2017-03-15
    • 2014-02-03
    • 1970-01-01
    • 1970-01-01
    • 2018-05-02
    相关资源
    最近更新 更多