【问题标题】:Print html portion into pdf using Java使用Java将html部分打印成pdf
【发布时间】:2015-04-04 14:41:24
【问题描述】:

社区!

我的项目很简单:我有一个网站链接,该网站包含不同化学物质的多种信息,我想提取一些数据并放入 pdf 中。事情是我想保留原始 HTML 的格式(当然使用它的 css)。 物质示例:http://www.molbase.com/en/msds_1659-31-0-moldata-2.html#tabs

我使用 jsoup 读取页面底部表格的 HTML,MSDS 之一,包含多个部分,其中包含有关物质的不同信息,但我真的不知道如何将确切的 HTML 格式保存到我的pdf文件。我也尝试过使用 iText,但它给了我“缺少结束标记”错误,如果它有效,它会打印整个页面,而不仅仅是那个 msds 表。

这是我尝试做的,但没有效果:

Document docu = Jsoup.connect(urlbun).get();
        Element tableHeader = docu.select("div[class=\"msds\"]")
                .first();
        String[] finSyn = tableHeader.text().split(" ");
        String moreText =" ";

我试图拆分网页在该 div 下的文本 ("class= "msds""),但我找不到好的方法来拆分它。

拜托,你能告诉我该怎么做吗?即使格式不一样,我希望能够以相同的方式显示信息,带有缩进等。

谢谢!

【问题讨论】:

    标签: java html css pdf


    【解决方案1】:

    您可以将要转换为 PDF 的内容放在 CSS ID(例如 DIV)中,然后使用 PDFmyURL API 仅将该部分转换为 PDF。

    请参考我们的网站about how to select pieces from a page to convert to PDF

    披露:我为拥有该网站的公司工作

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-05-21
      • 2013-06-14
      • 1970-01-01
      • 2010-10-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-04-11
      相关资源
      最近更新 更多