【问题标题】:phpdocx, docx to html converter returns broken span tagsphpdocx,docx 到 html 转换器返回损坏的 span 标签
【发布时间】:2012-08-27 17:25:34
【问题描述】:

我已经成功使用免费版的phpdocx php库将docx文件转换成html文件了。

问题是输出通常包含如下所示的行:

<span style=" font-family:;">This line is</span><span style=" font-family:;">completely b</span><span style=" font-family:;">roken</span><span style=" font-family:;">b</span><span style=" font-family:;">ecause of the random span tags

和在浏览器中看到的一样:

“由于随机跨度标签,此行完全断开”

我在清理 html 输出时尝试通过删除任何不必要的 span 标签并在每个标签周围放置空格来修复它。但当然它只修复了一些实例,实际上在其他地方中断了。有了上面的行,它会产生:

“由于随机跨度标签,这一行完全被破坏了。”

目前,防止跨度标签出现的唯一方法是选择并删除与 Word 中的句子关联的任何样式。如果您已经能够在 Word 中发现问题,那将是可以接受的,但实际上不能。

您对 phpdocx 有任何经验吗?是否有解决方案?

谢谢。

【问题讨论】:

  • 你试过了吗   ??
  • 嗨普拉莫德,你是什么意思?这是我从转换器获得的直接输出。我认为您无法控制 Word 中的间距?
  • 嗨@Dusty你能和我分享你的工作代码吗..这将是一个很大的帮助..对我来说..我也希望将doxc或doc文件转换为html格式..提前谢谢..你可以给我发电子邮件:admin@muhammadsufiyan.in

标签: php docx


【解决方案1】:

废话!问题是我自己的清理工作。即以下代码:

$result = preg_replace('~>\s+<~', '><', $result);

结案。

谢谢。

【讨论】:

  • 嗨@Dusty你能和我分享你的工作代码吗..这将是一个很大的帮助..对我来说..我也希望将doxc或doc文件转换为html格式..提前谢谢..你可以给我发电子邮件:admin@muhammadsufiyan.in
猜你喜欢
  • 1970-01-01
  • 2016-05-24
  • 1970-01-01
  • 2016-12-30
  • 2021-01-30
  • 1970-01-01
  • 2013-07-10
  • 2017-07-18
  • 1970-01-01
相关资源
最近更新 更多