【问题标题】:Docx to HTML using phpdocx使用 phpdocx 将 Docx 转换为 HTML
【发布时间】:2012-08-05 03:01:27
【问题描述】:

我在将 .docx 转换为 html 时遇到了麻烦... 我正在使用PHPDOCX FREE 来处理这个问题...... 我有一些问题,我能够确定问题出在哪里.. 它在下一段代码中:

$xmlDOM = new DOMDocument();
$xml = str_replace('</w:wordDocument>', '', $xml);
$xml = preg_replace(
  '/(<w:wordDocument)+(.)*(><w:body>)/', '<w:body>', $xml
 );

特别是在“preg_replace”函数中... 它使服务器如此繁忙......所以我无法工作,直到我重新启动服务器......

【问题讨论】:

  • 您的文档很大?
  • 作为 salaamu alaikum @Ibrahim.I ...你能分享我你的工作代码吗..我在这个问题上也遇到了麻烦..提前谢谢..
  • @786 你还在吗?通过我的电子邮件“ibrah.ibra@gmail.com”与我联系

标签: php xml xml-parsing ms-word


【解决方案1】:

尝试替换这个:

$xml = preg_replace(
  '/(<w:wordDocument)+(.)*(><w:body>)/', '<w:body>', $xml
 );

通过这个:

$xml = preg_replace(
  '/<w:wordDocument.*?><w:body>/', '<w:body>', $xml
 );

或者只是(如果 wordDocument 标签后面总是跟着 body 标签):

$xml = preg_replace(
  '/<w:wordDocument.*?>/', '', $xml
 );

使用括号使php 使用更多的mamory。 你得到的是哪个 PHP 版本?

【讨论】:

  • 我将其替换为第一选择并且它有效...但不幸的是它没有给我我想要的...它提供了未格式化的 html 文件...在生成的 html 代码中有我不知道它们来自哪里的 css 类......比如 Title-P 和 Heading1-P 和 ListParagraph-P ......等等有什么帮助吗??
  • 帮不了你更多(我从来没有使用过那个库),但我认为它们是用那个库生成的以格式化写作(你会看到你在 word doc 中使用的样式被转换为 css样式)
  • 这就是问题所在......没有包含这些类的css文件......无论如何,非常感谢你......
猜你喜欢
  • 2014-08-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-03-31
  • 2013-01-05
  • 1970-01-01
  • 2023-03-05
相关资源
最近更新 更多