【问题标题】:Reformatting an wysiwyg generated html file重新格式化所见即所得生成的 html 文件
【发布时间】:2009-07-21 11:50:10
【问题描述】:

我正在阅读我认为只是 .html 文件中的基本文本的内容,我想在 asp.net 网页上显示它。

我设置了一些 css 格式,但它似乎并没有完全起作用。我找到了它的底部,因为问题是现在我查看了我认为是原始文本的结果:

<SPAN style="FONT-SIZE: 16pt">
<P style="TEXT-ALIGN: center; MARGIN: 0in 0in 0pt" class=MsoNormal                                 
align=center><SPAN    style="FONT-SIZE: 16pt"><?xml:namespace prefix = o ns = 
"urn:schemas-  microsoft-com:office:office" /><o:p></o:p></SPAN></P><SPAN 
style="FONT-SIZE: 16pt"><o:p> 
<P style="TEXT-ALIGN: center; MARGIN: 0in 0in 0pt" class=MsoNormal align=center><SPAN   
style="FONT-SIZE: 16pt">General Manager’s Corner<o:p></o:p></SPAN></P>  
<P style="TEXT-ALIGN: center; MARGIN: 0in 0in 0pt" class=MsoNormal align=center><SPAN   
style="FONT-SIZE: 16pt">July 2009<o:p></o:p></SPAN></P>  
<P style="TEXT-ALIGN: center; MARGIN: 0in 0in 0pt" class=MsoNormal align=center><SPAN   
style="FONT-SIZE: 16pt"><o:p>&nbsp;</o:p></SPAN></P>  

这看起来像是来自 microsoft word 或带有一些内联格式的东西。

有没有我可以的:

  1. 删除所有内联格式
  2. 让我的 css 覆盖内联格式。

【问题讨论】:

    标签: asp.net css


    【解决方案1】:

    有一个用于剥离由单词生成的 HTML 的小 API,称为 WordOff。也许你可以使用那个?

    【讨论】:

      【解决方案2】:

      内联格式更具体,所以我很确定每次涉及 CSS 时都会胜出。

      至于删除实际的内联格式本身,一个快速的谷歌显示了一些选项,你可以使用一些免费的一些不是

      【讨论】:

        【解决方案3】:

        您也许可以使用 !important hack 来覆盖 CSS 中的内联样式。

        至于删除内联格式,您可以尝试谷歌搜索paste from word 或想出自己的正则表达式来丢弃标记名本身之后的标记中的所有内容。

        【讨论】:

          【解决方案4】:

          您可以应用几个简单的正则表达式模式来删除格式:

          风格:

          style="[^"]*"
          

          对于类和对齐:

          (align|class)=[A-Za-z]*
          

          要玩这些表达式,您可以使用这个在线工具:http://www.regextester.com/

          【讨论】:

            【解决方案5】:

            我只是手工编写了一些查找和替换的代码。花太多时间尝试几乎都可以完成工作的第三方工具。

            【讨论】:

              猜你喜欢
              • 1970-01-01
              • 1970-01-01
              • 1970-01-01
              • 2010-11-08
              • 1970-01-01
              • 1970-01-01
              • 1970-01-01
              • 1970-01-01
              • 1970-01-01
              相关资源
              最近更新 更多