【发布时间】:2021-07-14 11:43:34
【问题描述】:
我在 laravel 中使用 IMAP 包来获取电子邮件的正文,但即使在进行了一些剥离之后,我仍然会得到很多 HTML 工件。
我现在正在使用这些功能:
$styles_removed = preg_replace('/(<(script|style)\b[^>]*>).*?(<\/\2>)/is', "$1$3", $body);
$fixed_body = strip_tags($styles_removed);
$strip_body = utf8_decode($fixed_body);
$formatted_body = preg_replace('/\s+|body {.*}/', ' ', $strip_body);
完成此操作后,我正在转储 $formatted_body 并获取此示例:
I?m trying to start a thread &nbsp; &nbsp; Jon Doe &nbsp;&nbsp; Sales &amp; Service &nbsp;&nbsp;
我是否缺少一个我应该在现有函数之上使用的函数,它将 & 和 nbsp 转换为其实际字符?
【问题讨论】: