【发布时间】:2013-02-09 22:26:37
【问题描述】:
我有一个包含 400k 帖子的 mysql 数据库。在 arround 100k 帖子中是图像。示例:
text text text <img src="/images/test.jpg"> text text text
必须删除完整的图像字符串<img src="/images/test.jpg">。但它并不总是<img src/images/test.jpg"> 有很多变体。所以我不能使用典型的 sql replace 。
我需要的是“两个字符之间的 sql 替换”。对我来说,删除/替换 "<img" and ">" 之间的所有内容,当然不包括 <img and >
这可能吗? 谢谢
【问题讨论】:
-
数据库部分不是重要部分。您真正在谈论的是解析 HTML。查看htmlparsing.com 的想法。仅使用 SQL 是无法做到这一点的。
-
非常感谢您的快速回复。 100k 条目很多。我需要从数据库中删除这些图像。我知道我可以在它们显示之前用 php 替换它们,但对我来说,最好直接删除数据库中的图像。我尝试使用类似 stackoverflow.com/questions/8850798/sql-replace-all-characters-between-two-strings 但没有成功。谢谢你的帮助。
-
添加了正则表达式标签以扩大受众范围。我相信答案就在那里。
-
我不明白你的问题。这些图片在数据库中吗?您只是想从 HTML 中删除标签还是也想删除图片?你需要对数据库做什么?
标签: mysql sql regex html-parsing