HTMLPurifier:如何逃避破碎的标签而不是删除?

时间:2012-02-06 20:40:26

标签: htmlpurifier

我正在使用HTMLPurifier来清理帖子输入,但我希望它能够转义(html编码)所有损坏的标签或可疑符号,而不是完全删除它们。我搜索了它的文档和这个网站,但没有任何运气。仍然希望我错过了一些东西。

打开标签是最烦人的。如果有人试图发布公式或比较,写入“param1< param2”并且不在其间放置空格,则净化器将其作为错误的标记打开并完全丢弃右侧的所有内容。

我在[code]标签中使用htmlspecialchars,但我想在外面允许一些html并且不能编码所有内容..这就是为什么我用HTMLPurifier过滤它。 您的建议将不胜感激。

1 个答案:

答案 0 :(得分:0)

尝试使用%Core.AggressivelyFixLt或将%Core.LexerImpl设置为DirectLex。我不知道这是否有效,可能不会。

部分解决方案是设置%Core.EscapeInvalidTags;但这是一个非常不完美的修复,它可能会破坏一些文本。