使用RegEx匹配HTML标记之间的换行符

时间:2017-09-02 04:29:15

标签: html regex newline

我在<p><span>中的连续段落与我想删除的其他HTML标记之间有随机换行符。同样在<p>标签的某些内容中,我有一个span标签,我也想在单行上。基本上我想让<p>及其对应的</p>在同一行。我在下面列举了一个例子。

示例输入:

<span>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed tempus semper nisl, id pellentesque massa ultricies quis.
Phasellus felis felis, commodo a eleifend quis, volutpat quis orci.
Phasellus tortor odio, pretium in feugiat id, viverra at arcu.
Class aptent taciti sociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Integer id feugiat sapien.</span>

我正在努力实现:

<span>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed tempus semper nisl, id pellentesque massa ultricies quis. Phasellus felis felis, commodo a eleifend quis, volutpat quis orci. Phasellus tortor odio, pretium in feugiat id, viverra at arcu. Class aptent taciti sociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Integer id feugiat sapien.</span>

更新

工具 - 没有特定的(Notepad ++ RegEx,perl,sed(首选))

语言 - HTML

解析器 - 没有,只​​是从一个添加换行而不是自动换行的人那里采用了一个项目

1 个答案:

答案 0 :(得分:0)

需要解决工具/语言信息 通常,您使用的是编辑器或Perl兼容的正则表达式语法,它将是:

在Komodo编辑器中(查找和替换对话框)

Find:(\.)(\s+)(\w+)
Replace:\1 \3

在Perl中

$content="<span>.....  </span>"; # your content
$content=~s/(\.)(\s+)(\w+)/$1 $3/g;