使用Powershell和正则表达式操作String

时间:2020-09-02 11:43:34

标签: regex powershell replace

我有一个html文件,其中包含以下内容:

                <li>
                    <a href="../index.html" name="" title="title1">title1</a>
                </li>
                <li>
                    <a href="level1/level1.html" name="" title="title2">title2</a>
                </li>
                <li>
                    <a href="levl1/level2/level2.html" name="" title="title3">title3</a>
                </li>

我希望他们看起来像这样:

                <li>
                    <a href="../" name="" title="title1">title1</a>
                </li>
                <li>
                    <a href="level1/" name="" title="title2">title2</a>
                </li>
                <li>
                    <a href="level1/level2/" name="" title="title3">title3</a>
                </li>

我在Powershell中编写了一个脚本来操纵这些如下所示的href链接:

(Get-Content $i) -replace '/*.html', '/' | Set-Content $i

但是不知何故输出不会达到预期。知道我在做什么错吗?

2 个答案:

答案 0 :(得分:2)

我会用这样的东西:

(Get-Content in.html) -replace '\/[a-zA-Z0-9_-]+\.html', '/' | Set-Content out.html

答案 1 :(得分:1)

我希望从标记的开头开始寻找更广泛的上下文,因为正则表达式可能会发现其他一些意外的模式

( Get-Content $i ) -ireplace '(<a\s+href="[^"]*/).*?(?=")','$1' | Set-Content $i

希望在第8行中有一个错字,否则您也可以在整个文件中从“ levl1 /”中创建“ level1 /”

( Get-Content $i ) -ireplace '(<a\s+href="[^"]*/).*?(?=")','$1' -ireplace 'levl1/','level1/' | Set-Content $i
相关问题