我该如何删除  ;从我的文本文件使用VBScript Replace()或正则表达式?

时间:2010-05-26 14:24:49

标签: vbscript replace

我正在两个使用XML的软件之间进行转换,因此实际的转换部分相当简单 - 在这里添加文本,在这里删除其他软件,转换一些信息。我正在使用VBSCript WSH。

我仍然唯一的问题是darn 
字符 - 因为它被认为是HTML字符,它不能被检测为字符串,即使它是一个字符串......

我已经尝试过两个strText = Replace(strText, "
", "")并使用带有Regex.pattern = "
"的正则表达式...都不起作用。我也试过替换char(13)VBCR ......似乎没有任何东西可以检测到实际的字符串本身而不是它正在创建的字符。

来自传入文件的

代码段:

<p>If necessary, [clip].</p>&#13;
<ul><li>&#13;
<p>In the <strong>Document </strong>properties dialog box, [clip].</p>&#13;
</li>&#13;
</ul></li>&#13;
<li>&#13;
<p>Click <strong>OK</strong>.</p>&#13;
</li>&#13;
</ol><p><span>To add or edit an advanced paper handling operation: </span></p>&#13;
<ol><li>&#13;
<p>To add an operation, [clip] </p></li></ol>&#13;

2 个答案:

答案 0 :(得分:0)

我很惊讶strText = Replace(strText, "&#13;", "")不起作用,正则表达式也应该没问题。

您可以尝试设置这些选项吗

Regex.IgnoreCase = True 
Regex.Global = True

我使用了这个测试页面,只是将模式设置为"&#13;"正常工作:

http://www.regular-expressions.info/vbscriptexample.html

顺便提一下,这只适用于IE浏览器。

答案 1 :(得分:0)

所有这一切的解决方法是使用:regexp.pattern = "&#1.;",当然也会检测该格式的其他HTML代码实例 - 但在我的情况下,这样可以正常工作。