令牌字符串

时间:2009-07-11 02:52:02

标签: vba ms-word tokenize

我有大约100行我要标记的文本,类似于以下内容:

<word> <unknown number of spaces and tabs> <number>

我无法使用VBA查找tokenize函数。在VBA中对这些字符串进行标记化的最简单方法是什么?

3 个答案:

答案 0 :(得分:3)

您可以逐行阅读并使用拆分功能按空格分割单词和数字。我隐约记得VBA有分裂功能。

我通过在谷歌搜索获得以下链接。不确定您使用的是哪个版本的办公室。

http://msdn.microsoft.com/en-us/library/aa155763(office.10).aspx

此链接具有拆分功能。

答案 1 :(得分:2)

您可以使用Split()方法或更复杂的匹配,您可以使用"vbscript.regexp"对象:

Sub NewRegex()
    Dim reg
    Dim matches, match, tmpStr As String

    Set reg = CreateObject("vbscript.regexp")
    tmpStr = "blah bla ...."

    With reg
        .IgnoreCase = True
        .MultiLine = False
        .Pattern = "your regex pattern goes here"
        .Global = True
    End With

    Set matches = reg.Execute(tmpStr)

    For Each match In matches
        MsgBox match
    Next mt

End Sub

以下是使用VBA正则表达式的教程:Using Regular Expressions (RegExp) in Excel

答案 2 :(得分:0)