使用标题提取Google搜索结果

时间:2012-04-04 10:11:22

标签: regex vb.net

我想问一下如何从谷歌搜索结果中提取文本和网址,就像谷歌一样。 我只有这个代码,但我不知道如何使vb.net正则表达式。 我只需要知道如何提取文本和网址的所有内容。 或者您可以建议其他正则表达式代码,但这样做与示例中的相同。

示例:

enter image description here

文字 - <h3 class="r"><a href="http://www..com/"><b>Welcome to dog training courses</b></a>

网址 - <a href="http://..com/">Any link</a>

示例:

文字 - Welcome to dog training courses
网址 - www.dogtraining.com

文字 - Welcome to Learning About Dogs
网址 - www.learningaboutdogs.com

ListBox1.Items.Clear()
        Dim wc As New WebClient
        Dim source As String = wc.DownloadString("http://www.google.com/search?&q=" + TextBox1.Text)
        Dim m1 As MatchCollection = Regex.Matches(source, "", RegexOptions.Singleline + RegexOptions.IgnoreCase)
        For Each m As Match In m1
            Dim value As String = m.Groups(0).Value


            If Not value.Contains("google") Then
                ListBox1.Items.Add(value)
            End If
        Next

0 个答案:

没有答案
相关问题